20多年前,有人用神经元方法评价某产品的质量。他在文章中讲:这个产品的特征有100多个,但只能拿到20多个。所以,过去的算法总是做不好。他用神经元方法,让信息增加了。所以评价的精度大大提高。这个说法,自然遭到了很多人的批判。
我们知道:算法可以从数据中提炼信息却不能产生信息。这就好比我们能从金矿中提炼黄金,却不能从让没有黄金的矿石产生黄金。
然而,就在刚才,阿里发布了一条消息:“(新冠状肺炎)20秒确诊、96%的准确率,达摩院AI医生火速支撑100多家医院”。打开内容一看,发现是用AI技术处理CT图像,准确率96%。
我请教了专家。按照现在的标准,确诊不能单靠CT,最终还是要检验病毒。AI依据的仍然是CT图像,怎么就能确诊了呢?
卫健委刚刚报告中说,现有疑似6365例。如果这条消息属实,岂不是马上就可以确诊了?即便是在医疗条件非常好的上海,目前还有大约100例多日未确诊的疑似病例,是不是用一下这个技术就行了?
按照我的经验,这条消息未必是在撒谎,但在计算方法上可能有技巧。
比如,测试的案例是怎么选择的? 这些CT图片来自确诊之前还是确诊之后?确诊和不确诊的测试比例有多高?........如果在采用极端的办法选数据,准确率其实可以任意高。比如:病人都选择严重的案例,其他案例都选择正常人....但是,这样的“好结果”有意义吗?我相信阿里不会这么极端,但案例的选取也未必合理。如果不合理,判断结果就很可能是“事后诸葛亮”。
在统计方法上用过多的技巧。应用这些技巧时,结果可能是真实的,却会误导大家。这就是我反复强调的、迪斯累利的名言:“世界上有三种谎言:谎言、弥天大谎和统计数字”。
前天我写了一篇文章,批评湖北“新增确诊”的统计方法不好:用实际产生的新病例减去当天核减的。以至于多地新增病例为负数,武汉的新增病例数少于湖北。
我认为,这样的数字游戏,会误导对疫情的判断。结果,昨天国家和湖北的负责同志,就严厉批评了这种做法,昨天重新核算了过去的统计数据。这件事,让我感到振奋。
为了战胜疫情,信息的准确性特别重要。我们宁可要严峻的真消息,也不要片面、夸大的好消息。疫情发展到今天,很大程度上就是被不准确的好新消息误导的。教训还不严峻吗?
有人可能会说:大疫当前,应该鼓励大家的积极性啊?我一直觉得,高技术是需要长期积累的,科技界应该鼓励的是“十年磨一剑”的精神。我们这个国家,从来不缺吸引眼球的“创新”,缺少的是真正解决问题的创新,缺少的是愿意坐冷板凳的人。中国科技要强大,首先要改的就是浮夸的风气。