首页/文章/ 详情

AI也要尊重科学

蝈蝈创新随笔

1年前浏览283

20多年前，有人用神经元方法评价某产品的质量。他在文章中讲：这个产品的特征有100多个，但只能拿到20多个。所以，过去的算法总是做不好。他用神经元方法，让信息增加了。所以评价的精度大大提高。这个说法，自然遭到了很多人的批判。

我们知道：算法可以从数据中提炼信息却不能产生信息。这就好比我们能从金矿中提炼黄金，却不能从让没有黄金的矿石产生黄金。

然而，就在刚才，阿里发布了一条消息：“（新冠状肺炎）20秒确诊、96%的准确率，达摩院AI医生火速支撑100多家医院”。打开内容一看，发现是用AI技术处理CT图像，准确率96%。

我请教了专家。按照现在的标准，确诊不能单靠CT，最终还是要检验病毒。AI依据的仍然是CT图像，怎么就能确诊了呢？

卫健委刚刚报告中说，现有疑似6365例。如果这条消息属实，岂不是马上就可以确诊了？即便是在医疗条件非常好的上海，目前还有大约100例多日未确诊的疑似病例，是不是用一下这个技术就行了？

按照我的经验，这条消息未必是在撒谎，但在计算方法上可能有技巧。

比如，测试的案例是怎么选择的？这些CT图片来自确诊之前还是确诊之后？确诊和不确诊的测试比例有多高？........如果在采用极端的办法选数据，准确率其实可以任意高。比如：病人都选择严重的案例，其他案例都选择正常人....但是，这样的“好结果”有意义吗？我相信阿里不会这么极端，但案例的选取也未必合理。如果不合理，判断结果就很可能是“事后诸葛亮”。

在统计方法上用过多的技巧。应用这些技巧时，结果可能是真实的，却会误导大家。这就是我反复强调的、迪斯累利的名言：“世界上有三种谎言：谎言、弥天大谎和统计数字”。

前天我写了一篇文章，批评湖北“新增确诊”的统计方法不好：用实际产生的新病例减去当天核减的。以至于多地新增病例为负数，武汉的新增病例数少于湖北。

我认为，这样的数字游戏，会误导对疫情的判断。结果，昨天国家和湖北的负责同志，就严厉批评了这种做法，昨天重新核算了过去的统计数据。这件事，让我感到振奋。

为了战胜疫情，信息的准确性特别重要。我们宁可要严峻的真消息，也不要片面、夸大的好消息。疫情发展到今天，很大程度上就是被不准确的好新消息误导的。教训还不严峻吗？

有人可能会说：大疫当前，应该鼓励大家的积极性啊？我一直觉得，高技术是需要长期积累的，科技界应该鼓励的是“十年磨一剑”的精神。我们这个国家，从来不缺吸引眼球的“创新”，缺少的是真正解决问题的创新，缺少的是愿意坐冷板凳的人。中国科技要强大，首先要改的就是浮夸的风气。

来源：蝈蝈创新随笔

游戏

著作权归作者所有，欢迎分享，未经许可，不得转载

首次发布时间：2023-07-22