首页/文章/ 详情

AI也要尊重科学

1年前浏览274

20多年前,有人用神经元方法评价某产品的质量。他在文章中讲:这个产品的特征有100多个,但只能拿到20多个。所以,过去的算法总是做不好。他用神经元方法,让信息增加了。所以评价的精度大大提高。这个说法,自然遭到了很多人的批判。

 

我们知道:算法可以从数据中提炼信息却不能产生信息。这就好比我们能从金矿中提炼黄金,却不能从让没有黄金的矿石产生黄金。

 

然而,就在刚才,阿里发布了一条消息:“(新冠状肺炎)20秒确诊、96%的准确率,达摩院AI医生火速支撑100多家医院”。打开内容一看,发现是用AI技术处理CT图像,准确率96%

 

我请教了专家。按照现在的标准,确诊不能单靠CT,最终还是要检验病毒。AI依据的仍然是CT图像,怎么就能确诊了呢?

 

卫健委刚刚报告中说,现有疑似6365例。如果这条消息属实,岂不是马上就可以确诊了?即便是在医疗条件非常好的上海,目前还有大约100例多日未确诊的疑似病例,是不是用一下这个技术就行了?

 

按照我的经验,这条消息未必是在撒谎,但在计算方法上可能有技巧。


比如,测试的案例是怎么选择的? 这些CT图片来自确诊之前还是确诊之后?确诊和不确诊的测试比例有多高?........如果在采用极端的办法选数据,准确率其实可以任意高。比如:病人都选择严重的案例,其他案例都选择正常人....但是,这样的“好结果”有意义吗?我相信阿里不会这么极端,但案例的选取也未必合理。如果不合理,判断结果就很可能是“事后诸葛亮”。

 

在统计方法上用过多的技巧。应用这些技巧时,结果可能是真实的,却会误导大家。这就是我反复强调的、迪斯累利的名言:“世界上有三种谎言:谎言、弥天大谎和统计数字”。


前天我写了一篇文章,批评湖北“新增确诊”的统计方法不好:用实际产生的新病例减去当天核减的。以至于多地新增病例为负数,武汉的新增病例数少于湖北。


我认为,这样的数字游戏,会误导对疫情的判断。结果,昨天国家和湖北的负责同志,就严厉批评了这种做法,昨天重新核算了过去的统计数据。这件事,让我感到振奋。

 

为了战胜疫情,信息的准确性特别重要。我们宁可要严峻的真消息,也不要片面、夸大的好消息。疫情发展到今天,很大程度上就是被不准确的好新消息误导的。教训还不严峻吗?

 

有人可能会说:大疫当前,应该鼓励大家的积极性啊?我一直觉得,高技术是需要长期积累的,科技界应该鼓励的是“十年磨一剑”的精神。我们这个国家,从来不缺吸引眼球的“创新”,缺少的是真正解决问题的创新,缺少的是愿意坐冷板凳的人。中国科技要强大,首先要改的就是浮夸的风气。

 

来源:蝈蝈创新随笔
游戏
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2023-07-22
最近编辑:1年前
蝈蝈创新随笔
只是把思考的日志搬运,不当之处...
获赞 92粉丝 12文章 1159课程 0
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈