先给大家讲个故事:
施工队打桩遇到了麻烦。找到了陈专家:“打不动了,怎么办?” 陈专家回答:“打不动就不要打了!” 施工队长疑惑地问:“这怎么行啊?” 陈专家回答:“打桩的目的是获取足够的支撑力。打不动说明支撑力足够大了,不需要再往深里打了”。这个决策,让整个工程节省了数千万元。
研究一个创新案例时,我们常常发现:其思维方式是回到问题的本源。看看这个问题是怎么来的,能不能改变这个问题、回避这个问题、或进行适当的预处理。回归原点,常常让人的视野一下子扩张开来,进入创新的蓝海。
数据分析问题也是这样。
常听人说:传统的数据建模方法不能用了,所以要用神经元方法、要用机器学习方法.....但是,很少有人会问:传统方法为什么不能用了?能不能做些改变,让它变得可用。
事实上,传统数据建模方法,往往基于一些基本假设:大数定理成立、模型结构已知、自变量误差可以忽略、因果关系明确.....在现实中,最合适的方法可能是:通过对数据的组织和处理,找到大叔定理成立的条件、探求模型结构和因果关系、补偿自变量误差......
这样,传统的统计方法就可以回复生机,问题就回归到原点了。有人说:数据的预处理往往比数据分析过程更加重要;在我看来,数据的预处理才是最重要的数据分析。
数学系毕业后,我形成一种习惯:喜欢追求事物的真相。我认为:盲目地将构建学习算法,把结果的可靠性 交给上帝,常常是不负责任的做法。