最近几天,河南的水灾牵动了全国人民的心。据说,这种降雨量是千年一遇、五千年一遇。于是有人奇怪:百年一遇的灾难怎么年年有?对此,网上出现了一些解释。但在我看来,有些解释是不准确的。于是,我也想从数据分析师的角度来说几句。
首先,发生灾情的“百年一遇”、“千年一遇”,针对的是特定的地方;人们听到的“百年一遇”、“千年一遇”,则是全国甚至全球的范围内的。比如,这次的河南受灾面积约5、6万平方公里。即便全部都达到“千年一遇”水平,但考虑到我国的总面积是960万平方公里,这样的“千年一遇”也会隔几年发生一次。如果灾情发生在偏远的地方、如果影响面积还要小,人们可能就注意不到了。反之,如果发生在北京、上海,全世界都会知道了。
其次,“百年一遇”、“千年一遇”是统计概率算出来的。计算概率就要给出假设。比如,某个地方的降雨服从正态分布。假如某个地方平均年降雨600mm、标准差200mm。这种情况下,年降雨量1200mm大约就是500年一遇了。但概率假设是对的吗?参数是多长时间内求出来的?在这么长的周期内参数会变吗? 所以,我严重怀疑参数假设的合理性。特别是:地球变暖以后,这些参数都可能会发生变化。如果,现在的参数是:平均年降雨量达到800mm、标准差400mm。那么,年降雨1200mm就变成了5、6年一遇了。
很多人意识到了前面这个原因,却没有谈到后面这个原因。要研究透这个问题,涉及到很多问题,有价值也有难度。有时间、有兴趣、有条件的人,可以研究一下。
声明:来源于蝈蝈创新随笔,作者郭朝晖,原创文章,欢迎留言与我讨论,如需转载留言