首页/文章/ 详情

利用社交媒体实时收集山体滑坡数据(Landslide Detection )

1年前浏览864

1 引言

手工收集山体滑坡的数据非常耗时,因此,近年来人们一直在尝试将这一过程自动化。在刚刚发表在《国际减灾杂志(International Journal of Disaster Risk Reduction)》上, 来自英国地质调查局BGS的Catherine Pennington和一个国际团队利用人工智能AI将这项工作向前推进了一大步,参看:

[1] Pennington, C.V.L. et al. (2022) A near-real-time global landslide incident reporting tool demonstrator using social media and artificial intelligence.  International Journal of Disaster Risk Reduction.

[2] Ferda Ofli et al. (2022) A Real-time System for Detecting Landslide Reports on Social Media using Artificial Intelligence, International Conference on Web Engineering.

[3] Ferda Ofli et al. (2021) Landslide Detection in Real-Time Social Media Image Streams, arXiv preprint.

2 工作原理
研究者们通过一种机器学习算法持续扫描社交媒体Twitter上使用32种语言的关键词关于描述山体滑坡的帖子,实时收集世界各地发生的山体滑坡信息,然后从这些帖子中收集帖子内的图片,通过算法分析图像,以确定该帖子是否涉及真正的山体滑坡。例如,它使用的中文搜索词汇有“滑坡, 山体滑坡, 岩崩, 岩滑, 泥石流, 山体塌方,地崩, 雪崩”,如果帖子中有这些关键词汇,就会执行下一步,使用图像处理机器学习模型分析该帖内的图像,识别那些显示山体滑坡、泥石流、岩石滑坡等。如果检测出有重复的图像,只显示事件第一次发生的图像。地理位置则是根据推文内提到的地点名称进行标注。

根据关键词搜寻相关帖子的算法很容易实现,比较困难的是图像识别。为此首先建立一个大的图像数据集。他们从Google, Twitter和BGS的数据库中人工标记哪些图片是滑坡的,哪些是不滑坡的,然后使用卷积神经网络训练这个数据集。

当在Twitter的数据流内发现一个相关图片后,进行识别该图片是否是滑坡的还是不滑坡的。作者们称目前该系统的检测精度可以达到76%。


3 实例验证

取时间区间为2022年9月1日到2022年9月25日,地点为中国,结果发现这25天内在Twitter上发的帖子,共发生了8次滑坡事件,分布地点如下图所示,包括青海2次,四川2次,福建1次,甘肃1次,广东1次,广西1次。 

(1) 2022年9月1日,青海省海东市互助土族自治县红崖村发生山体滑坡, 7人死亡;

(2) 2022年9月5日四川泸定地震后的滑坡;

(3) 2022年9月7日青海发生的另一次滑坡,死亡1人;


4 结束语
利用社交媒体(Twitter)实时收集山体滑坡数据的研究工作确实做得不错,不过,就像作者们指出的,目前的正确识别率大约为76%,有时会出现误判,例如把下面的草地照片误判为滑坡。另一方面,社交媒体不是学术杂志,没有严格的科学审查机制,容易出现假的照片。


来源:计算岩土力学
System人工智能
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2022-12-03
最近编辑:1年前
计算岩土力学
传播岩土工程教育理念、工程分析...
获赞 144粉丝 1044文章 1776课程 0
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈