科技

谷歌用旧新闻报道和AI预测山洪暴发

山洪暴发是全球最致命的天气灾害之一,每年造成超过5000人死亡。然而,这类灾害的预测一直是个难题。谷歌最近找到了一个出人意料的解决方案——读新闻。

人类已经收集了大量天气数据,但山洪暴发持续时间短、地域性强,难以像温度或河流水位那样进行全面监测。这种数据缺口意味着,深度学习模型虽然越来越擅长预测天气,却无法预测山洪暴发。

为了解决这个问题,谷歌研究人员使用Gemini大语言模型,筛选了来自全球的500万篇新闻文章,分离出260万份不同的洪水报告,并将这些报告转化为名为"Groundsource"的地理标记时间序列数据。这是谷歌首次将语言模型用于此类工作。该研究和数据集已于周四上午公开发布。

以Groundsource为真实基准,研究人员训练了一个基于长短期记忆(LSTM)神经网络的模型,该模型能够摄取全球天气预报并生成特定区域山洪暴发概率。

谷歌的山洪暴发预测模型目前正在该公司Flood Hub平台上为150个国家的城市地区标注风险,并与全球应急响应机构共享数据。南部非洲发展共同体应急响应官员Antonio José Beleza在试用该预测模型后表示,它帮助他的组织更快地应对洪水。

该模型仍存在局限性。首先,它的分辨率相对较低,只能识别20平方公里区域的风险。其次,它不如美国国家气象局的洪水预警系统精确,部分原因是谷歌的模型没有整合本地雷达数据,而雷达数据能够实现降水的实时跟踪。

不过,该项目的意义在于,它专为那些当地政府无力投资昂贵气象传感基础设施或缺乏大量气象数据记录的地区设计。

"因为我们聚合了数百万份报告,Groundsource数据集实际上有助于重新平衡地图,"谷歌韧性团队项目经理Juliet Rothenberg本周告诉记者,"它使我们能够推断到其他信息较少的地区。"

Rothenberg表示,团队希望使用大语言模型从书面定性来源开发定量数据集的方法,可以应用于构建其他短暂但重要的预测现象数据集,如热浪和泥石流。

Upstream Tech首席执行官Marshall Moutenot表示,谷歌的贡献是组装深度学习天气预报模型数据的一部分。Moutenot联合创立了dynamical.org,这是一个为研究人员和初创公司策划机器学习就绪天气数据的组织。

"数据稀缺是地球物理学中最困难的挑战之一,"Moutenot说,"同时,地球数据太多,而当你想要对照事实进行评估时,数据又不够。这是一个非常有创意的方法来获取数据。"

来源
techcrunch.com

评论 (0)

暂无评论,来发表第一条评论吧