科技

Google用老新闻和AI预测山洪:这个方法有点意思

山洪是世界上最致命的天气灾害之一,每年造成超过5000人死亡。它们也是最难预测的。但Google想出了一个出人意料的办法——读新闻。

人类已经收集了大量天气数据,但山洪持续时间短、范围小,没法像温度或河流流量那样被全面监测。这个数据缺口意味着深度学习模型——虽然越来越擅长预测天气——却无法预测山洪。

为了解决这个问题,Google研究人员用Gemini——Google的大语言模型——梳理了全球500万篇新闻文章,提取出260万次不同洪灾的报道,把这些报道变成了一个带地理标签的时间序列数据集,取名"Groundsource"。这是Google第一次用语言模型做这种事,据Google Research产品经理Gila Loike说。这项研究和数据集已于周四上午公开发布。

有了Groundsource作为真实世界的基准,研究人员训练了一个基于长短期记忆(LSTM)神经网络的模型,让它摄取全球天气预报,然后生成特定区域发生山洪的概率。

Google的山洪预测模型现在正在该公司的Flood Hub平台上为150个国家的城市地区标注风险,并与全球应急响应机构分享数据。南部非洲发展共同体的应急响应官员António José Beleza曾与Google试用该预测模型,他说这帮助他的组织更快地应对洪灾。

不过这个模型还有局限。首先,它的分辨率相当低,只能识别20平方公里范围内的风险。而且它不如美国气象局的洪水预警系统精确,部分原因是Google的模型没有整合本地雷达数据——而雷达数据能实现降水的实时追踪。

但关键在于,这个项目的设计初衷就是为那些当地政府买不起昂贵气象监测设备、也没有大量气象数据记录的地方服务的。

"因为我们聚合了数百万份报告,Groundsource数据集实际上有助于重新平衡地图,"Google韧性团队的项目经理Juliet Rothenberg本周告诉记者,"这让我们能够推断到信息较少的其他地区。"

Rothenberg说,团队希望用LLM从文字性、定性来源开发定量数据集的方法,也能应用于建立其他短暂但重要的预测现象的数据集,比如热浪和泥石流。

Upstream Tech的CEO Marshall Moutenot说,Google的贡献是组装深度学习天气预报模型数据这一日益增长的尝试的一部分。Upstream Tech用类似的深度学习模型为水电站等客户预测河流流量。Moutenot还联合创办了dynamical.org,一个为研究人员和创业公司整理机器学习就绪天气数据的组织。

"数据稀缺是地球物理学中最困难的挑战之一,"Moutenot说,"同时,地球数据又太多,而当你想对照事实评估时,数据又不够。这是一个非常有创意的获取数据的方法。"

来源
techcrunch.com

评论 (0)

暂无评论,来发表第一条评论吧