机器学习模型关注新闻报道,预测食品危机爆发

可以用来更好地预测粮食危机爆发的新闻
插图的每个方框都包含一个句子示例,其中模型检测到相关关键字(用颜色突出显示)。预测粮食不安全事件的167个文本特征被分为图例中所示的12类风险因素,并映射到一个网络中。节点的大小与文本特征在新闻文章中的频率成正比,边的宽度编码节点之间的语义接近度。资料来源:Samuel Fraiberger和Alice Grishchenko

一组研究人员开发了一种机器学习模型,可以从新闻文章的内容中有效预测面临粮食不安全风险的地区。该模型可用于帮助在脆弱地区优先分配紧急粮食援助,标志着比现有测量方法有所改进。

“我们的方法可以利用实时信息流和易于解释的预测模型,大幅提高对粮食危机爆发的预测,最多可提前12个月,”纽约大学Courant数学科学研究所的访问研究员、世界银行的数据科学家、该研究报告的作者之一Samuel Fraiberger说科学的进步

“传统的粮食不安全风险因素衡量方法,如冲突严重程度指数或粮食价格变化,往往是不完整、滞后或过时的,”Courant研究所教授、该论文的作者之一Lakshminarayanan Subramanian补充说。“我们的方法利用了这样一个事实,即引发粮食危机的风险因素在新闻中被提及,而传统的衡量方法则无法观察到。”

粮食不安全威胁着全世界数亿人的生命。根据联合国粮食及农业组织的数据,营养不良人数从2014年的6.24亿人增加到2019年的6.88亿人。该论文的作者指出,自那时以来,由于COVID-19大流行,情况已经恶化,以及武装冲突——2021年,全球有7.02亿至8.28亿人面临饥饿。此外,2021年全球和每个区域的严重粮食不安全状况都有所增加。

尽管这一苦难具有严重和广泛的性质,但目前检测未来粮食危机的方法依赖于风险措施,这些措施不够充分,阻碍了应对这些危机的努力。

在努力开发一个更好的模型的过程中,这篇论文的作者,包括库朗大学的博士研究生Ananth Balashankar,考虑了这样一种可能性该网站提供当地事态发展的实时现场报道,可以作为即将到来的粮食危机的早期预警系统。

研究人员收集了1980年至2020年间发表的近40个粮食不安全国家的1100多万篇新闻文章。然后,他们开发了一种方法,从这些文章中提取与粮食不安全有关的特定短语,并以引人注目的细节捕捉新闻评估。具体来说,该工具考虑了近170个文本特征,以便正确衡量与粮食不安全有关的短语的语义,并在文章出现时进行标记。以下是南苏丹的一个例子,概述了地点和风险因素:“饥荒可能会重新出现在该国的一些地区,特别是皮博尔县东部,那里的洪水和虫害破坏了作物。”

然后他们考虑了一系列食品不安全的数据-例如冲突死亡人数,降雨量,植被和变化-确定这些因素在被研究国家和地区的新闻提及与它们的发生之间是否存在相关性。在这里,他们发现覆盖的性质与这些因素的实地发生之间存在高度相关性,这表明是研究条件的准确指标。

但是为了确定事实上,这些报道是预测未来粮食危机的一个很好的指标,研究小组需要知道这些报道的性质是否是未来危机的一个可行指标,以及这些报道是否比传统的测量方法更准确。研究人员使用一组较小的新闻故事,发现从2009年到2020年,在21个粮食不安全的国家,新闻报道在地方层面上产生了更准确的预测并且比不包括新闻文本的传统测量方法提前12个月进行测量。值得注意的是,他们还发现,用新闻报道补充传统的预测措施进一步提高了预测的准确性预测,表明了“混合”模型的价值。

研究人员还看到了他们工作的潜在更大用途。

Balashankar说:“新闻指标可以扩展到预测疾病暴发和气候变化的未来影响。”

更多信息:Ananth Balashankar等人,利用信息流预测粮食危机,科学的进步(2023)。DOI: 10.1126 / sciadv.abm3449www.science.org/doi/10.1126/sciadv.abm3449

期刊信息: 科学的进步

所提供的纽约大学
引用:机器学习模型以新闻文章为重点,预测粮食危机爆发(2023,3月3日),检索自2023年3月4日//www.puressens.com/news/2023-03-machine-focuses-news-articles-food.html
这份文件受版权保护。除为私人学习或研究目的而进行的公平交易外,未经书面许可,不得转载任何部分。内容仅供参考之用。

进一步探索

探索COVID-19大流行期间的粮食不安全问题

57股票

对编辑的反馈