麻省理工学院研究人员建立的人工智能框架可以通过学习以前的科学出版物中的模式,为未来技术提供“预警”。
麻省理工学院媒体实验室的研究机构James W. Weis和媒体艺术与科学教授,媒体实验室的Molecular Machines研究小组负责人约瑟夫雅各布森(Joseph Jacobson)也利用DELPHI突出显示了他们预测将要发表的50篇最新科学论文。到2023年产生巨大影响。这些论文涵盖的主题包括用于癌症治疗的DNA纳米机器人,高能量密度锂氧电池以及使用深度神经网络的化学合成等。
研究人员将DELPHI视为一种工具,可以帮助人类更好地利用科研经费,为政府,慈善事业和风险投资公司提供一种更有效地支持科学的途径。
从本质上讲,我们的算法通过从科学史中学习模式,然后在新出版物上进行模式匹配来发现具有重大影响的早期信号而起作用,通过追踪思想的早期传播,我们可以预测它们以有意义的方式传播到更广泛的学术界的可能性。
该论文已发表在《自然生物技术》上。
Weis和Jacobson开发的机器学习算法利用了自从1980年代以来科学出版物呈指数增长的大量数字信息。但是,DELPHI并不是使用诸如引用次数之类的一维方法来判断出版物的影响,而是接受了期刊文章元数据的完整时间序列网络的培训,以揭示其在整个科学生态系统中的高维分布。
结果是一个知识图,其中包含代表论文,作者,机构和其他类型数据的节点之间的连接。这些节点之间的复杂连接的强度和类型决定了它们的属性,这些属性在框架中使用。“这些节点和边定义了一个基于时间的图,DELPHI可以使用它来学习预测未来可能会产生巨大影响的模式。
这些网络功能一起可用于预测科学影响,在发表论文被认为是DELPHI旨在确定的“高度影响力”目标集五年后,落入时间标度节点中心位置最高5%的论文。前5%的论文占图表总影响力的35%。这组作者说,DELPHI还可以使用时间缩放的节点中心的前1%,10%和15%的截止值。
影响力很大的论文几乎在其学科和较小的科学界以外传播。两篇论文可以被引用的次数相同,但影响力很大的论文可以吸引到越来越多的读者。另一方面,低影响力论文“并没有被越来越多的人真正利用。
他补充说,该框架在“激励人们甚至彼此不认识的团队合作方面可能很有用,也许是通过向他们提供资金来共同解决重要的多学科问题”。
与仅引文数量相比,DELPHI识别出具有高度影响力的论文的数量是两倍以上,包括60%的“隐藏的宝石”或引文阈值可能遗漏的论文。
进行基础研究的目的是要有很多目标,然后能够迅速将其中的最好观点加倍。这项研究的目的是了解我们是否可以通过更大规模的方式来完成这一过程。使用整个学术团体,包括嵌入学术图表中,并在确定具有重大影响力的研究方向时更具包容性。
对于在某些情况下使用DELPHI能够显示出具有高度影响力的论文的“警报信号”的时间如此之早,研究人员感到惊讶。在发布的一年内,我们已经确定了隐藏的宝石,这些宝石将在以后产生重大影响。
但是他警告说,DELPHI并不能完全预测未来。我们正在使用机器学习来提取和量化隐藏在已经存在的数据的维度和动态中的信号。
希望是DELPHI将提供一种偏向更少的方式来评估论文的影响,因为如过去的研究表明的那样,可以操纵诸如引用和期刊影响因子数之类的其他指标。
我们希望我们可以利用它找到最值得的研究人员,无论他们隶属于哪个机构或它们之间有多紧密联系。
与所有机器学习框架一样,设计人员和用户应警惕偏见。我们需要不断意识到数据和模型中的潜在偏差。DELPHI能够以较少偏见的方式帮助您找到最佳的研究,因此我们需要注意。
DELPHI可能是一个强大的工具,可以帮助科学资助变得更加高效和有效,并且也许可以用来创建与科学投资有关的新型金融产品。
新兴的科学资金超科学表明,需要对科学投资采取投资组合的方法。韦斯在为生物技术初创公司启动风险投资基金和实验室孵化设施方面的经验很丰富,这是他思考过的很多事情。