Nature Machine Learning的最新机器学习研究

8月前浏览10489

文一：

用AI提高维基百科的可验证性

摘要：

可验证性是维基百科的核心内容策略: 声明需要引用支持。维护和提高维基百科参考资料的质量是一个重要的挑战，迫切需要更好的工具来帮助人们在这方面的努力。我们展示了改善参考文献的过程可以借助于人工智能(AI) ，这种人工智能由一个信息检索系统和一个语言模型驱动。这个基于神经网络的系统，我们称之为 SIDE，可以识别不太可能支持他们主张的维基百科引文，并随后从网上推荐更好的引文。我们在现有的维基百科参考资料上培训这个模型，因此从数千名维基百科编辑的贡献和智慧中学习。使用众包，我们观察到，对于最有可能被我们的系统标记为无法验证的前10% 的引用，人们更喜欢我们的系统建议的替代方案，相比之下，最初引用的参考70% 的时间。为了验证我们的系统的适用性，我们建立了一个演示，与英语维基百科社区合作，发现 SIDE 的首次引用推荐比现有的维基百科引用推荐频率高出一倍，因为根据 SIDE 的数据，同样是前10% 最有可能无法验证的主张。我们的研究结果表明，基于人工智能的系统可以与人类一起使用，以提高维基百科的可验证性。

图：SIDE概述。SIDE从维基百科上的声明到新引文的建议的决策流程如下：（1）声明被发送到Sphere检索引擎，该引擎从Sphere语料库中生成潜在候选文档列表；（2）所述验证引擎针对所述权利要求对所述候选文档和所述原始引文进行排序；（3）如果原始引文的排名没有高于候选文献，则建议从检索到的候选文献中选择新的引文。请注意，验证引擎的分数可以指示潜在的失败验证，如示例中报告的验证。

图：WAFER测试集上SIDE组件的自动评估。a、我们的检索器能够在前200个结果中找到黄金来源的次数比例，用于维基百科专题文章和其他文章的引用。验证引擎条（绿色）结合了稀疏和密集检索器，每个检索器有100个通道。b、将黄金来源放在第一位的准确性，用于维基百科专题文章和其他文章的引用。验证引擎（绿色）将稀疏检索器中的100个通道和密集检索器中100个通道的组合作为输入，并对这些通道进行重新排序。c、在检测被标记为与特色文章中引用的验证失败的引用时，准确性与召回率。我们比较了验证引擎的段落与文档级方法，以及简单使用引用URL深度的基线。

图：人群注释者的偏好判断。WAFER测试集中2016年声明的群注释者评估，SIDE为其产生了比现有维基百科引文证据得分更高的引文。我们收集了每个声明的五个注释，并报告了多数投票结果，根据与现有维基百科引文相关的验证引擎分数（顶部报告的桶大小）进行分组。a、人群注释者在不知道自己身份的情况下，更喜欢SIDE建议的引用，而不是维基百科上的引用。Fleissκ注释器间协议 = 0.2。b、维基百科引用的证据注释：（1）足以证实这一说法；（2）该主张仅得到部分证实；（3）没有证据。Fleissκ注释器间协议 = 0.11。

文二：

解决探索与开发问题的生物体模式转换

摘要：

在产生用于收集信息的昂贵动作（“探索”）和使用先前获得的信息来实现目标（“探索者”）之间的权衡出现在各种各样的问题中，包括觅食、强化学习和感觉运动控制。确定勘探和开发之间的最佳平衡在计算上是棘手的，需要启发式解决方案。在这里，我们展示了电动fsh Eigenmania virescens在避难跟踪任务中使用显著性相关的模式切换策略来解决探索-利用冲突，在该任务中，相同类别的运动（前后游泳）用于收集信息和实现任务目标。fsh产生了独特的运动速度非高斯分布，其特征是较慢的、以任务为导向的“开发”运动具有尖锐的峰值，较快的“探索”运动具有宽阔的肩部。非正常状态的测量值随着感觉显著性的增加而增加，对应于快速探索运动的流行率的降低。我们发现，从变形虫到人类，在执行姿势平衡和目标跟踪等任务的十种系统发育不同的生物体中，存在相同的感觉显著性依赖模式转换行为。我们提出了一种基于状态不确定性的模式切换启发式方法，该方法再现了独特的速度分布，合理化了感官显著性的调制，并在使用较少能量的同时优于经典的持续激励方法。这种模式转换启发式方法为生物体中有目的的探索行为提供了见解，并为更有效的机器人状态估计和控制提供了框架。

图：速度分布。

图：在熄灯试验中，快速运动的爆发比亮灯试验中更常见

图：生物多样性和用于分析模式转换策略的传感模式。

图：将速度数据聚类为不同的行为模式

文三：

摘要：

大规模的数据可用性和计算能力，使深度学习的关键应用领域取得了重要突破，如自然语言处理和计算机视觉。有新的证据表明，规模可能是科学深度学习的关键因素，但物理先验在科学领域的重要性使规模的策略和好处变得不确定。在这里，我们通过在多个数量级上改变模型和数据集的大小，研究在多达1000万个数据点的数据集上预先训练的具有超过10亿个参数的模型，来研究大型化学模型中的神经缩放行为。我们考虑生成化学的大型语言模型和机器学习原子间势的图神经网络。我们研究了物理先验和尺度之间的相互作用，并发现了化学中语言模型的经验神经尺度关系，对于所考虑的最大数据集大小，尺度指数为0.17，对于等变图神经网络原子间势的尺度指数为0.26。

图：深层化学模型的神经尺度关系的发现

图：在用 TPE 进行训练时，尽早确定最优模型，停止非最优模型的训练，以节省80% 以上的计算机总消耗。

文四：

基于两阶段图的深度学习模型缓解从头肽测序中的缺失片段问题

摘要：

新的蛋白质发现和免疫肽组学依赖于具有串联质谱法的高灵敏度从头测序。尽管使用深度学习模型取得了显著的进步，但缺失片段问题仍然是严重降低从头肽测序性能的一个重要障碍。在这里，我们揭示了在肽预测的过程中，缺少片段导致在这些区域产生不正确的氨基酸，并导致错误积累。为了解决这个问题，我们提出了基于图神经网络的两阶段从头测序算法 GraphNovo。GraphNovo 致力于在第一阶段寻找最优路径，以指导第二阶段的序列预测。我们的实验表明，GraphNovo 减轻了缺失片段的影响，并优于最先进的从头肽测序算法。

图：GraphNovo概述。

图：GraphNovo的模型细节

图：影响模型性能的缺失碎片程度。

文五：

利用深度神经网络对多个切片进行联合建模构建三维全生物空间图谱

摘要：

空间转录组学（ST）技术正在彻底改变探索组织空间结构的方式。目前，ST段数据分析通常局限于单个二维（2D）组织切片，这限制了我们理解3D空间中发生的生物过程的能力。在这里，我们介绍了STitch3D，这是一个统一的框架，集成了多个ST切片来重建3D细胞结构。通过联合建模多个切片并将其与单细胞RNA测序数据整合，STitch3D同时识别具有连贯基因表达水平的3D空间区域，并揭示3D细胞类型分布。STitch3D将切片之间的生物变异与批量效应区分开来，并有效地借用切片之间的信息来组装强大的3D模型。通过全面的实验，我们展示了STitch3D在构建全面的3D架构方面的性能，该架构允许对整个组织区域甚至整个生物体进行3D分析。STitch3D的输出可用于多个下游任务，从而能够全面了解生物系统。