产品

大科学新闻:下一代合作AI代理?加州大学洛杉矶

资料来源:Stella Levi合作是人类社会的基础。了解合作如何发展和维持的不仅是解决冲突和治疗影响社会行为的疾病的距离,而且对于设计更好的人工智能系统(AI)也很重要。在在诸如自动驾驶和分布式机器人等方案中实施许多AI代理系统时,如何使AI能够学习良好工作是破坏技术瓶颈的关键。研究表明,人工药物和生物剂可以显示出类似的行为和神经表征方法。它打开了探索新方向的人造代理如何使触点过程中的合作行为以及与生物系统相似的神经网络驱动的动态驱动。今天,加州大学洛杉矶分校的助理教授Weizhe Hong Team在该领域取得了新的成功 - 通过比较老鼠的表现和人造A的表现合作活动的绅士表明,AI部门可以开发有关行为和神经表示的技术,类似于生物大脑大脑的观察结果。首先,这项研究直接比较了生物大脑和AI之间合作社的研究,它为社会行为最重要的方面之一提供了新的见解,并为人们提供了新的想法,使人们建立了更智能的伙伴关系AI。相关的研究论文已发表在“生物和艺术智能系统中合作行为的神经基础”的标题标题中,发表了非道义科学杂志。纸张链接:https://www.science.org/dii/10.1126/science.adw8151实验性化:小鼠如何学会合作?为了探索生物合作的潜在逻辑,研究团队设计了一个小鼠合作实验。实验是用8周龄的C57BL/6J小鼠进行的,成对配对并将其放置n一个实验隔室,中间有透明的穿孔分区板。分区板的设计至关重要,使两只大鼠可以通过视觉,气味和部分接触脚互相看见,并防止脚部直接中断。照片| M合作实验中的实验机舱的示意图。实验的主要任务是鼻触摸的鼻触摸:每只鼠标所在的机舱具有触摸触感和饮用水端口。当两只大鼠在指定的时间窗口中完全鼻触动动作时,他们可以同时获得饮用水的奖励;如果只有鼠标可以触摸鼻子,或者时间窗口超过了时间窗口,则聚会将不会获得奖励。为了逐渐增加合作的难度,研究团队逐渐将时间窗口从最初的3秒缩短到1.5秒,并最终将其设置为0.75秒,以测试坐标的准确性小鼠的离子。在进行正式实验之前,研究团队首先是“预训练”的个体大鼠,以便让他们知道将鼻运动与奖励施加水联系起来,同时又删除了鼻子触摸非常低的人,以确保实验数据的有效性。训练阶段分为三个阶段,对应于3秒,1.5秒和0.75秒的Windows时间。合作的三个阶段包括5次,10次和15天的培训课程,每个培训需要30分钟。经过系统的训练,有76%的小鼠的表现显着高于随机水平。研究团队通过分散数据来进一步判断随机水平:修复鼠标的鼻子滴答时间,随机破坏他人的鼻触摸,并计算此时合作的正确可能性。与之相比,发现,在真实实验中,小鼠之间正确的合作数量比随机数据降低了错误,表明他们通过积极的协调开始合作。在进行超级救助水平的大鼠中,有41%属于“高性能组”。随着培训的持续,误差合作的数量继续减少,鼻触摸间隔继续缩短。照片|对照实验的实验结果。为了进一步验证“主动协调”的需求,研究团队设计了三组控制实验:一个是用不透明的板替换透明的板块分区以阻止视觉信号;第二个会让老鼠“互相战斗”,并在获得单一的鼻子后获得奖励。第三个是“单方面合作”,这是一只鼠标,必须依靠相同的触摸来获得奖励,而其他人只能获得奖励。结果表明,在这三种情况下,大鼠的合作指数显着下降,尤其是在不透明板组中,习惯等待和接触的S几乎完全丢失了,这完全表明,小鼠的合作取决于明显和相互利用的同伴信息的动机。证据共同表明,这种合作行为并非来自基于时间的独立决策,简单的模仿行为,意外行动或依赖社会线索的决定。相反,可以通过正确和积极固定的行动来实现成功的合作。主要因素:大脑的哪个区域是前扣带回皮质小鼠的合作背后的?研究小组将目光投向前扣带回皮层(ACC)。 ACC位于大脑额叶的中间。先前的研究发现,它与情感处理,社会决策等功能有关,但其在合作行为中的具体作用并不是yet Clear。为了观察ACC的神经活动,研究小组采用了微观镜钙成像技术。他们首先在小鼠ACC区域注射荧光钙离子指示剂(GCAMP7F),通过实时记录钙信号的变化来监测单个神经元的活性。最终,已成功记录了17对小鼠的激活DATAAD 12,798 ACC神经元。图|在进行合作活动的小鼠过程中的神经ACC活动(a);对17只小鼠(B-D)的神经记录活性为12,798个神经元。分析发现,ACC神经元对合作事件具有高度特定的反应:某些神经元仅在正确工作时才激活,而另一侧仅对错误的合作做出反应,并且对正确事件的响应的神经元数量更大。事件反应的正确神经元的比例与大鼠的合作表现正相关:ACC小鼠中此类神经元的比例高性能组明显高于正常组。说明成功合作的ACC编码能力直接影响有效性的人合作。照片|在合作条件下对纠正或不正确测试做出反应的神经元仅在不透明的分离器条件下显示神经活动弱;相反,另一组常见的独立神经元对鼻部行为做出了反应。该研究还发现,ACC不仅认识到合作的结果,而且否认了重大合作的决定。通过通过支持向量机(SVM)来解码ACC的神经信号,研究小组能够准确地确定该决定的两个状态,证明ACC是合作决定的“大脑”。通过SLEAP姿势跟踪技术,研究团队带来了三种主要的鼠标合作技术:接近:老鼠正在积极进行分区板,在2秒钟内按下鼻子,移动频率对同伴侧的封装增加;等待:当老鼠第一次到达鼻子触摸端口时,它一直留在社会区域,直到同伴在行动之前接近它为止。相互作用:两只大鼠将通过分区板两侧的鼻子尖端进行交谈,相互作用角逐渐从最初的180度到120度,这不仅可以保持等效的平等性,而且可以迅速保持触摸触摸的作用,并且方法的准确性继续提高。相似性:AI复制小鼠合作的逻辑在揭示了大鼠的合作机制后,研究团队扩大了研究范围,超越了生物系统,并深入探索了AI系统中合作机制的开发和Stingingbo。根据多机构增强学习(MARL)的情节,研究团队使用重复的神经(RNN)网络开发了两个代理,并建立了一个虚拟环境,该环境模仿了MO使用实验,培训代理与这种环境合作。图|两个代理位于两侧,中间的障碍物,每一侧都装有“触点”和“饮料端口”。培训的结果超出了研究团队的期望:AI成功地掌握了合作策略及其行为模式,与小鼠完全同意。合作阶段合作的适当时间的数量将继续增加,鼻触摸差距集中在2个时间的时间内,并且错误的数量小于非策略阶段。研究团队甚至审查了AI的神经网络活动,发现还有一些专门编码自我位置和同伴位置的AI单元。在合作阶段,编码同行位置的单位活动得到了显着增强,其比例与AI合作的表现正相关;在非col的阶段劳动,活动显着削弱。接下来,观察研究小组是否会显示依恋技术,以促进诸如动物之类的合作。结果,他们根据伴侣的位置审查了每个代理商执行的操作。由于代理可以直接“查看”,因此最初希望他们不会像鼠标实验相同的接触态度或接触态度。但是,结果是出乎意料的,并且代理人表现出“等待”的行为:当同伴远离穿刺时,他们停止了或返回。如图所示,通过最大程度地减少彼此之间的距离差异和穿刺位置的差异来积极协调动作的相同尝试。这种主动合作调整行为发生在正确的戳戳之前,但不存在于不合作的状态或状态。此外,这种等待行为积极地联系了个人代理人的更好合作表现s。可以看出,这种行为可以有效地促进AI代理的合作行为。分析代理图的图。尽管生物小鼠和人造药物属于两个完全不同的系统类别,但它们在合作行为上表现出明显的相似之处。研究小组认为,这种一致性背后的主要原因是以下三点:首先依靠信息。无论是老鼠还是AI,对同伴身份的实时看法都是合作的要求。大鼠通过透明的分区获得视觉和嗅觉信号,AI通过传感器遵循同行位置。当这些信息被阻止时,合作将迅速崩溃。第二个是合作方法。成功的协作取决于学识渊博的和优化的准备技术。无论是小鼠的“策略等相互作用”还是AI的“固定诉讼合成”,本质是reduCE协调旁程行为的困难,这些技术将在实践中进行优化。最后,有一个独家单位。生物学和AI都改变了专门编码合作相关信息的“单位”:在鼠标ACC中,神经元专门回应了正确的合作和编码决定;在AI RNN中,有一些单位专门拥有同伴位置并调整合作行动。这些单位的活动与合作绩效,限制或放弃的活动直接相关,并且合作能力被禁用。上述研究的结果证明,合作不是生物学的独家实践,而是可计算和可复制的基本逻辑。在开发技术方面,也许将来我们会根据这种逻辑看到AI,以与不同的人与不同的人进行真正的合作。累积:如果小约必须打印或提交文章,请直接向官方Accoun留言t 特别声明:上面的内容(包括照片或视频(如果有))已由“ NetEase”自助媒体平台的用户上传和发布。该平台仅提供信息存储服务。 注意:上面的内容(包括照片和视频(如果有))已由NetEase Hao用户上传和发布,该用户是社交媒体平台,仅提供信息存储服务。