
9月26日(编辑Ziqiao)在9月25日当地时间,Google DeepMind的AI模型系列专门为机器人设计。研发团队推出了Gemini Robotics 1.5和Gemini Robotics-ER 1.5,共同开发了“机器人的实施和系统”。 “我们正在推动物理代理的到来 - 启动机器人来查看,计划,思考,使用工具,并采取行动更好地解决复杂的多步骤活动。新模型是一个里程碑,它已经实现并标志着解决实体世界中普遍人工智能(AGI)问题的重要一步。” DeepMind说,新模型支持的机器人可以以标准方式积极地理解其周围环境并完成复杂的多步骤任务。根据Thosereport的说法,Gemini Robotics 1.5是Google语言语言(VLA)的最强模型,它可以将视觉信息和说明转换为机器人的运动说明任务。该模型在采取行动并展示其思维过程之前进行思考,这有助于机器人更清楚地评估和完成复杂的任务。此外,该模型可以将所学的动作从一个机器人转移到另一个机器人,也就是说,帮助机器人互相“学习”,因此无需为每种类型的机器人定制模型,从而可以提高机器人的一般和学习能力; Gemini Robotics-ER 1.5是Google视觉语言(VLM)的最强模型,它在计划和在物理环境中做出逻辑决策方面非常出色,它具有SA空间理解,它可以联系自然语言,估算机器人的成功率和开发,并且可以合理地呼叫Google搜索和其他工具来创建详细的多型Step计划来完成任务。在特定操作方面,机器人首先使用升级的双子座机器人1.5模型来了解其环境并使用Google Searches找到像人类一样的信息。然后,Gemini Robotics-ER 1.5将将搜索结果转换为自然语言指令,并将其提供给双子座机器人1.5模型,该模型使机器人可以使用语言和语言理解能力来完成操作的每个步骤。该图显示了Google的Google的Gemini Robotics-ER 1.5推理模型和视觉语言 - 动作Gemini Robotics 1.5在物理世界中进行复杂活动正在积极专注于创建“机器人世界的Android System”。与早年的自我开发机器人机构不同,Google现在希望提供强大的AI模型,以允许不同的机器人制造商购买,类似于手机行业的Android系统模型。根据The Verge的说法,Epmind机器人部负责人Google Desi Carolina Parada表示,AI模型的重点是使机器人能够提前“考虑许多步骤”ld。专门针对AI模型的战略起点类似于Huang Renxun提出的AI的物理概念。可以理解机器人的物理AI实施,因为机器人看到和理解现实世界,与人互动并在此基础上进行操作进行复杂的gawain。作为机器人的“大脑”,AI模型在此过程中很重要。 8月25日,NVIDIA推出了新一代的计算平台Jetson Thor,他是为实体AIS和机器人开发人员设计的。 NVIDIA表示,这台新的机器人计算机将是该行业科学研究和领域的机器人系统的“大脑”。 “科学与创新委员会每日”报道说,当前一流的机器人创业公司是独立开发了端到端机器人AI模型螺旋的数字,该机器人可以直接转换动作中视觉语言模型中获得的丰富语义知识; DYNA机器人技术最近接受了Nvidia和其他人的投资。 Comp目前,任何人都在开发AI模型,以帮助机器人在实际情况下了解和提高其能力。首席执行官Lindon Gao表示,Dyna不会为机器人编写任务说明,但是他们正在通过从环境中获得的数据逐渐学习。 “我们的真正目标是解锁物理AGI”……巨型技术和名人初创企业的动作表明机器人行业的不可避免的流程 - 使用自我开发的AI模型的模型以打开AGI路径。 CICC最近发布了一份研究报告,该报告说,将来很少有堆栈堆栈的机器人公司预计将进一步破坏“体现的情报”水平。该机构认为,机器人的模型是破解传统机器人控制的瓶颈并朝着通用智力体现的智慧的主要途径。当前的行业主要基于大型语言模型的发展方向,自主驾驶模式LS和多模型模型的探索。该行业的重点已转向“小脑 +大脑”系统的研发,而不同的公司在研发路径和商业化方面有所作为。资源集成和长期方法的好处只有少数具有全堆叠技术能力的企业最终将通过转换未来的技术路径来识别“体现智能”的基本标准,而更多地在“体现智能”的水平上打破了更多。 Huatai证券还表示,体现的情报繁荣已经开始,从大型模型中的技术成功开始。大型模型确定了在总体机器人机器人的一般构化中的上限,这是该阶段商业化的主要障碍之一。目前,许多大型技术制造商进入了轨道,例如Google,OpenAL,Meta,Nvidia等,都将其大脑放置。尽管大型国内制造商迟到了,但他们VE开发的产品,例如华为,Baidu,Iflytek等。这将在淘汰赛阶段加快行业,而不是在生活空间中涂有一些AI功能的主要工厂。
特别声明:上面的内容(包括照片或视频(如果有))已由“ NetEase”自助媒体平台的用户上传和发布。该平台仅提供信息存储服务。
注意:上面的内容(包括照片和视频(如果有))已由NetEase Hao用户上传和发布,该用户是社交媒体平台,仅提供信息服务。