用户名:  密码:   
网站首页即时通讯活动公告最新消息科技前沿学人动向两岸三地人在海外历届活动关于我们联系我们申请加入
栏目导航 — 美国华裔教授专家网科技动向科技前沿
关键字  范围   
 
给机器人配AI大脑!谷歌发布视觉语言行动模型
2023/7/29 2:34:55 | 浏览:2844 | 评论:0

给机器人配AI大脑!谷歌发布视觉语言行动模型

谷歌正在把先进的人工智能(AI)模型植入机器人,给机器人配一个AI大脑。

美东时间7月28日周五,谷歌公司宣布推出应用于机器人领域的新产品——名为Robotics Transformer 2(RT-2)的AI模型。它是一种全新的“视觉-语言-行动”(VLA)模型,可以帮助训练机器人理解扔垃圾等任务。

谷歌介绍,RT-2基于Transformer模型,根据互联网上的文本和图像进行训练,直接指示机器人执行动作。就像用语言模型通过网络文本训练AI学习人类社会的思想和概念一样,RT-2也可以通过网络数据,将相关知识告知机器人,指导机器人的行为。

谷歌举例称,如果我们要让以前的机器人系统做出扔垃圾的动作,就必须明确训练机器人懂得区分何为垃圾,以及捡起垃圾、扔掉它这些动作。而RT-2能将网上的相关知识传给机器人,让机器人无需明确的训练,就懂得垃圾是什么,甚至即便从未受过如何扔垃圾的训练,也知道怎么扔垃圾。

谷歌表示,RT-2具有将信息转化动作的能力,借助它,机器人有望更快适应全新的情形和环境。

因为在6000多次测试RT-2 模型的机器人试验后,谷歌的团队发现,面对训练数据中已有的任务、或者说“见过”的任务,RT-2和它的前代RT-1一样发挥功能,没有差别。而在新颖的、之前从未见过的任务情形中,RT-2的性能几乎提高一倍,成功率达到62%,远超RT-1的32%。

换句话说,通过RT-2,机器人能像人类一样学习更多内容,将学到的概念应用于全新的情境中。

谷歌称,RT-2显示出超越其所接触机器人数据的推广应用能力和语义、视觉理解能力,包括解释新的命令,并通过基本的推理响应用户的指令,比如关于物体的类别和高层次描述的推理。

谷歌的研究还表明,通过结合思维链的推理,RT-2能执行多阶段的语义推理,比如判断哪种物体可以临时用作锤子,哪一类饮料最适合疲劳的人。

有媒体周五称,谷歌目前没有立即计划大规模发布或者出售应用RT-2的机器人,但最终,这些机器人可能用在仓库或者用作家庭助理。

相关栏目:『科技前沿
当 AI 转型失败时,代价将是巨大的— 而且不再只是“技术问题” 2026-01-22 [63]
深度解读 AGI-Next 2026:分化、新范式、Agent 与全球 AI 竞赛的 40 条重要判断 2026-01-22 [88]
全球约13亿人在用AI,普及率爆炸式增长!微软官方报告 2026-01-22 [60]
4130 万篇论文洞察:AI 让科学家发文量暴涨 3 倍,却让科学路越走越窄 2026-01-22 [66]
2026:马斯克 3 小时 “狂言” 震撼全球:AI 超人类、医疗颠覆、货币失效,未来 10 年将重塑一切 2026-01-22 [238]
AI1小时破译500年“天书”:文科研究迎变革,人机协作如何共舞? 2026-01-10 [303]
AI催生“超级个体” “一人公司”成创新最小单元 2026-01-10 [359]
2026年拉斯维加斯消费电子展(CES)的5大趋势预测 2026-01-10 [451]
特斯拉无人驾驶首度横跨全美!马斯克「三位一体」帝国浮现 2026-01-10 [340]
中国正在发起一场影响人类文明走向的革命 2026-01-10 [420]
相关栏目更多文章
最新图文:
:北京452万人将从北京迁至雄安(附部分央企名单) :《2019全球肿瘤趋势报告》 :阿尔茨海默病预防与干预核心讯息图解 :引力波天文台或有助搜寻暗物质粒子 :Sail Through the Mist - SoCal Innovation Forum 2019(10/5) 游天龙:《唐人街》是如何炼成的:UCLA社会学教授周敏的学术之路 :“为什么海外华人那么爱国,但是让他回国却不愿意?...“ :学术出版巨头Elsevier 彻查433名审稿人“强迫引用”黑幕
更多最新图文
更多《即时通讯》>>
 
打印本文章
 
您的名字:
电子邮件:
留言内容:
注意: 留言内容不要超过4000字,否则会被截断。
未 审 核:  是
  
关于我们联系我们申请加入后台管理设为主页加入收藏
美国华裔教授专家网版权所有,谢绝拷贝。如欲选登或发表,请与美国华裔教授专家网联系。
Copyright © 2026 ScholarsUpdate.com. All Rights Reserved.