用户名:  密码:   
网站首页即时通讯活动公告最新消息科技前沿学人动向两岸三地人在海外历届活动关于我们联系我们申请加入
栏目导航 — 美国华裔教授专家网科技动向科技前沿
关键字  范围   
 
美国"OpenAI”研发出"Go-Explore”:使AI向真正“智能学习体”迈进
2021/2/27 14:52:37 | 浏览:1380 | 评论:0

      英国《自然》杂志24日发表一项人工智能研究成果:美国团队报告了一类增强学习,可回溯过去、解决复杂任务,真正改善了对复杂环境的探索方式,有望应用于机器人、语言理解和药物设计领域。这类算法被统称为“Go-Explore”,其已经在一款经典游戏的算法挑战中得分超过了人类玩家和先进的人工智能系统。该成果被认为正朝着实现真正“智能学习体”迈出了重要一步。

       增强学习,可让人工智能系统通过探索和理解复杂环境来进行决策,并学习如何以最优的方式获得奖励。奖励可以包括机器人抵达特定位置或是在电脑游戏中达到一定的等级。然而,当遇到很少给予反馈的复杂环境时,现阶段的加强学习算法就很容易碰壁,这让人工智能专家们非常苦恼。

       美国“OpenAI”是由诸多硅谷巨头联合建立的人工智能非营利组织,推动者包括美国创业孵化器Y Combinator总裁萨姆·阿尔特曼、美国太空技术探索公司(SpaceX)创始人埃隆·马斯克等,其目标是希望能够预防人工智能的灾难性影响,并推动人工智能发挥积极作用。此次,“OpenAI”的科学家艾德兰·艾克菲特、朱斯特·赫伊津哈及团队,提出了有效探索面临的两个主要障碍,并设计了一类算法来解决这些障碍。

       研究人员表示,“Go-Explore”可以对环境进行全面探索,同时构建一个档案库来记住它去过的地方,确保自己不会忘记通往有望成功的期中阶段或是最终胜利(奖励)的路线。其在雅达利经典游戏中的得分,超过了人类玩家和先进的人工智能系统,研究人员用这类算法,解决了之前未能解决的2600个雅达利游戏,验证了这类算法的潜力。“Go-Explore”在算法挑战《蒙特祖马的复仇》中的得分是之前的4倍,在另一个算法挑战《玛雅人的冒险》中的得分也超过了人类玩家的平均水平。而相对的,此前的算法一分都拿不到。

       “Go-Explore”算法还能完成一个模拟机器人任务,在这项任务中,它必须用机械臂把东西捡起来并放到4个架子中的一个架子上,其中两个架子被关在两扇门的后面。

       研究人员指出,记住并回到有望成功的探索区域的简单原则是一种强大、通用的探索方法。他们认为最新的算法有望应用于机器人、语言理解和药物设计。

 

相关栏目:『科技前沿
详解2025诺贝尔化学奖:他们找到了构建分子的全新方式 2025-10-12 [41]
详解2025诺贝尔物理学奖:他们在人类尺度上观测到量子力学 2025-10-12 [38]
炸裂发布!人工智能,重磅传来! 2025-10-06 [167]
黄仁勋最新讲话:下一个10年,你的工作方式会被彻底改变 2025-10-06 [206]
AI 能取代科学记者? ChatGPT 爱用「突破性」却难掌握研究细节 2025-10-02 [249]
为什么“具身智能”是 AI 的下一个前沿 2025-10-02 [265]
AI如何重塑未来人类健康 2025-09-23 [560]
为什么忽视人工智能在企业中的应用会让你在 2025 年付出代价? 2025-09-11 [1089]
特斯拉宏图4.0:从电动车到人形机器人! 2025-09-11 [1179]
AI杀死首个世界名校?全球TOP 3「翻译界哈佛」倒闭,毕业校友成绝版 2025-09-11 [1130]
相关栏目更多文章
最新图文:
游天龙:《唐人街》是如何炼成的:UCLA社会学教授周敏的学术之路 :“为什么海外华人那么爱国,但是让他回国却不愿意?...“ :学术出版巨头Elsevier 彻查433名审稿人“强迫引用”黑幕 :中国336个国家重点实验室布局 :中澳政府联合出手打击洗钱和逃税漏税 大量中国居民海外账户遭冻结 :摄影师苏唐诗与寂寞百年的故宫对话6年,3万张照片美伦美奂 :大数据分析图解:2019中国企业500强 张梦然:英国惠康桑格研究所:人体内的微生物与出生方式有关
更多最新图文
更多《即时通讯》>>
 
打印本文章
 
您的名字:
电子邮件:
留言内容:
注意: 留言内容不要超过4000字,否则会被截断。
未 审 核:  是
  
关于我们联系我们申请加入后台管理设为主页加入收藏
美国华裔教授专家网版权所有,谢绝拷贝。如欲选登或发表,请与美国华裔教授专家网联系。
Copyright © 2025 ScholarsUpdate.com. All Rights Reserved.