文章详情

当Chatgpt首次到达时,我们得到了一个基于文本的聊天机器人,即使遇到了问题,也可以试图合理地回答任何问题(尽管幻觉尚未消失)。 AI很...
2025-04-03 12:20:03
文章详情介绍
当Chatgpt首次到达时,我们得到了一个基于文本的聊天机器人,即使遇到了问题,也可以试图合理地回答任何问题(尽管幻觉尚未消失)。 AI很快就获得了新的能力。它可以通过照片和视频看到事物。它可以听到人类通过自己的声音说话和回应。
下一步是给AI的眼睛和耳朵,可以实时观察周围的环境。我们已经有了Ray-Ban Meta型号可以做到这一点的智能眼镜。 Google和其他人正在开发类似产品。苹果可能出于同样的原因将摄像头放入Airpods。
当AI有一个身体在我们周围的身体上,并帮助我们完成各种需要处理现实生活对象的任务时,这项工作将完成。几个月前,当我说我想要人类AI机器人时,我在墙上看到了写作。
最近,我看到了一种AI模型,它会让机器人智能观察和理解周围的物理世界,并与他们从未受过训练的对象和动作进行互动。那就是AI机器人的图形螺旋视觉语言动作(VLA)。
毫不奇怪,其他人正在研究类似的技术,而Google刚刚宣布了两种使我震惊的双子座机器人技术模型。像人物技术一样,双子座机器人AIS将帮助机器人了解人类命令,周围环境以及他们要执行人类给他们的任务所需的工作。
我们仍处于AI机器人技术的初期,直到我想要在房子周围的人形机器人帮助者准备大量消费还需要一段时间。但是Google已经为未来奠定了基础。
Google DeepMind发表了一篇博客文章和一份研究论文,描述了它在Gemini 2.0 Tech背面开发的新的Gemini Robotics和Gemini Robotics-ER模型。这是Google目前可供用户使用的最先进的生成AI程序。
Google Robotics是基于Gemini 2.0建立的VLA,“添加了物理动作作为新的输出模式,目的是直接控制机器人。”
第二个是“具有高级空间理解的双子座模型,使机器人主义者能够使用双子座的体现推理(ER)能力来运行自己的程序。”它被恰当地称为Gemini Robotics-er。
通过体现的推理,Google意味着机器人需要发展“人类般的能力来理解和对周围世界的反应”,并安全地做到这一点。
Google分享了各种视频,这些视频显示了AI机器人的作用,响应自然语言命令并适应不断变化的景观。多亏了双子座,机器人可以看到周围的环境并了解自然语言。然后,即使他们可能从未与对象或位置进行过互动,他们也可以执行新任务。
Google解释了指导双子座机器人技术发展的三个原则。那是一般性,互动性和灵巧性:
要对人有用且有用,机器人的AI模型需要三种主要品质:它们必须是一般性的,这意味着他们能够适应不同的情况;他们必须进行互动,这意味着他们可以理解并迅速对环境中的指示或变化做出反应;它们必须是灵巧的,这意味着他们可以做人们通常可以用手和手指做的事情,例如精心操纵物体。
正如您在这篇文章中的视频中看到的那样,机器人可以识别表上的各种对象并实时执行任务。例如,一个机器人在被告知时通过篮球猛击了一个小篮球。

AI机器人还可以迅速适应不断变化的景观。被告知要把香蕉放在桌子上的特定颜色的篮子里,机器人即使人类烦人地移动了那个篮子,也可以正确执行任务。
最后,AI机器人可以显示出精细的运动技能,例如折叠折纸或打包自封袋。
Google解释说,Gemini机器人技术模型可与各种机器人类型一起使用,无论是双臂机器人平台还是类人动物模型。
Gemini Robotics-ER是机器人技术同样出色的AI技术。该模型专注于理解世界,因此机器人可以在他们应该执行动作的空间内执行运动和任务。使用Gemini Robotics-ER,AI机器人将使用Gemini 2.0来代码(原因?):
Gemini Robotics-ER提高了Gemini 2.0的现有能力,例如指向和3D检测,并通过很大的边距提高了Gemini 2.0。 Gemini Robotics-ER结合了空间推理和双子座的编码能力,可以实例化全新的功能。例如,当显示咖啡杯时,该型号可以直观合适的两指掌握手柄拾取手柄,并可以安全地接近它。
至少对于这个人工智能爱好者来说,所有这些都非常令人兴奋,尽管我知道我有很多等待,直到由此类技术提供动力的AI机器人。

在您开始担心AI机器人成为敌人之前,就像在电影中一样,您应该知道Google还在以前的工作中开发了机器人宪法,以确保AI机器人在环境中安全地行事并防止对人类的伤害。安全宪法基于以撒·阿西莫夫(Isaac Asimov)的三个机器人法则,Google对其进行了更新,以创建一个可以通过简单的自然语言说明进一步调整的新框架:
此后,我们开发了一个框架来自动生成数据驱动的宪法 – 直接以自然语言表示的规则 – 以引导机器人的行为。该框架将使人们能够创建,修改和应用宪法来开发更安全且与人类价值观更加一致的机器人。
您可以在此链接中阅读有关Gemini Robotics模型的更多信息。
最新思能攻略
更多- 原神丘丘梦工坊配方全解析与使用策略分享
- PSP世界传说光明神话2全角色NPC实用性分析与深度探讨
- 阴阳师冬雪相伴活动详细攻略及玩法介绍
- 平价三防 AI 手机来袭!OPPO A5 Pro 5G 現在只需 7,990 元即可享受军规抗摔、IP69/IP68/IP66 三重防尘防水技术以及丰富的 AI
- 英雄联盟无限火力2025年开启时间详细预告-无限火力活动时间安排
- 燕云十六声烈不熄对话的答案究竟是什么-烈不熄对话的答案全揭秘
- 炉石传说深暗领域版本32.0新增成就详尽列表一览
- 打破编码器束缚!无编码3D多模态大模型绩效超越13B现有SOTA | 上海AI Lab与港中文等团队最新研究
- 原神伊安珊的技能解析与使用技巧-全面了解伊安珊的技能特点
- 四川少女-B站-2023:游戏热潮中的青春风采与个性表达
- OpenAI计划转型为营利性企业,董事会应得到合理的补偿额度是多少?
- 中国式相亲中各角色的声优详细介绍与一览
- 对话式人工智能的爆发在即,未来的沟通方式将迎来巨变
- 天国拯救2波塞拉德图纸获取攻略-详细位置与获得方法介绍
- 金铲铲之战祝你发财的乌鸦攻略阵容推荐与玩法分析
最新思能智能
更多- 中国人工智能蓬勃兴起:从智能聊天机器人到未来玩具的创新之路
- “你好,我是Mac电脑。” “而我则是智能人工助手。”
- Saga与虚拟世界的结合 — 探索人工智能推动的数字经济未来
- 摩尔代理人自我治理法律:人工智能引发的指数革命
- 魔兽争霸1中人类战役完整剧情梳理与分析
- 穿越火线中的AC是什么意思-深入解析穿越火线中AC的具体含义
- 燕云十六声中九剑枪装备获取攻略-九剑枪装备刷取的实用建议
- 燕云十六声杏花不见的获得方法解析-如何获取燕云十六声杏花不见
- PSP刺客信条血缘详细攻略流程解析(一)
- 天国拯救游戏控制台代码大全2025年—所有控制台代码均可永久使用
- 英雄联盟手游梅尔最佳装备搭配攻略2025-详细解析梅尔最强出装方案
- 如何通过有效的写作技巧(而非依赖AI)来减轻我的超速罚单
- 远传AI技术助力跨年夜网络畅通 2,300座新基站覆盖全台主要商圈
- 全面解析英雄联盟双边无畏征召模式的玩法与特色
- 崩坏星穹铁道3.0版本预览兑换码大全-全新版本兑换码详细一览