乐鱼网.com

谷歌 DeepMind 推出无需监督即可自学的人工智能机器人

来源:乐鱼网.com    发布时间:2023-12-22 10:28:55

  机器人正迅速是我们日常生活的一部分,但它们通常只被编程来完成特定的任务。尽管利用人工智能的进展有几率会使机器人在更多方面发挥帮助作用,但构建通用机器人的进展较慢,部分原因是需要收集现实世界的培训数据。

  日前谷歌 DeepMind最新的论文介绍了一种自我改进的机器人人工智能代理程序,名为RoboCat,它学习执行不同机械臂上的各种任务,然后自动生成新的训练数据来改善其技术。

  DeepMind 表示,先前的研究探索了如何开发能够按比例学习多项任务并将语言模型的理解能力与协助机器人的现实能力相结合的机器人。RoboCat 是第一个解决并适应于多个任务,并在不同的真实机器人上完成的代理程序。

  RoboCat 学习速度比其他最先进的模型快得多。它能够最终靠仅使用 100 个演示来掌握新任务,因为它依靠大量和多样化的数据集。这种能力将有利于加速机器人学研究,因为它减少了人工监督培训的需求,并是创建通用机器人的重要一步。

  DeepMind 的研究科学家兼 RoboCat 小组成员之一的 Alex Lee 在接受 TechCrunch 的电子邮件采访时表示:「我们证明了一个单一的大型模型可以在多个真实机器人实体上解决各种不同的任务,并能快速适应新的任务和实体。」

  RoboCat 是受 Gato 启发而开发的,Gato 是 DeepMind 的一个人工智能模型,可以分析和处理文本、图像和事件。RoboCat 使用在模拟和真实的生活中收集的图像和行动数据来进行训练。Lee 表示,这一些数据来自虚拟环境中其他控制机器人模型、人类控制机器人以及之前的 RoboCat 模型的组合。

  为了训练 RoboCat,DeepMind 的研究人员首先收集了 100 到 1000 个由人类控制的机器人臂执行任务的示范。然后,他们在该任务上对 RoboCat 进行了微调,创建了一个专门的「分支」模型,平均训练了该任务 1 万次。

  利用分支模型生成的数据和示范数据,研究人员不断扩充了 RoboCat 的训练数据集,并训练了后续的新版本 RoboCat。

  RoboCat 的最终版本在模拟和实际世界中的 141 种不同变体的任务集上进行了训练,总共涵盖了 253 个任务。DeepMind 声称,在观察了数小时的人类控制示范后,RoboCat 学会了操作不同的机器人臂。

  虽然 RoboCat 在四种带有双爪臂的机器人上进行了训练,但该模型能适应一个带有三指夹爪和两倍可控输入的更复杂的臂。

  尽管在 DeepMind 的测试中,RoboCat 在不同任务上的成功率差异很大,从最低13% 到最高99%。这是在训练数据中有 1000 个示范的情况下;当示范数量减少一半时,成功率可预见地较低。

  然而,在某些场景中,DeepMind 声称 RoboCat 只需 100 个示范就能学会新任务。

  Lee 补充说:「通过提供有限数量的示范来进行新任务的微调,RoboCat 可以自动生成更多数据以进一步改善。」未来,研究团队的目标是将 RoboCat 学习完成新任务所需的示范数量降低到 10 个以下。

  11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,稳定性很高,让您的云端之旅更加畅享。快来腾讯云选购吧!

  谷歌子公司DeepMind推出了一款突破性的人工智能代理系统,能够直接从人类教师那里学习任务。该系统通过观察和模仿行动来模拟人类任务执行,展示了一种被称为“文化传递”的新型模仿学习形式。随技术的进步,它为更有效且注重隐私的人工智能培训开辟了道路,标志着人工通用智能追求中的一个显著进步。

  GoogleDeepMind昨天发布的一项研究展示了一项引人注目的技术,尽管其中的技术细节在大多数情况下要深入理解,但总体来说,通过一系列操作,可以以无监督的方式精准控制扩散模型,从实现风格和内容的分离,以及合成物品的3D视图等功能。论文地址:这项研究介绍了一种名为SODA的自监督扩散模型,专门用于表示学习。这项研究为深度学习领域的发展提供了新的思路和可能性。

  AI对人类世界的学习能力,到目前为止仍然停留在语言层面。喂给大模型语料——最初是和Reddit,后来扩展到音频、视觉图像甚至雷达和热图像——后者广义上说是换了种表达方式的语言。X平台上,GoogleDeepMind主页下最新鲜的一条推文是:“欢迎Gemini。

  谷歌DeepMind的机器学习研究团队声称,他们已证明AI可以通过类似于人类和其他动物的社会学习过程来获取技能。社会学习——即一个个体通过模仿另一个个体来获取技能和知识——对于人类以及大部分动物界的发展过程至关重要。我们期待未来AI领域与文化进化心理学领域之间的富有成果的跨学科互动,」研究人员表示。

  谷歌在英国对其人工智能聊天机器人Bard进行升级,这是其下一代模型的全球推广的一部分,该模型旨在与OpenAI的ChatGPT竞争。这家美国科技巨头及其总部位于伦敦的Deepmind部门本月早些时候在美国巴德和170多个国家/地区推出了其承诺已久的新基础模型Gemini,但最初推迟了在英国的推出。该组织表示,将在与政府和专家“合作”的同时建立保障措施,以帮助防范人工智能带来的日益严重的风险。

  谷歌Deepmind宣布了他们最先进的图像生成模型Imagen2。该模型通过参考图片和文本生成新图片和局部编辑的效果比较强大。开发人员和云客户能够最终靠GoogleCloudVertexAI中的ImagenAPI使用这一先进的图像生成模型。

  GoogleDeepMind的研究发现,通过简单的查询攻击方法,可以从ChatGPT中泄露出大约几MB的训练数据,成本仅约200美元,引起社交网络哗然。研究团队成功攻击了生产级模型,打破了对齐设定,即使模型经过对齐,也能通过命令诱导模型输出训练数据,暴露个人信息,揭示了对抗模型泄露的新途径。新的攻击方式提出了对抗模型泄露的新思路,强调了在开发和使用大型语言模型时对隐私和安全的重视,并呼吁进行更全面的测试和防护措施。

  GoogleDeepMind的研究团队通过人工智能工具GNoME发现了220万种理论上稳定但实验上未实现的晶体结构,这一成果在《自然》杂志上发表。这一发现的晶体结构数量是科学史上发现的数量的45倍以上,为可再生能源和先进计算等领域的发展提供了潜在的进步。「这个庞大的无机晶体数据库应该充满待发现的『宝石』,以推进清洁能源和环境挑战的解决方案,」在麻省理工学院材料科学与工程以及核科学与工程系工作的Yildiz说。

  GoogleDeepMind的机器学习研究团队最近宣布,他们成功证明了人工智能代理能够最终靠社会学习的方式获取技能,类似于人类和其他动物的学习过程。这一成果被认为是在人工智能领域的重大突破,为实现人工通用智能迈出了一步。这一领域的交叉研究将有望促成有益的互动,将人工智能和文化演化心理学领域有机地结合在一起。

  在当地时间今天早上的拉斯维加斯举行的亚马逊re:Invent大会上,亚马逊宣布推出一款面向AWS客户的AI驱动聊天机器人Q。现已公开预览,起始价格为每用户每年20美元,Q能够回答诸如「如何使用AWS构建网络应用程序?企业们只需要看看Q是否像亚马逊所说的那样有效。

  Jellypod+是一款将您的电子邮件订阅转化为个人播客的应用程序。它以音频为主要形式,为您忙碌的生活方式生成您每日新闻的简明摘要。Jellypod+的目标是打破传统媒体的“一刀切”模式,为您量身定制新闻,符合您独特的兴趣爱好。该应用程序还包括内置的电子邮件阅读器和简报转发功能,让您可以在不离开应用的情况下查看简报的详情,并自动将入站简报转发到您的个人收件箱。此外,Jellypod+还提供可调节的播放速度、多种不同的播音员选择、离线模式、定制播客生成计划、多个每日播客主题组织、无广告体验以及注重隐私的邮箱地址保护等功能。

  Sunflower是首个提供近实时将人声转换为AI声音的VST插件。支持在M1 Mac上下载,提供VST和AU支持。即将推出Windows支持和更多声音选择。Sunflower还提供无限制的声音生成,无版权限制的商业使用授权声音,自定义模型加载以及RVC和其他声音转换功能。

  Euphonme是一款AI音乐创作与分享平台,用户可以描述他们想要的音乐,Euphonme将根据描述创作出符合要求的音乐。该产品定位于提供便捷的音乐创作与分享服务,为用户提供全新的音乐体验。Euphonme的定价灵活多样,包括免费的beta版服务。该产品主打智能音乐创作,用户无需具备专业音乐知识,即可轻松创作出个性化音乐。

  Script.It 是一款无代码平台,让您轻松构建复杂的 AI 工作流。增强您的 AI 生产力,实现高效的工作流程,提升业务效率。在几天内为您的业务获得 AI 的好处,而不是几个月。通过灵活使用上下文数据,提供一致准确的输出。通过可适应的工作流自动化繁琐重复的任务。无代码解决方案轻松与现有工作流集成,无需开发!

  domsy.io利用先进的人工智能技术,将您的想法变成现实,让每个人都能够进行设计和原型制作,而无需技术专业知识。无论您的背景如何,现在都是展现自己的时候了。

  Jan是一款开源、自托管的聊天GPT替代品,可以100%离线在您的计算机上运行。Jan提供可定制的AI助手、全局热键和内联AI等功能,可以提高您的生产力。Jan支持在本地主机上提供OpenAI等价API服务器,可以与兼容的应用程序一起使用。Jan的对话、偏好和模型使用等数据都保留在您的计算机上,安全、可导出,并可随时删除。

  Open AI Chat GPT For Email是一款基于OpenAI的免费插件,为您的Gmail体验提供了强大的功能。它利用ChatGPT提供智能的电子邮件写作建议,修正拼写错误并提供更有效的表达方式。该插件支持AI生成的提示、智能构思、电子邮件完成以及自定义模板存储等功能,适用于各个领域的电子邮件写作。

  danbooru donmai us 是一个网站,主要提供检查站点连接是否安全的功能。它可以帮助用户检查所访问的网站是否存在安全风险,以保护用户的网络安全。该产品提供的功能简单易用,用户只需输入网站链接即可进行检查。同时,danbooru donmai us 还提供了标签和使用示例,方便用户快速了解和使用。

  Create是一个使用AI代码生成的平台,可以帮助用户快速创建网站和应用程序。它提供了多个预设模板和组件,用户只需通过简单的操作即可生成自己想要的网站和应用程序。同时,Create还具备丰富的功能和优势,包括快速生成、代码优化、可定制化等。定价方面,Create提供了多种套餐供用户选择。该产品定位于希望快速构建网站和应用程序的用户群体。

  Layerbrain是一款人类语言界面软件,可通过自然语言与任何软件、数据或API交互,执行任务。它可以帮助用户省去繁琐的命令行或编程操作,提高工作效率。Layerbrain还提供了强大的数据处理和分析功能,用户可以使用自然语言查询和分析数据。Layerbrain的定价灵活,用户可以根据自己的需求选择不同的套餐。

  GPT Beaver 是一个 AI 聊天机器人的平台,它允许用户自定义提示,并为其创建微网站。该平台利用 OpenAI 的 ChatGPT 模型为用户提供强大的自然语言处理功能。用户可以为机器人设置各种场景和功能,让机器人根据用户的输入进行智能回复。无论是用于在线客服、虚拟助手还是其他聊天应用,GPT Beaver 都能为用户带来更出色的聊天体验。

  PocketPal是一款即时智能聊天助手,集成了ChatGPT技术,用户能够最终靠发送文本信息即刻获得不超过一分钟的响应。其优势在于提供快速、准确的智能回复,节省用户等待时间。定价灵活多样,适用于各类商业场景,定位于提高客户服务效率和用户体验。

  Shedevrum是一个基于AI的图像生成应用程序。它允许用户通过文字描述来生成图像,例如描述一个场景或对象,然后AI会根据描述生成相应的图像。目前Shedevrum处于测试阶段,正在不断完善其功能。

  Hydra是Rightsify推出的音乐生成模型,可在几秒内自动生成独特的无版权音乐。适用于商业和艺术用途,专为企业、内容创作者和艺术家设计。提供10秒到2分钟不等的音乐,支持详细提示以自定义风格、器乐、节奏等参数,输出24位44.1khz波形格式音频文件。

  AgentOps.ai是一款虚拟员工服务平台,可帮助您扩展业务而无需额外人力。它提供100多个经过测试的虚拟员工,可在Discord、Slack、WhatsApp和电子邮件等平台上工作,全天候为您服务。AgentOps.ai不需要编码,能够无缝集成,并支持多个工作流同时运行。所有虚拟员工经过AgentOps.ai的审核,可立即投入使用。

  PowerInfer 是一个在个人电脑上利用消费级 GPU 进行高速大型语言模型推理的引擎。它利用 LLM 推理中的高局部性特点,通过预加载热激活的神经元到 GPU 上,从而显著降低了 GPU 内存需求和 CPU-GPU 数据传输。PowerInfer 还集成了自适应预测器和神经元感知的稀疏运算符,优化神经元激活和计算稀疏性的效率。它可以在单个 NVIDIA RTX 4090 GPU 上以平均每秒 13.20 个标记的生成速率进行推理,比顶级服务器级 A100 GPU 仅低 18%。同时保持模型准确性。

  Empty是一个AI驱动的电子邮件过滤工具,专门用于屏蔽不需要的噪音。它允许用户创建自己的AI过滤器,并获得一个@empty.app的电子邮件地址。通过这个过滤器,用户都能够享受到一个专注、无干扰的收件箱,只有重要的电子邮件会被转发到他们的真实邮箱地址。

  Dada是一个致力于连接漫画创作者的社区,无论是初学者还是经验丰富的大师。这里是展示、学习和与他人共鸣的地方。我们相信每个创作者都有独特的故事和风格,在这里,你可以展示你的激情、创造力和技能。

  Text-to-CAD 是一个通过文本提示生成 CAD 文件的插件。使用该插件,您能够准确的通过文本提示生成可以导入到所选 CAD 程序的模型。Text-to-CAD 的机器学习基于我们的设计 API,通过编程分析训练数据并生成 CAD 文件。

  ROAS是一款基于人工智能的数字营销工具,能够为营销人员提供智能化的辅助。其功能强大,优点是能够通过AI生成营销内容,提高营销效率。定价灵活,定位于帮助营销人员提升工作效率。

上一篇:助焊接行业“一臂之力”让焊接变得简单法奥意威在行动 下一篇:世界十大工业机器人公司日本五家中国一家上榜