庆云古诗词

庆云古诗词

ChatGPT已能操控机器人,工程师连代码都不用写,网友:微软在搞天网? |【经纬低调分享】

互联资讯 0

2023年11月20日 每日一猜答案: 答案:ABC
每日一猜答案分析:

chatgpt官网,chatgpt怎么用,chatgpt开源,chatgpt在线

机器人将成为GPT的又一个应用场景,微软已经开始拿ChatGPT操控机器人了。

在 ChatGPT 的帮助下,工程师甚至不用手写代码――直接用人话描述想做什么,AI就能自动翻 译成机器语言。

比如,一位操作者跟AI说:“我渴了,请帮我找个喝的。”AI并不会直愣愣地就去找水,而是会很机灵地反问:“请问你想喝哪种?这里有好几种饮料,比如椰子水、可乐等等。”操作者并未直接告诉AI选哪个,而是说:“我刚从健身房回来,请帮我找个健康点儿的饮料。”然后更神奇的操作就开始了:AI先是猜测他想喝椰子水,然后自己噼里啪啦写出一段代码(甚至还有注释),写完就自己指挥无人机去找椰子水。

前不久,OpenAI也宣布投资挪威人形机器人公司1X。1X表示最新机器人将加入AI,这或许意味着未来人形机器人会嵌入GPT,从而让机器人更理解人。

人形机器人如果嵌入GPT,或许将是一场革命。以下,Enjoy:

Alex 发自 凹非寺

量子位 | 公众号 【【微信】】

当我还在跟ChatGPT吹牛尬聊时,有人已经在拿它操控机器人了。

不是别人,正是OpenAI的金主爸爸、不久前刚拿ChatGPT“重新发明搜索引擎”的微软。

到目前为止,开发者调教机器人不仅技术门槛高,还道阻且长:

工程师需要在工作流程回路中,不断手写新代码和规范来纠正机器人行为;另外,操控不同的机器人可能需要不同的编程语言和环境。

而在ChatGPT的帮助下,工程师甚至不用手写代码――直接用人话描述想做什么,AI就能自动翻译成机器语言。

这意味着,一方面专业人士与机器人的交互效率起飞;另一方面,技术门槛也降低一大截,外行人甚至也能参与调试,创造出更多使用方法。

举个简单的例子:让无人机自动检查货架。

首先,操作者只需用自然语言给ChatGPT提出要求;然后,AI就能自动翻译成代码,并指挥无人机行动。(还可以规定无人机的飞行路径。)

难怪特斯拉前AI主管Andrej Karpathy会调侃:

最新的热门编程语言是英语。

1一个AI指挥多种机器人

实际上,ChatGPT会玩儿的花样可多了。

比如,一位操作者跟AI说:“我渴了,请帮我找个喝的。”

此时AI并不会直愣愣地就去找水了,而是会很机灵地反问:

请问你想喝哪种?这里有好几种饮料,比如椰子水、可乐等等。

当然操作者也不是吃素的,他并未直接告诉AI选哪个,而是说:“我刚从健身房回来,请帮我找个健康点儿的饮料。”

然后更神奇的操作就开始了:

AI先是猜测他想喝椰子水,然后自己噼里啪啦写出一段代码(甚至还有注释):

写完就自己指挥无人机去找椰子水:

除了无人机,ChatGPT还能轻松操控别的小机器人,包括摄像头、机械臂等等

比如让摄像头在房间里找出能加热午饭的东西。

还有指挥机械臂拼出一个微软的Logo。(悄悄夹带私货)

看到这些,有网友脑洞大开,有人发问:

他们是不是正在建立无所不能的天网?

还有人甚至调侃称,AI可能连发射核弹的指令都会写:

不过话说回来,其实离网友说的这些还差得远,毕竟现在还是需要人类参与的。

2

怎么实现的?

从前文可以看出,这只灵活的AI不仅与人交流畅通无阻,而且和机器也能快速沟通。

这主要得益于微软团队专门开发的一系列API和高级函数库

他们没有让ChatGPT背后的语言大模型(LLM),生成某固定种类的代码;因为机器人是个多元化领域,这样可能会在不同场景下涉及大量微调。

而在新颖的操作框架下,不同机器人,都有自己对应的特定函数库。

――一个AI,就能适应不同的对象、不同的任务。

一方面,这些函数库,能够连接到机器人控制系统中管理底层硬件,以及执行基本运动的代码和功能模块。

另一方面,为了让ChatGPT也能遵循函数库的规则,预定义函数命名就很关键。清晰的函数名,能让各API之间建立良好的功能连接,最终生成高质量的回答。

其中一项要求,就是所有API名称必须描述整体功能行为。例如,detect_object(object_name) 函数可以在内部链接到OpenCV函数或计算机视觉模型。

设计好库和API后,微软给ChatGPT编写了一个文本提示(prompt),描述目标任务,并明确说明函数库中哪些函数可用;另外,这还能规定ChatGPT生成代码用哪种编程语言。

值得一提的是,AI生成内容效果,和人为提示的质量呈正相关。为此,微软还开发了一个协作开源平台PromptCraft,任何人都能在此分享不同类机器人的Prompt策略。

到此,幕后部署基本完成,然后用户就能通过“说人话”间接操控机器人了。

如果想要检查AI生成的代码是否有Bug,随时都能在聊天框直接检查,或通过模拟器测试,人类可以用自然语言指导AI进行修正。

另外,还能到等到用户对解决方案满意为止,再在将ChatGPT生成代码部署到机器人上。

最后,如果是你,会想用ChatGPT操控机器人做些什么呢?

论文地址:【【网址】】/en-us/research/uploads/prod/2023/02/ChatGPT___Robotics.pdf

参考链接:【【网址】】/【【淘密令】】-technology/2023/02/robots-let-chatgpt-touch-the-real-world-thanks-to-microsoft/[2]【【网址】】/en-us/research/group/autonomous-systems-gr【【网址】】/microsoft/PromptCraft-Robotics#promptcraft-robotics


智能机器人chatgpt


一觉醒来,ChatGPT又变强了。

OpenAI今天凌晨,又甩出一个王炸!突然宣布了个惊爆全球科技圈的消息:发布 ChatGPT Plugins!

如果把OpenAI比作苹果,那GPT-4就是iPhone,ChatGPT则是iOS,而这次发布的Plugins就是【【淘密令】】了。而且,ChatGPT“联网”的封印,被彻底解除!是的,之前的ChatGPT并未联网,大家只能查询到2021年9月之前的消息。也就是说,本次OpenAI对实时信息的检索、更新能力都给补全了!从一个单机版AI,升级为联网版AI。

微软副总裁Yusuf Mehdi直接在发推特感慨:我们谁都不曾想到,这个三月会如此疯狂。

“Chat Store”来了真成宇宙中心联网后,ChatGPT有什么不一样了?首先各种专业能力加强!在OpenAI官方演示中,ChatGPT接入了数学知识引擎Wolfram Alpha后,你就再也不用担心数值计算不精准,数学问题常常回答错误的问题。

换句话说,以后再也不用担心ChatGPT“满嘴跑火车了”。ChatGPT官方提供的插件,可以分为三大类:* Web浏览器:在循环中添加必应搜索* 代码解释器:在一个沙盒和防火墙的执行环境中添加一个实时的【【微信】】解释器* 检索:对个人和组织文件进行语义搜索另外,除了自家的插件外,OpenAI还发布了11款第三方插件:由Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram和Zapier创建。

衣食住行全面“侵入”!ChatGPT开始构建生态了,首批第三方插件就覆盖了:订机票、在线点餐、交通导航、企业办公等功能。举个例子,你和ChatGPT聊天:“我正在旧金山,周末想吃素,给我个菜谱,并且计算出食谱的热量,最后在订购食材。”

然后。。。食谱出来了。

还在帮你在购物网站Instacart上下单,需要什么食材,ChatGPT已经帮你选好了。

(Instacart 是一家美国零售公司,在美国和加拿大经营杂货配送和取货服务)甚至,还能帮你比价,直接找出性价比最高的那一家。你需要的,就是做最后的付款确认!再比如,马云告诉ChatGPT:我要买肯德基,ChatGPT可以帮马云,完成肯德基公司收购。AI可以帮忙下单,那未来就可以帮忙抢茅台了?再努力多几年,AI或许就能学会自己赚钱,发展到帮我付账了?很明显,OpenAI开放插件,将绑定开发者的生态,自己打造成互联网新的操作系统和流量入口。现在,他不仅可以与人类交谈了,也可以与现有的软件基础设施“交谈”,API是第一步,插件是第二步。

国内用户兴奋了AI的浪潮已经来了,不断提速中,有人怀疑,失业速度又将加快。

英伟达AI科学家Jim Fan表示:

如果ChatGPT的横空出世可以看作「iPhone的出现」,今天第三方插件的集成,就是「iOS 【【淘密令】】」级别的事件。

国内网友已经设想出了一系列应用场景:用ChatGPT预定酒店航班、点外卖、网购等等。国内的互联网公司,如果开始把自己的服务接入 ChatGPT:比如携程,接入后,你就可以问你的航班信息了。比如微博,接入后,GPT 写完就可以直接发送了。比如美团外卖,接入后,你可以叫 GPT 自动叫外卖。比如 New Bing,接入后,chatGPT 也能联网搜东西。(已实现)比如私人知识库,接入后,把你的微博接进来,让它更了解你。(已实现)比如视频编辑软件,接入后,就可以让 GPT 帮你剪视频。(已实现)比如运行 【【微信】】,接入后,GPT 写的代码可以直接跑出结果。(已实现)现在,ChatGPT都已经能网上购物了,已经离钱很近了。ChatGPT可能会比微信,更早一步达成“超级APP”,连接一切这个成就。GPT-OS这是要开建了吗?ChatGPT之父,山姆・奥尔特曼在2022年4月,曾说过:

“我们需要为这种新的计算机界面命名,用自然语言告诉计算机你想要什么,然后直接让它们执行操作。大家有想法吗?”

或许在那时,ChatGPT Plugins的想法,早已在他的脑海中酝酿。AI可以影响物理世界!AI-OS时代来了?

有什么投资的机会?有相关从业程序员在推特上表示:

“我认为ChatGPT推出的插件功能是对苹果【【淘密令】】的威胁,OpenAI创造了一个拥有全新盈利方法的平台。”

想当年,第一批进驻【【淘密令】】的开发者,都赚得非常开心~现在ChatGPT开放后,是否也要进驻,喝头啖汤?

OpenAI 的CEO 山姆?奥尔特曼(Sam Altman)表示:

“我们正在开始推出ChatGPT插件,您可以安装插件来帮助完成各种各样的任务,我们很高兴看到开发人员创造的东西!”

苹果的 【【淘密令】】,允许开发者去基于 iOS 操作系统,开发游戏或应用,游戏应用越多,生态越丰富,就可以吸引更多的用户。一个不断循环的正向反馈。这个势能一旦建立起来,其实,其他AI平台,可能是很难追上。现在,OpenAI鼓励开发者一起做插件。目前ChatGPT Plugins,已经开放申请了,基哥刚申请,希望能通过。

你首先需要先加入【【微信】】申请,申请时最好填上个人GitHub地址。这也是OpenAI用来判断开发能力的标准之一。打不过,真的也只能加入了。接下来是百度的文心一言,将接入美团外卖、拼多多?

结语比尔盖茨说:在我的一生中,我见过两次让我印象深刻的技术演变,它们是革命性的。第一次是在 1980 年。

当时我接触到了图形用户界面 ―― 每个现代操作系统的先驱,包括 【【微信】】。我和向我展示演示的人坐在一起,他是一位名叫 Charles Simonyi 的才华横溢的程序员,我们立即开始集思广益,讨论我们可以用这种用户友好的计算方法做的所有事情。Charles 最终加入了微软,【【微信】】 成为了微软的支柱,我们在那次演示之后所做的思考帮助制定了公司未来 15 年的议程。

第二个大惊喜发生在去年。

自 2016 年以来,我一直与 OpenAI 的团队会面,他们的稳步进步给我留下了深刻的印象。2022 年年中,我对他们的工作感到非常兴奋,于是我给了他们一个挑战:训练人工智能以通过大学预修生物学考试。使其能够回答未经专门培训的问题。(我选择 AP Bio 是因为测试不仅仅是对科学事实的简单反省 ―― 它要求你批判性地思考生物学。)如果你能做到,我说,那么你就取得了真正的突破。我认为挑战会让他们忙上两三年。他们只用了几个月就完成了。

AI的狂欢,打工人的至暗时刻?基哥感觉,有生之年会看到AI产生意识的一天,人类进入奥创纪元。我们或许有事没事都会询问GPT,它以后会演变成中央电脑、立法者、仲裁者、执法者。?所有人类都会向他询问问题,接受它的立法和仲裁。

?END?