openai发布更强大的gpt-4模型 openai发布史上最强gpt-4
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
OpenAI主动“暂停”GPT5,谷歌这个模型将成全球最强,AI“高风险功能”将被开启?
来源:华尔街见闻 卜淑情
有人认为,谷歌今年晚些时候推出的Gemini有望成为全球迄今为止最强大的AI模型,但其“计划”能力或引发安全风险。
打开潘多拉魔盒的不是OpenAI,而是谷歌?
在美国国会举行的听证会上,OpenAI首席执行官Sam Altman说,OpenAI目前还没有在未来六个月内训练GPT-5的计划,表明年内这家公司可能都不会推出更强大的AI模型。
因此有人认为,谷歌今年晚些时候推出的Project Gemini有望成为全球迄今为止最强大的AI模型。
与现有模型相比,Gemini的最大优势在于其多模态能力。谷歌在近期的一篇博客文章中介绍说:
我们已经开始着手研发Gemini,这是我们从零打造的下一代模型,具备多模态能力,高效整合工具和API(应用程序编程接口),并为实现未来创新(如记忆和计划)而设计。
尽管Gemini目前仍在训练阶段,但它已经展现出先前模型从未有过的多模态能力。一经精细调整和严格的安全测试,我们将提供不同大小和功能的Gemini模型,就像PaLM 2一样,确保它能够在各种产品、应用和设备上得到应用,造福每个人。
Gemini比GPT强在哪里?
Gemini由谷歌最新组建的Google DeepMind团队开发,最大的亮点就是它的多模态能力。
据悉,Gemini建立在多模态模型的基础上,不仅能够理解和生成文本、代码,还能够看懂和生成图像。相比之下,ChatGPT只是一个纯文本模型,只能理解和生成文本。
这意味着Gemini可以应用于更广泛的任务领域。例如,基于Gemini创建的AI聊天机器人,能够理解和生成文本和图像。
类似地,Bing虽然有一个专门用于图像创建的链接,但在聊天框内生成的内容仍局限于纯文本,因此用户无法要求它生成图像。
与ChatGPT相比,Gemini还可以为更多种类的产品和应用提供支持。例如,Gemini可以用于新的Google搜索引擎,或者用于创建一种新型AI助手。
ChatGPT和Bing都不具备这些能力。但值得一提的是,GPT 5或许可以实现这些功能。
另外,凭借记忆和计划能力,Gemini可以用于创建一种新型的AI应用,这是ChatGPT做不到的。
例如,Gemini可以用于创建一个能记住你的偏好并帮助你规划日常活动的AI个人助手。
但据华尔街见闻此前文章,ChatGPT本周推出的70款插件,基本上能够扮演24小时私人助理的角色,但并不能实现规划这一功能。
AI“高风险功能”将被谷歌开启?
Gemini的能力令外界感到惊讶,同时也感到害怕。
一名昵称为“AI Explained”的Youtube知名科技博主认为,谷歌不顾安全风险,赋予模型自行制定并执行计划的能力,并加速开发这一危险的技术,或加剧AI对人类社会的威胁。
AI Explained发现,“计划”这一能力被谷歌当做Gemini的卖点,但被OpenAI视为一种安全风险。
在GPT 4的技术报告中,有这样一段话:
在更强大的模型中,往往会出现新的引人注目的能力。其中一些能力尤为令人担忧,包括制定和执行长期计划的能力,谋求权力和资源的能力(“谋求权力”),以及展示越来越“主动性”的行为。
谷歌谈到将加速对Gemini的开发,毫无疑问,其刚刚发布的通用大语言模型PaLM 2将是开发加速的地方。可以理解,在这场激烈的全球AI竞赛中,暂时处于下风的谷歌必须加快脚步。
作为对比,GPT 4的技术报告是这样描述的:
OpenAI特别关注的一个重要问题是,竞争可能引发安全标准下降、不良规范的传播以及人工智能时间表的加速,进而加剧与人工智能相关的社会风险。我们在此将其称为“加速风险”。
也就是说,OpenAI是不主张在未能确保安全的情况下加速研究AI技术的,主动“暂停”GPT5的开发符合这一理念。
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
gpt-4可以接入什么软件 gpt-4 app测评
gpt支持,gpt支持什么操作系统,gptneo,gpt软件本文来自微信公众号:差评 (ID:【【微信】】),撰文:晚上吃早饭、及格,编辑:江江、面线,原文标题:《GPT-4终于可以联网、用插件了,我用完的评价是:拉了。》,题图来自:视觉中国
在被各种号称“炸裂”“颠覆”的 AI 新闻的轰炸下,说实话,差评君已经有点麻了。但这次,差评君打起来十二分的精神,因为真正有料的终于来了。
就在这两天,随着 OpenAI 向 Plus 用户全面开放自己的第三方插件,差评君也有了使用插件的资格。
只要是 ChatGPT 的付费用户,在设置里打开“【【淘密令】】”里的“Web browsing”和“Plugins”,接下来,只要在聊天页面选择需要启用的功能,就能在对话中使用了。
不过要注意的是,这个“Web browsing”和“Plugins”只能二选一,并不能同时使用。
由于这两个功能都只能单独使用,所以,我们先尝试了一下 ChatGPT 自带的网页搜索功能。
我们都知道,GPT-4 的模型数据集只收集到 2021 年 9 月份,所以我问了它一个最近很火的游戏,王国之泪。
这次它终于摆脱了单机模式,直接上网搜索了“王国之泪”的关键词,然后找到了“王国之泪”的维基百科。在阅读相关内容后,输出了回答,而且还顺便给咱做了一个翻译。
这么来看,联网了的 GPT-4 的大脑,又扩容了。
不过呢,当我想要些更细致的信息时, GPT-4 虽然会尝试去浏览网页,但,都进不去。
于是我转头去试了试 NewBing ,就没发现有类似的问题。
对此,差评君只能理解为 ChatGPT 在爬取国内内容时,爬取手段太过直白,直接被当成机器人给拒绝访问了。
不过,ChatGPT 的网络浏览也不是一无是处,相对于现在的 NewBing,当我需要一个更加详尽的回答时,比如让它对暴雪收购案进行评价,NewBing 可能是由于限制问题,只给出了短短几句的回答,数据还不新。
反观 GPT-4 不仅获取了正确信息,而且还对新闻的细节进行了总结。
唯一需要吐槽的,就是整个的生成过程速度有点慢。
而在第三方插件方面,这次刚好也有个名叫 KeyMate.AI Search 的工具能辅助搜索。
只不过,这插件反而不如上述 ChatGPT 自带的网页浏览功能好用。
虽然它按照要求给出了链接,但是点进去,是一个无法访问的视频……至于知乎,依旧拒绝访问。
最后,它出门左转在 IGN 的官网,帮我找了一些资料。
除了这个实时搜索,ChatGPT 其它插件的能力又如何呢?
首先,就是在学术教育和数学能力上,有了插件的加持,GPT-4 再也不是从前的那个数学小白了。
原因就是这个能做数学题的神器:Wolfram 插件。
相对于原始网站,加载了插件的 GPT-4 ,更像是一个老师。
在答案上,GTP-4 除了能帮你把过程给写出来,在解答过程中,当我要求它去对一些关键步骤进行解释时,这个回答就更详细了。
不过在一些难度更高的题目面前,Wolfram 就有点应付不来了。
比如这道 2022 年全国卷的数学最后一道大题,不管我尝试几次,它都没办法算出来。
但,问题也不止这一点,在我测试其它的一些插件时,比如这个 ScholarAI ,它是一个能帮我查找发表在 Springer Nature 上的期刊的插件。
因为这个插件只能寻找 Springer Nature 上的内容,所以在检索时,经常会搜不到需要的文章,其次,它也无法直接帮我们阅读全文,想要阅读全文,还得点进去下载 PDF。
这种检索方式,和平常的搜索引擎基本没啥区别,还不如去直接用搜索引擎去搜索,然后自己去选择需要的论文呢。
当然了,决定 ChatGPT 的插件功能好不好,最重要的还是能不能解决问题。
大家还记得,上次 OpenAI 在发布插件预告的时候,最让人惊艳的就是对生活出行的一键解决了。
正好,公司最近组织大家去日本大阪团建,这时候谁来做这个攻略就是个互相甩锅的大问题了。
于是,不出意料地,这个问题被大家丢给 GPT 的新插件了。
结果,万万没想到翻车竟然来的如此突然。
首先我使用了 Weather Report Data(天气报道插件,这里有个伏笔),Expedia(旅游插件)还有 OpenTable(订餐插件)这三个插件去帮忙制定这几天的行程。
问了问 GPT,5 月 24 日后 5 天的天气情况,并要求它给我推荐几个好吃的、好玩。
GPT 竟然傲娇起来了,5 月 24 号,也就是未来的天气竟然不能实时显示。
直接就让隔壁的好兄弟, NewBing 看了个大笑话。
甚至连,GPT 家族中的没有联网能力的小弟弟 GPT-3 ,都凭借 2021 年的数据猜出来。(虽然明显是猜的)
多少让我有些哭笑不得了。
不过,后来咱看了看这个 Weather Report Data,发现它只提供实时的天气信息,也就是没法提供未来的天气预测,而目前还没有其它的天气预报插件。
但这样我就要吐槽了,光看名字,这个叫做“Weather Report Data”的插件,怎么看都是一个常用的天气软件吧。
就这取名规则,放在苹果商店里,可是会因为“误导性语言”要被一顿毒打,逐出苹果生态圈的。
所以咱只好再重新切换使用“Web browsing”来查询,这才知道未来的天气。
如果这还算情有可原的话,那后面的内容可就不好洗了。
首先,在我没有明确说明从哪出发的情况下,它直接给我推荐了从北京飞往日本的机票。
虽然言语间非常诚恳,甚至还表示要给我推荐大阪的租车服务。
但是有一说一,你把我 5 月 24 号的出发时间擅自改成 6 月 15 号,是不是有点不礼貌了。
其次,这次旅行的重点自然是旅游了。
于是,这个推荐的第二个项目“大阪步行游”成功地引起了我的好奇。
一个大阪步行游,就要了咱们 50 美元,关键这是步行啊。难道里头有什么大家“懂的都懂”的项目?
结果点到链接里一看,原来是悄悄给我安利了旅游跟团业务,这可就有玩“植入广告”的嫌疑了呀。
没想到 GPT 竟然比微软还要早一步引进商业元素,这不纯粹了呀。
当然了,在使用插件处理这种复杂问题的时候, GPT 也不总是出岔子的。
比如,这一回,我要求它根据天气给我推荐一个适合的菜谱。
虽然问题挺不着调的,但它还是给了我一个希腊沙拉的食谱。
然后在计算价格的过程上,最神奇的事情发生了。GPT 给了我们一个链接,我们点击之后,就可以直接进入一个叫 instacart 的购物平台。
里头关于希腊沙拉的食材全都已经加入购物车了,只要选好数量,就可以直接付款下单。
而且,在这 70 多个插件里我还发现了一个非常牛 X 的应用――Zapier 。
Zapier 本身呢是一款基于 web 的自动化工具,它能够连接到各种应用上,让它们之间可以相互协作。
而现在有了 ChatGPT 的加持,直接在对话框内就能处理工作,甚至 ChatGPT 还能帮忙打打下手。
比如说有个会议需要通知员工,直接在对话框内输入要求就行。
ChatGPT 首先会生成一个 Zap 预览,并且会自动拟好邮件的内容给我们过目。
除此之外,这回一起开放的 GPT 插件中,其实还有许多神奇的小功能。
比如高分电影、书籍推荐:
你甚至还可以和它玩一款名为 Algorithma 的模拟生活的文字游戏:
粗看起来,是有点 AI 版 APP Store 的味道了。
不过,整个测试下来,差评君还是略显失望的,整个插件系统对 ChatGPT 带来的提升有,但也没有太大,并没有之前我们预期的那样,对咱们的生活带来非常明显的改变。
说到底,插件功能,其实是让 ChatGPT 对自身的一些薄弱环节进行加强,比如提升数学能力,提升数据检索能力,增加一些基本的网站操作能力等等。
但是现在测试看来,某些插件开发得不够完善,严重影响了咱们的体验,甚至给大家一种“不如不更新”的错觉。
差评君觉得,主要还是因为,这一回的插件功能其实是由第三方,也就是由一部分获得内测资格的开发者制作的,不免会出现水平参差不齐的问题。
然而话又说回来,在大模型即将成为平台和大基建的未来,应用生态这块儿,绝对是得迈的一道槛。
毕竟,即便强如微软,不也曾吃过生态的亏。
所以,未来 ChatGPT 在生态方面要是没有所突破的话,或者说没在应用品质上做出保证的话,目前的领先地位,也未必不会被后来者给超越。
不过,话虽如此,但是考虑到目前 GPT 的新功能其实刚刚小范围测试,还有充裕的试错空间。
而且程序嘛,哪有不出 BUG 的。咱们不妨耐心一点, ChatGPT 宇宙可能才刚刚开始。
图片、资料来源:ChatGPT
本文来自微信公众号:差评 (ID:【【微信】】),撰文:晚上吃早饭、及格,编辑:江江、面线