gpt-4创造的20件最不可思议事情 chat gpt和nexchatgpt区别

互联资讯 2023-05-21 21:00:07 0

淘宝搜：【红包到手500】领超级红包，京东搜：【红包到手500】
淘宝互助，淘宝双11微信互助群关注公众号【淘姐妹】

创造gdp是指什么

一觉醒来，各种微信群直接炸了。

chatgpt凌晨直接发布了GPT-4。

一通王炸，震的头皮发麻，用流浪地球的话来说：

“起初，没有人在意这一次革命，以为这不过是一次简单的技术迭代，直到跟每个人息息相关。”

现在，我最担心的不是我们自己，而是明天下午百度的文心一言发布会。。。已经不指望争气了，别太拉胯就行。。。

一、多模态模型

GPT-4是一个多模态模型，以前的GPT-3.5，只是单模态的，你输入文本，他输出文本，即使有些邪教手段让他调用别人的接口，单是他本质上还是没有那种能力。

GPT-4的多模态很简单，你给他输入图像和文本，他给你输出文字。听起来好像也就那样，但是这毕竟是GPT，是chatgpt的作品。直接用他们自己的演示的例子做展示吧。

GPT-4对图的理解有了质的飞跃，已经不仅仅是理解图的含义了，什么识别猫识别狗这种简单的东西对GPT-4来说就是婴儿级别，他已经能正确理解理解符人类尝试、能正确理解什么叫搞笑。

你还可以直接把论文截图发给他，让他总结。

然后他们在演示视频里还弄了一个骚操作，直接在本子上画了一个网站的草稿，拍照给了GPT-4

直接网站就做好了，还特么带了HTML的代码。。。

二、理解能力的进化

而在推理和逻辑能力上，GPT-4也有了质的飞跃。

用一个简单的形象比喻：“GPT-3.5是高中生，那GPT-4就是名列前茅的研究生。”

例如给一个非常复杂的物理问题，直接以图片形式发给他。

GPT-4回答的非常牛逼。这个推导过程给我看的一愣一愣的。

这种回答个物理问题也是小儿科，GPT-4直接用非常量化的手法告诉你他有多牛逼。

这个量化方式叫：刷榜。直接把奥赛、AP、各种乱七八糟的考试给你做一遍。

这个表意思就是GPT占考试排名的百分位，最左边是微积分，然后是全美数学竞赛。之前的基本0分，都在嘲笑聪明如ChatGPT，不识加减乘除123。

现在直接超过40%多的学生。注意，这特么可是数学竞赛，不是你理解的普通数学考试。

最重要的是从左往右数第六个那个一柱擎天的条，Unifom Bar Exam，统一律师考试。

这个考试对律师有多重要不用我赘述了吧，GPT-4直接给你干碎了。

还有这个图里没写出来的课程，宏观经济学、微观经济学、统计学等等，全部满分，超过100%。

还有NLP的传统任务也全给你干碎一遍。

比如基于常识推理的HellaSwag和AI2 Reasoning Challenge (ARC)，正确率基本达到了95%以上，与真人无异，；基于专业知识学术问答的MMLU，直接爆锤现在世界上的其他模型。

然后还玩花的，把MMLU做成多语言版本，继续秀肌肉。

这块还把谷歌的PaLM模型拿出来鞭尸，你英语模型的正确率才69.3%，我小语种都比你牛逼。。。全面爆锤谷歌。

而胡说八道的情况，相比GPT-3.5，也有的相当大的进步。

三、其他

按照OpneAI的说法，他们在去年底8月就已经完成了GPT-4的训练，他们花了整整6个月时间来为GPT-4做调教，让他们复合人类场景。。。

只能说，chatgpt的技术沉淀太恐怖了，去年8月就训练完成了，那时候，其他的公司在干啥呢。。。

现在想体验GPT-4，有两种方法，一种是直接付费升级到PLUS会员，可以直接用；另一种是排队，按照前端时间NewBing、NotionAI等等各种玩法，直接先排再说，也不知道要等到猴年马月。

排队网址在此：

进去网址以后把表填了就行了。

现在压力来到了各大公司面前。但是我估计最慌的应该是百度了。各种段子扑面而来

怎么说呢，GPT-4的诞生给行业又带来了一次郑重的宣誓。

这就是第四次工业革命，旧秩序和职业消亡，新的秩序即将诞生。

最后，用《三体》叶文洁的一句经典台词作为结尾吧。

“这是，人类的落日”

gpt4深度测评全方位碾压chatgpt gpt4有多厉害

gpt 4k,gp4g,4t gpt,gpt49

继ChatGPT在互联网圈搅起波澜之后，OpenAI又发布了重磅消息，正式推出了GPT-4模型。而在GPT-4发布之后，不少用户已经上手体验，感受了一把人工智能技术惊人的能力边界。一起来看看作者的关于GPT-4的体验和分析解读吧。

今天 OpenAI 宣布推出 ChatGPT 4，ChatGPT Plus 用户在今天就能体验到。

OpenAI 称它是「最先进的系统，能生产更安全和更有用的回复」。

和上一代相比，GPT-4 拥有了更广的知识面和更强的解决问题能力，在创意、视觉输入和长内容上表现都更好了。

官方演示视频，强烈建议每个人都看一下，全程无尿点。

用在创意项目上，它能帮助用户一起创作歌曲、编写剧本或者学习用户的写作风格。

用 A-Z 开头的单词组成一段话，解释灰姑娘的故事

处理长内容上，GPT-4 能处理长至 2.5 万字的文本。把链接丢给它，然后就能让它根据文本分析和提取。

值得注意的是， GPT-4 可以直接读取 3.2 万个 token，相当于给它 25000 英文字的背景信息，就可以快速给出结论―也就是说，像律师助理这样的职业真的要被取代了。而上一个版本只能读取 4096 个token，相当于3000 英文字信息，这个版本的进步是跨越式的。

除了文本以外，你还能把图片作为输入内容给 GPT-4，它不仅能够识别出图中的物件，还能根据这些信息进一步处理内容。

据 OpenAI 介绍，GPT-4 展示了「在多种专业和学术指标下展现了人类水平的表现」：

类似于手机的跑分软件，在 ChatGPT 刚出来的时候，也有不少人用它「刷题跑分」，在 GPT-3.5 版本模型下，它的 SAT 成绩只能排倒数 10% 的水平，然而 GPT-4 模型可以超越 90% 考生的水平。

在其他考试也呈现出类似对比效果，如果光是「跑分」，ChatGPT-4 属于是可以考进哈佛、斯坦福的水平。

既然它考试那么厉害，我们学生是不是可以借助它的能力，帮助我们复习，也考上名校呢？当然用它作弊是绝对不被允许的。

更重要的是，Open AI 还说 GPT 4 比之前模型都更安全了。

在 OpenAI 的内部测试中，GPT 4 被「骗」到回复出不当答案的几率下降了 82%，聊起敏感话题时（如医疗），它的回复合规性也提高了 29%。

不过，OpenAI 也承认，即便如此，GPT-4 在「社会偏见、幻觉和对抗性提示」上仍存在限制。

OpenAI 发布时间线回顾：

2022 年 7 月：发布 DALL・E
2022 年 8 月：API 费用降低 66％
2022 年 11 月：发布 ChatGPT
2022 年 12 月：嵌入式费用大幅降低，同时保持最先进技术（SoTA）
2023 年 3 月：发布 ChatGPT API，同时保持 SoTA 并降低费用 10 倍
2023 年 3 月：发布Whisper API
今天发布：ChatGPT 4

除了官方演示中出现的指导性用例，社交媒体上也有不少尝鲜用户在玩 ChatGPT-4 了，他们给出的案例对实际应用场景更有指导意义。

Twitter 用户@skirano 用 ChatGPT-4 实现了在不到一分钟的时间里，完整编写出一部乒乓游戏「Pong」。

在算力爆发的时代里，曾被我们奉为经典的事物，将被技术的车轮无情碾压。

这个案例看得我们手痒痒，爱范儿也现用 GPT-4 模型做了「俄罗斯方块」的小游戏。

再进一步，我们还用 ChatGPT-4 模型，生成了一个可以用于计算爱范儿在 AWS 云计算的使用率的统计程序，它还可以给出节约云计算费用的建议。

我感觉一个「百晓专家」就站在我面前。

我们还对比了同一个问题在 GPT-4 和 GPT-3.5 版本下的不同问答。

详细翻读了 OpenAI 给出的技术文档后，我们发现 GPT-4 还抓取药物清单中的关键信息，包括但不限于：

找到类似类似性质的化合物；

对它们进行修改，以确保它们没有被专利保护；

从供应商处购买（甚至包括发送带有采购订单的电子邮件）。

这意味着它拥有发现新药物的能力。

Twitter 还有人直接生成了一个「一键起诉」功能，用于针对发送骚扰电话的自动拨号软件起草起诉书，要求其赔偿 1500 美元，将大大降低律师助理的工作量。

一夜之间，GPT-4 再度引领人工智能实现技术爆炸增长，明天还有百度和微软轮番登场，人工智能领域实现了「天界一天，人间一年」的景象。

这个时代属于拥有创造力和善于使用工具的人。

作者：已经尝鲜GPT-4的

来源公众号：爱范儿（ID：ifanr）；连接热爱，创造不同。

本文由人人都是产品经理合作媒体 @爱范儿授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自 Unsplash，基于CC0协议。

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

本文地址： https://www.528683.com//show-412043.html