考试能力超 90% 人类的 OpenAI GPT-4 发布，网友们为工作担忧和哀嚎

互联资讯 2023-05-16 20:56:03 0

淘宝搜：【红包到手500】领超级红包，京东搜：【红包到手500】
淘宝互助，淘宝双11微信互助群关注公众号【淘姐妹】

今天凌晨，OpenAI 公布了其大型语言模型的最新版本 ――GPT-4。该公司表示，GPT-4 在许多专业测试中表现出超过绝大多数人类的水平。

具体而言，GPT-4 实现了以下几个方面的飞跃式提升：更聪明，做题水平越来越好；支持图像输入，拥有强大的识图能力，但目前只限内部测试；更长的上下文，文字输入限制提升至 2.5 万字；回答准确性显著提高；更安全，有害信息更少。

对于普通人而言，如何理解 GPT-4 到底有多强多聪明？

据 OpenAI 透露，GPT-4 通过了所有基础考试而且是高分通过。例如，GPT-4 在模拟律师资格考试的成绩在考生中排名前 10% 左右，在 SAT 阅读考试中排名前 7% 左右，在 SAT 数学考试中排名前 11% 左右。相比之下，曾经令人震撼的 GPT-3.5 ，真实得分在倒数 10% 左右，GPT-4 的强大已经可想而知。

有网友评论，“如果真跟报告说的那样就太可怕了，我感觉能力已经远超我了。”也有人笑称，“我躺好了！我生在了适合我的时代！”

最多的声音则是对未来工作不保的担忧，“还有哪个行业可以不被替代？”“消除任何幻想，AI 时代横扫全球，先思考下 GPT-4 不能做但你能做的。”

OpenAI 称，GPT-4 比以前的版本“更大”，这意味着其已经在更多的数据上进行了训练，并且在模型文件中有更多的权重，这使得它的运行成本更高。

同时，OpenAI 并未公布这个模型的参数量有多少。

OpenAI 表示，它使用的是微软 (MSFT.US) Azure 训练模型，微软已经向这家初创公司投资了数十亿美元。OpenAI 没有公布具体模型大小的细节，也没有公布用来训练模型的硬件，理由是“竞争情况”。

目前，此领域的许多研究人员认为，人工智能领域的许多最新进展，都来自于在数千台超级计算机上运行越来越大的模型，这些模型的训练过程可能耗资数千万美元。

为了不断提高 GPT-4 性能，OpenAI 还为其研发大搞“基建”。

在过去的两年里，OpenAI 重建了整个深度学习堆栈，并与 Azure 一起为其工作负载从头开始设计了一台超级计算机。一年前，OpenAI 在训练 GPT-3.5 时第一次尝试运行了该超算系统，之后他们又陆续发现并修复了一些错误，改进了其理论基础。这些改进的结果是 GPT-4 的训练运行获得了前所未有的稳定。

OpenAI 联合创始人兼总裁格雷格?布罗克曼（Greg Brockman）表示，OpenAI 预计，未来将由投资十亿美元超级计算机的公司开发尖端模型，一些最先进的工具将带有风险。OpenAI 希望对他们工作的某些部分保密，以给初创公司“一些喘息的空间，以真正关注安全并做好它。”

尽管功能已经非常强大，但 GPT-4 仍与早期的 GPT 模型具有相似的局限性，其中最重要的一点是它仍然不完全可靠，也就是还有可能胡说八道。

OpenAI 也警告称，GPT-4 还不完美，在许多情况下，它的能力不如人类。该公司表示：“GPT-4 仍有许多已知的局限性，我们正在努力解决，比如社会偏见、幻觉和对抗性提示。”

总的来说，GPT-4 相对于以前的模型（经过多次迭代和改进）已经显著减轻了幻觉问题。在 OpenAI 的内部对抗性真实性评估中，GPT-4 的得分比最新的 GPT-3.5 模型高 40%。

同时，GPT-4 训练数据还是截止到 2021 年 9 月份。这也意味着，GPT-4 对于这个时间点以后的信息，缺乏足够的了解，也不会从其经验中学习。

在 GPT-4 发布之后，OpenAI 创始人阿尔特曼发推文表示：“它仍然是有缺陷的，仍然是有限的，在你花了更多的时间第一次使用它时，它似乎比实际情况更令人印象深刻。”

最令人震惊的在于，按照 demo 视频里 OpenAI 工程师们的说法，GPT-4 的训练在去年 8 月就已经完成，剩下的时间都在进行微调提升，以及最重要的去除危险内容生成的工作。

这也意味着，OpenAI 内部技术，比大家想象中的领先外界更多年。更可怕的是，OpenAI 还一口气开放了 API 接口和相关论文！这让中国的 ChatGPT 们还怎么追？

英诺天使基金合伙人王晟曾告诉《态℃》栏目，“中国的 ChatGPT 们即便奋起直追，静态来讲也许两三年能追上，我认为已经很乐观了。”

但随着更强大的 GPT-4 发布，OpenAI 的技术能力显然仍在不断进步，且进展速度远比我们追的速度还要快。王晟在之前的采访中判断，“除非这件事突然遇到了一个瓶颈，整个科技发展方向到头了，对方不得不停下来，或许我们还有机会追平，或者我们挖掘到一种新的技术路径有机会追上，不然可能没有机会了。”

与此同时，在该模型的落地和应用方面，OpenAI 也有了最新进展。

新模型将提供给 ChatGPT 的付费用户，也将作为 API 的一部分提供，允许程序员将 AI 集成到他们的应用程序中。OpenAI 将对 750 字左右的指令信息收费 3 美分，对 750 字左右的响应信息收费 6 美分。

OpenAI 还介绍，摩根士丹利正在使用 GPT-4 来组织数据，而电子支付公司 Stripe 正在测试 GPT-4 是否有助于打击欺诈。其他客户还包括语言学习公司 Duolingo、Khan Academy 和冰岛政府。OpenAI 合作伙伴微软周二表示，新版必应搜索引擎将使用 GPT-4。

GPT-4 取得的成绩令人兴奋，但对于还在起跑线上的中国 ChatGPT 们，还有大量的工作要去探索和研究，想必感受到了巨大的压力。风浪越大鱼越贵，对于这些迅速进入这个新领域的公司来说，也将会拥有巨大的机会。

GPT-4 的强大告诫我们，未来唯一限制的因素，就是你的想象力！

来源：网易科技

免责声明：本文转自网络，仅代表作者个人观点，与IT果微网无关。其原创性以及文中陈述文字和内容（包括图片版权等问题）未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。

gpt最新发布 gpt比以前的ai高级在哪

gop gpt,gpt-3百度百科,gpt,gpt+

15日一早，创投圈与互联网行业都在热议chatgpt发布的多模态大型语言模型GPT-4――其回答准确性更高，解决问题能力更强，可以处理超2.5万字的文本，并支持图像输入。但由于图像输入仍未公开，用户暂时不能体验。

ChatGPT的火热让投资人群体今年开年后密集出差。通过观察，创新工场执行董事兼前沿科技基金总经理任博冰发现现状“挺有意思的”。各个领域的创业者都在进入这个领域，有时有些人会讲一些自己都不一定能够实现的故事，而冷静的创业者们已经根据新能力的体现，在尝试和摸索过程中得到更好的结论和路径。

对于国内人工智能公司而言，恐惧者有之，焦虑者有之，看到机遇准备打场翻身仗的亦有众多。多位接受第一财经记者采访的从业者表示，chatgpt为人工智能的火热创造出新的机遇，但中国公司需结合自身特点与国情，走出不一样的“活路”。

AI 2.0拐点来临

虽然GPT-4训练运行呈现出更强的稳定性，产生的错误答案更少，但有时也会产生不准确或不相关的回答。chatgpt表示，与之前的GPT版本相比，GPT-4存在类似局限，目前仍然不完全可靠，它容易产生“幻觉”，产生推理错误。以及，“GPT-4通常缺乏对大部分数据被切断后(2021年9月)发生事件的了解，也没有从经验中吸取教训。”“它有时会犯一些简单的推理错误，接受用户的明显虚假陈述。有时它也会像人类一样在棘手的问题上失败，比如在它生成的代码中引入安全漏洞。”chatgpt方面表示。

对于此次GPT-4发布所带来的行业震动，Forrester分析师卢冠男对第一财经表示，技术方面，由于 chatgpt目前披露的技术信息有限，这无疑增加了其他技术厂商与其竞争的难度；工程实现方面，得益于chatgpt与微软的合作而获得的超算资源，使得 chatgpt能和其他不具备算力优势的企业拉开差距；商业化方面，微软与 chatgpt的紧密合作能够更好地帮助 chatgpt构建生态。

上述多方面的优势叠加先发优势，使得chatgpt的进展速度超越其他所有同类公司。卢冠男称，讨论技术层面差距时，一方面是关注中美差距，另一方面是关注在这一领域的科技公司与 chatgpt的差距。不仅是中国公司，美国的科技公司也没法做到同时在技术和商业层面追赶上 chatgpt。虽然这不是短期能改善的，但长期来看，特别是结合具体应用场景后，中国企业仍然具备追赶的空间。

任博冰对第一财经记者表示，此次GPT-4在多模态上虽然没有超出预期的颠覆，但在能力质量上大幅提升，且在工程上给出了新的启发，能够支撑大批高质量的AI 2.0产品的爆发。

在创新工场董事长兼首席执行官李开复看来，深度学习取得重大突破后，AI已经来到从1.0迈入2.0的拐点。多模态、巨型数据集的飞速发展，AI优化目标函数及训练模型的技术方法将大幅精进，能更好地模拟人类的认知智能。此外，AI2.0将会带来平台式的变革，改写用户的入口和界面，诞生全新平台催生新一代 AI 2.0应用的研发和商业化。

李开复所定义的AI 1.0是以CNN卷积神经网络模型为核心的计算机视觉技术，拉开AI 感知智能时代的序幕，AI 1.0也遇到了瓶颈。

而AI 2.0 的巨大跃迁在于克服了前者单领域、多模型的限制，可以用无需人工标注的超级海量数据去训练一个具有跨领域知识的基础大模型（Foundation Model），通过微调等方式适配和执行五花八门的任务，真正有望实现平台化的效应，进而探索商业化的应用创新机会。

AI2.0的机会在哪里？

无论如何，焦虑感已经在中国产业界蔓延。旷视科技联合创始人兼CEO印奇表示，整体来说，中国AI行业已经算挺争气了。其次，美国在中国最为人所熟知的除了大厂之外，就是DeepMind和chatgpt，美国在纯技术创新方面确实有更大的资金量，且长期投入，而中国AI公司仍面临相对短周期商业化的压力。

从务实角度来看，印奇称，中国AI公司不可能具备类似chatgpt和DeepMind的研发条件。因此，中国企业一方面要用最艰苦朴素与节约的方法做技术科研。其次，别有幻想，在中国AI公司想活得长必须要商业化。

作为从科研侧转型至业务侧的创业者，澜舟科技创始人兼CEO周明认为创业公司的长板是能够快速迭代，落地容易，短板便是GPU资源与人力成本需要考虑，不适合追风大模型，过早将钱烧没了，“千亿万亿的成本别说小公司，BAT也烧不起这么多钱。”

其次，周明表示，需审时度势，先花几千万元人民币的价格训练出百亿或千亿参数的模型，这是初创公司可承受的，再为客户点对点地提供服务，进行业务落地，“不要想着将所有能力都做到极致后再去挣钱，不需要全面超越chatgpt，找到自己的发展空间再滚雪球到其他领域，甚至研发更多AGI（通用人工智能）能力也是可期待的，但路要一步步地走。”周明称。

印奇认为，国内行业还是需要有极强的危机感，GPT4到5还有更多技术迭代。GPT3.5是更重要的节点，至少可以让行业建立共同的基准线。如果是GPT4到5的程度，行业投入至少是一个跨越10亿美元起跳的差距，门槛较高。

中美之间有差距但可追赶

经过多方考察，任博冰也认为真正优秀的项目在这个阶段非常少，但任博冰相信在一段时间的发酵以及创业者之间碰撞、试错之后，有些行业新的需求会诞生，“只不过现在的时间点早了些”。

另外，任博冰称，国内整体在应用层与模型层的公司越来越多了，虽然相对来说美国创业公司冒出头的速度更快一些――近乎每天都有十个，国内稍微少一点。但中国创业者在产品创新层面的能力完全不亚于美国创业者，在面临不同路径选择方面――如可控性这件事上，美国公司也并没有给出更好的解决方案。

作为人工智能三大基石――算法、算力、数据，算力问题一直被行业认为在制约中国企业追赶的核心因素，行业已尝试通过多种方式进行缓解。

在算法领域，腾讯将混元等大模型的相关能力用在产业场景中，通过腾讯云TI平台对外输出能力，方便客户自己做数据训练，目前已有八个行业超过五十家用户使用了这个能力。在工业领域，富驰高科算了一笔账，通过TI平台，工作效率是原来人工的20倍，在机器持续满载生产的情况下，一年可为公司节省数千万元成本。在算力领域，腾讯云异构计算产品负责人宋丹丹表示，紫霄是腾讯面向AI推理场景的自研芯片，沧海是腾讯自研的视频编解码芯片，目前先在自研业务上部署。

下游领域，任博冰认为中美差距很大，完全照搬美国利用API接口的方式在中国并不完全适用，中国消费者的基数、使用习惯，近些年在企业市场发展出不同的走向。

所以中国公司必须先将底座做好，对用户进行统一了解，且具备快速迭代的能力，这都是中国企业做大模型必须面对的现实，“快速复制一个ChatGPT然后快速赚钱的想法，我个人认为非常幼稚。”周明表示。

如果要从AI去颠覆之前的产品，任博冰认为创业者需谨慎思考之前哪些领域的产品做得好，哪些要素是不能解决的。如果要做一个新的产品，无论是To C还是To B，要小步快跑地去验证和试错，这里面需要的还是大胆想象。

周明表示，ChatGPT得到了很好的“包装”，体现出大模型与通用能力，以及AGI的产业力。但中国企业会走出中国特色，如每个功能做到更加可控、To B落地方面走在ChatGPT前面等，甚至形成所谓武林帮派中的“中国派”，将中国特色发挥到极致。这是行业目前需要思考的问题。返回搜狐，查看更多

责任编辑：

本文地址： https://www.528683.com//show-409722.html