chatgpt是通过什么完成的 Chat GPT 是什么

淘文章 2023-03-20 03:16:58 0

2023年11月20日每日一猜答案：。答案：ABC。
每日一猜答案分析：

chatgpt怎么下载,chatgpt国内能用吗,chatgpt怎么用,chatgpt原理

ChatGPT 热潮已经持续月余，目前热度依然不减。根据最新的消息，ChatGPT 的升级版 GPT-4 也已蓄势待发。回首 ChatGPT 的这波热潮，ChatGPT 是什么（定义、能力）、从哪来（如何发展）、去往哪（给行业带来哪些影响）。本文围绕这三点，力求将这几个问题阐述清楚。最后也带来这波热潮的相关思考，与大家分享。

01ChatGPT从哪来？

ChatGPT 是人工智能研究机构【【微信】】在 2022 年 11 月 30 日发布的聊天机器人程序，是一个能够进行连续对话、综合上下文内容进行交流的自然语言处理（NLP）模型。同时能够进行信息检索、写作辅助、问题解答、代码生成等多项工作。

ChatGPT 的全称是 Chat Generati【【微信】】rmer。是一种可以用于聊天的生成式预训练 Transformer。这里的 Transformer 是目前大模型中的基础结构。可以理解为 ChatGPT 是一个用于聊天的预训练语言大模型。

1.1 ChatGPT的能力之信息检索

ChatGPT 可以做信息检索，比如，你可以问她是否了解中国移动云能力中心，他会介绍中国移动云能力中心的主要业务内容；你可以问她 2018 年世界杯的世界杯冠军是哪个国家。

▲ 图3 ChatGPT进行信息检索

1.2 ChatGPT的能力之推理（Excel为例）

ChatGPT 具有超越以往的对话机器人的表现，除了传统的信息检索能力之外，也因为她还具备一定的推理能力。我们以常见的 Excel 处理为例。

首先可以让它生成一个虚拟的信息表格：包含姓名、年龄、出生日期、毕业学校、工作地点。

▲ 图4 ChatGPT处理表格

我要求她写一个Excel 函数来查找出出生日期在 1996 年之前的人的工作地点。

▲ 图5 ChatGPT函数处理Excel

她会直接告诉你 Excel 函数的写法和适用的情境。而且对函数中的内容进行解释。Office 系列软件也支持 VBA 语言编程。这里你可以进一步要求她，用 VBA 语言来编写上面这个函数。

▲ 图6 ChatGPT将函数转换为VBA编程语言

同时可以看到，函数是对每一部分都加入了中文注释，便于理解、后续修改。

最后她还会给出函数的使用建议和适用情境。

下面再以【【微信】】编程为例：

要求她写一个匹配中国手机号码格式的【【微信】】正则化表达式：

▲ 图7 ChatGPT进行【【微信】】编程

她不仅能够给出中国手机号码的匹配，而且还考虑到了如果需要匹配其他国家的电话号码，需要修改哪些内容。

ChatGPT 还有一个功能是进行写作辅助，比如你让她写一部分关于结构化研究相关工作介绍

▲ 图8 ChatGPT内容生成

她可以把 NLP 中几个主流的研究方向都列举出来。

同时也对润色进行了测试。根据 ChatGPT 润色的效果，我们发现 ChatGPT 的修改幅度不会特别大，不会改变原有的专业描述（因为训练语料的原因，ChatGPT 对学术专业领域的知识不是很擅长）。相比之下，目前的一些 AI 写作工具，会出现“为了修改而修改”的现象，反而破坏了原文本的严谨描述。

▲ 图9 ChatGPT文本润色

ChatGPT从哪来？

2.1 ChatGPT如何诞生

促成 ChatGPT 诞生的因素有很多。这里笔者挑选其中认为最重要的两个因素：一个机构：【【微信】】和一个人：【【淘密令】】r。

【【微信】】：

【【微信】】于 2015 年由 Alon Mask、PayPal 联合创始人 Peter Thiel、美国科技孵化器 Y combinator 总裁 Samuel Altman 等人联合创立。其成立目的是：通过与其他机构研究者的“自由合作”，向公众开放专利和研究成果，促进人类AI技术的发展。

▲ 图10 【【微信】】发展历程

2018 年，【【微信】】研发的 Five 人工智能选手，在 Dota2 游戏中战胜人类选手。同年，【【微信】】发布了 GPT-1。2019 年，微软向【【微信】】投资 10 亿美元，获得【【微信】】技术的商业化授权。2020 年【【微信】】发布【【微信】】 API，通过对外提供 AI 能力开始进行商业化运作。2022 年 11 月 30 日，【【微信】】发布 ChatGPT，1 月中旬微软向【【微信】】追加 100 亿美元投资，2 月 8 日发布集成了 ChatGPT 的 new Bing 新一代搜索引擎。

【【淘密令】】r：

▲ 图11 【【淘密令】】r

Ilya 是【【微信】】的联合创始人和首席科学家。正是在他的领导下，【【微信】】在开发尖端技术和推动人工智能领域的发展方面取得了重大进展。Ilya 早年师从深度学习泰斗 Geoffery Hinton。2011 年就跟导师合作构想通用人工智能（Artificial General Intelligence, AGI）。2012 年作为共同作者发表了深度学习领域的开创性工作 AlexNet。

2013 年加入谷歌。谷歌作为一个大公司，在 AI 研究领域趋向于保守的作风逐渐让 Ilya 失去吸引力。2015 年 Ilya 拒绝了谷歌开出的三倍薪资，毅然加入刚创立的【【微信】】，为人类实现 AGI 这个愿景而奋斗。在 Ilya 的带领下，【【微信】】相继在 2018、19、20 年迭代研发 GPT-1、2、3，最终2022年发布了 ChatGPT，惊艳了世界。

2.2 ChatGPT进化史

ChatGPT 是由 GPT-1 逐步发展而来。GPT 系列模型的参数量越来越大，以数量级增长，规模由 GPT-1 的 1.17 亿参数，GPT-2 的 15 亿参数，逐步发展到 GPT-3 的 1750 亿参数。而 ChatGPT 可以视为 GPT-3.5。GPT 系列模型属于生成式预训练大模型，其技术范式不同于另一种较为流行的 BERT 语言模型。BERT 语言模型采用的是“预训练+微调”的技术范式。

2.3 ChatGPT核心技术

从自然语言处理的 AI 技术范式演进上来看，2010 年前可以视为传统机器学习时代。2013 年后基于深度神经网络的 NLP 技术开始流行，这个时期出现了以循环神经网络为代表的深度语言模型。2017 年谷歌团队发表论文《Attention is all you need》，奠定了现在大模型的基础模块 Transformer。2018 年 BERT 和 GPT 预训练语言大模型相继发布，大模型技术萌芽。随后几年尤其是 2020 年后，国内外各种预训练大模型相继迭代发布，大模型技术迎来高潮。

ChatGPT 涉及几项关键技术：

超大规模预训练模型
Scaling law：大模型研究人员发现，模型能力随着模型参数的对数级增长而增强，只有足够大（大于600 亿参数）的模型才能涌现推理能力。
Prompt/Instruction learning
各种自然语言任务在 ChatGPT 中统一为 Prompt 的形式；通过 Instruction learning 等方式提高模型零样本任务处理能力。
思维链（Chain of Though）
研究发现，通过使用代码数据进行训练，语言模型出现了推理能力。这可能是因为代码实现一般都带有逻辑性（包括代码注释）。模型学到了代码的逻辑处理问题的能力。
RLHF（Reinforcement Learning from Human Feedback）

ChatGPT 相对 GPT-3 模型的一个能力提升点，就是对话的友好性。研究人员利用人类对答案的排序标注，将这种“人类偏好”通过强化学习的方式灌输到 ChatGPT 中，使得模型的输出更加友好、安全。

2.4 ChatGPT训练过程

▲ 图13 ChatGPT主要训练流程

ChatGPT棰犺鍝簺涓撲笟鐢╟hatgpt鎻愰珮瀛︿範鏁堢巼chatgpt,chatgpt是什么意思,chatgpt怎么用,chatgpt中文

3月15日

#GPT4做一个网站只要十秒#

登上热搜

ChatGPT热度还未散去

ChatGPT开发商OpenAI

发布了更强大的GPT-4

堪称“王炸”产品！

当地时间周二（3月14日），人工智能研究公司OpenAI公布了其大型语言模型的最新版本――GPT-4。

△来源：OpenAI官网

在官方演示中，GPT-4几乎只花了十来秒的时间，识别了手绘网站图片，并根据要求实时生成了网页代码制作出了几乎与手绘版一样的网站。

△图片来源：视频截图

除了普通图片，GPT-4还能处理更复杂的图像信息，包括表格、考试题目截图、论文截图、漫画等，例如根据专业论文直接给出论文摘要和要点。

此外，该公司还表示，GPT-4在许多专业测试中表现出超过绝大多数人类的水平。OpenAI还称，GPT-4参加了多种基准考试测试，包括美国律师资格考试Uniform Bar Exam、法学院入学考试LSAT、“美国高考”SAT数学部分和证据性阅读与写作部分的考试，在这些测试中，它的得分高于88%的应试者。

OpenAI表示，在内部评估中，GPT-4产生正确回应的可能性要比GPT-3.5高出40%。而且GPT-4是多模态的，同时支持文本和图像输入功能。OpenAI称，GPT-4比以前的版本“更大”，这意味着其已经在更多的数据上进行了训练，并且在模型文件中有更多的权重，这使得它的运行成本更高。

据OpenAI介绍，在某些情况下，GPT-4比之前的GPT-3.5版本有了巨大改进，新模型将产生更少的错误答案，更少地偏离谈话轨道，更少地谈论禁忌话题，甚至在许多标准化测试中比人类表现得更好。

例如，GPT-4在模拟律师资格考试的成绩在考生中排名前10%左右，在SAT阅读考试中排名前7%左右，在SAT数学考试中排名前11%左右。

OpenAI表示，已经与多家公司合作，要将GPT-4结合到他们的产品中，包括语言学习工具软件多邻国（Duolingo）、移动支付公司Stripe和可汗学院（Khan Academy）。

GPT-4模型也将以API的形式，提供给付费版ChatGPT Plus的订阅用户。开发者可以注册，用它打造应用。微软此后表示，新款的必应（Bing）搜索引擎将运行于GPT-4系统之上。

OpenAI表示，虽然两个版本在日常对话中看起来很相似，但当任务复杂到一定程度时，差异就表现出来了，GPT-4更可靠、更有创造力，能够处理更微妙的指令。“在我们的内部评估中，它产生正确回应的可能性比GPT-3.5高40%。”

此外，GPT-4还有了一个质的飞跃――可以开始处理图像。经常使用ChatGPT的人肯定知道，它只能处理文本，但GPT-4开始接受图像作为输入介质。

据Open AI演示，用户提问：解释下图的笑点是什么，并对图片中的每部分进行描述。GPT-4的回答如下图所示：

输入如下图片并询问“这张图片有什么不寻常之处”，GPT-4可作出回答“这张照片的不同寻常之处在于，一名男子正在行驶中的出租车车顶上，使用熨衣板熨烫衣服。”

据封面新闻，与早期的GPT模型一样，GPT-4仍然存在一定的局限性。

OpenAI称，它并不完全可靠，可能会出现推理错误，“GPT-4缺乏对绝大多数数据切断后（2021年9月）发生的事件的了解，并且无法从中吸取经验教训……它有时会出现简单的推理错误，它会轻信用户明显的虚假陈述，有时它会像人类一样在难题上失败，例如在它生成的代码中引入安全漏洞。”

基于此，OpenAI提醒，用户在使用语言模型时应格外小心，最好辅助以人工审查、附加上下文、或完全避免在高风险情况下使用它。

由于仅限于Plus订阅用户使用，当晚，大批新订用户涌入，以至于OpenAI的付款系统被挤爆了。

OpenAI透露，摩根士丹利正在使用GPT-4来组织数据，而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan Academy和冰岛政府。

据不完全统计，截至今年3月初，A股已有近20家上市公司宣布相关业务已经接入类似ChatGPT技术，或正在研究相关技术与数字人结合的应用场景。国盛证券在研报中表示，以GPT系列为代表的大型语言模型(LLM)能教会机器以统计方式理解自然语言，完成此前人类进行的内容读取和理解。随着多模态带来的模型全面化，人工智能将向着拥有人类解释能力这一目标更进一步。

来源：东方网综合OpenAI官网、第一财经、封面新闻、澎湃新闻、界面新闻、科创板日报

视频：孔文龙

编辑：等等、卞英豪

审稿：钱程灿

本文地址： https://www.528683.com//show-396512.html

版权声明：除非特别标注原创，其它均来自互联网，转载时请以链接形式注明文章出处。

new bing是哪个公司的

分享到：