训练个中文版ChatGPT没那么难：不用A100，开源Alpaca-LoRA＋RTX 4090就能搞定

互联资讯 2023-04-01 02:30:03 0

淘宝搜：【红包到手500】领超级红包，京东搜：【红包到手500】
淘宝互助，淘宝双11微信互助群关注公众号【淘姐妹】

训练下载地址,训练中英文,训练app,训练教程

机器之心报道

机器之心编辑部

Alpaca-LoRA 将微调类 ChatGPT 模型的算力需求降到了消费级，训练个自己的中文对话模型真就没那么难了。

2023 年，聊天机器人领域似乎只剩下两个阵营：「OpenAI 的 ChatGPT」和「其他」。

ChatGPT 功能强大，但 OpenAI 几乎不可能将其开源。「其他」阵营表现欠佳，但不少人都在做开源方面的努力，比如前段时间

Meta 开源的 LLaMA

LLaMA 是一系列模型的总称，参数量从 70 亿到 650 亿不等，其中，130 亿参数的 LLaMA 模型「在大多数基准上」可以胜过参数量达 1750 亿的 GPT-3。不过，该模型并没有经过指令微调（instruct tuning），因此生成效果较差。

为了提高模型性能，来自斯坦福的研究者帮助其完成了指令微调的工作，训练了一个名为

Alpaca

（羊驼）的 70 亿参数新模型（基于 LLaMA 7B）。具体来说，他们让 OpenAI 的 text-da【【微信】】模型以 self-instruct 方式生成 52K 指令遵循（instruction-following）样本，以此作为 Alpaca 的训练数据。实验结果表明，Alpaca 的很多行为都与 text-da【【微信】】类似。也就是说，只有 7B 参数的轻量级模型 Alpaca 性能可媲美 GPT-3.5 这样的超大规模语言模型。

对于普通研究者来说，这是一种切实可行的廉价微调方式，不过需要的运算量仍然较大（作者表示他们在 8 个 80GB A100 上微调了 3 个小时）。而且，Alpaca 的种子任务都是英语，收集的数据也都是英文，因此训练出来的模型未对中文优化。

为了进一步降低微调成本，另一位来自斯坦福的研究者 ――Eric J. Wang 使用 LoRA（low-rank adaptation）技术复现了 Alpaca 的结果。具体来说，Eric J. Wang 使用一块 RTX 4090 显卡，只用 5 个小时就训练了一个和 Alpaca 水平相当的模型，将这类模型对算力的需求降到了消费级。而且，该模型可以在树莓派上运行（用于研究）。

LoRA 的技术原理。LoRA 的思想是在原始 PLM 旁边增加一个旁路，做一个降维再升维的操作，来模拟所谓的 intrinsic rank。训练的时候固定 PLM 的参数，只训练降维矩阵 A 与升维矩阵 B。而模型的输入输出维度不变，输出时将 BA 与 PLM 的参数叠加。用随机高斯分布初始化 A，用 0 矩阵初始化 B，保证训练的开始此旁路矩阵依然是 0 矩阵（引自：https://finisky.github.io/lora/）。LoRA 的最大优势是速度更快，使用的内存更少，因此可以在消费级硬件上运行。

Eric J. Wang 发布的 Alpaca-LoRA 项目。

项目地址：【【网址】】/tloen/alpaca-lora

对于想要训练自己的类 ChatGPT 模型（包括中文版类 ChatGPT）但又没有顶级算力资源配置的研究者来说，这无疑是一大惊喜。因此，在 Alpaca-LoRA 项目问世后，围绕该项目的教程和训练成果不断涌现，本文将介绍其中的几个。

如何使用 Alpaca-LoRA 微调 LLaMA

在 Alpaca-LoRA 项目中，作者提到，为了廉价高效地进行微调，他们使用了 Hugging Face 的 PEFT。PEFT 是一个库（LoRA 是其支持的技术之一），可以让你使用各种基于 Transformer 的语言模型并使用 LoRA 对其进行微调。好处在于，它允许你在一般的硬件上廉价而有效地微调模型，并有较小的（也许是可组合的）输出。

在近期的一篇博客中，几位研究者介绍了如何使用 Alpaca-LoRA 来微调 LLaMA。

使用 Alpaca-LoRA 之前，需要具备一些先决条件。首先是 GPU 的选择，得益于 LoRA，现在你可以在 N【【微信】】这样低规格 GPU 或 4090 消费级 GPU 上完成微调；此外，你还需要申请 LLaMA 权重，因为其权重并不对外公开。

先决条件具备了，接下来就是如何使用 Alpaca-LoRA。首选你需要克隆 Alpaca-LoRA 存储库，代码如下：

其次，获取 LLaMA 权重。将下载到的权重值存储到名为 uncon【【微信】】文件夹里，文件夹层次结构就像下面这样：

权重存储好后，接着使用以下命令将 PyTorch checkpoint 的权重转换为 transformer 兼容的格式：

得到最终的目录结构应该是这样的：

处理好上述两步，来到第三步，安装 Cog：

第四步来到微调模型，默认情况下，微调脚本上配置的 GPU 功能较弱，但如果你有性能更好的 GPU，则可以在 finetune.py 中将 MICRO_BATCH_SIZE 增加到 32 或 64。此外，如果你有指令调优数据集，则可以在 finetune.py 中编辑 DATA_PATH 以指向自己的数据集。需要注意的是这一项操作应该确保数据格式与 alpaca_data_cleaned.json 相同。接下来运行微调脚本：

微调过程在 40GB A100 GPU 上花费 3.5 小时，对于处理能力较低的 GPU 则需要更多时间。

最后一步用 Cog 运行模型：

教程作者表示，在完成以上步骤之后，大家可以继续尝试各种玩法，包括但不限于：

带上你自己的数据集，微调你自己的 LoRA，比如微调 LLaMA，让它像动漫角色一样说话。参见：【【网址】】/blog/fine-tune-llama-to-speak-like-homer-simpson

将模型部署到云平台上；

结合其他 LoRA，比如 Stable Diffusion LoRA，把这些都用到图像领域；

使用 Alpaca 数据集（或其他数据集）微调更大的 LLaMA 模型，并查看它们的表现。这应该可以通过 PEFT 和 LoRA 实现，尽管它需要更大的 GPU。

Alpaca-LoRA 的衍生项目

尽管 Alpaca 性能可以媲美 GPT 3.5，但其种子任务都是英语，收集的数据也都是英文，因此训练出来的模型对中文并不友好。为了提升对话模型在中文上的效果，我们看看都有哪些比较好的项目。

首先是来自华中师范大学、商汤科技等机构开源的中文语言模型骆驼 (Luotuo)，该项目基于 LLaMA、Stanford Alpaca、Alpaca LoRA、Japanese-Alpaca-LoRA 等完成，单卡就能完成训练部署。有意思的是，他们之所以将模型名字命名为骆驼，是因为 LLaMA（大羊驼）和 alpaca（羊驼）都属于偶蹄目 - 骆驼科。这样看来，起这个名字也在意料之中。

这个模型是在 Meta 开源的 LLaMA 基础上，参考 Alpaca 和 Alpaca-LoRA 两个项目，对中文进行了训练。

项目地址：【【网址】】/LC1332/Chinese-alpaca-lora

目前该项目释放了两个模型 luotuo-lora-7b-0.1、luotuo-lora-7b-0.3，还有一个模型在计划中：

下面是效果展示：

不过 luotuo-lora-7b-0.1（0.1）、luotuo-lora-7b-0.3（0.3）还是有差距的，在用户询问华中师范大学地址时，0.1 回答错误：

除了进行简单的对话外，还有人在保险相关领域进行了模型优化。据这位推特网友表示，借助 Alpaca-LoRA 项目，他输入了一些中文保险问答数据，最后效果也不错。

具体来说，作者训练中文版 Alpaca LoRa 用了 3K 多条中文问答保险语料，实现过程使用了 LoRa 方法，并微调 Alpaca 7B 模型，耗时 240 分钟，最终 Loss 0.87 。

图源：【【网址】】/nash_su/status/1639273900222586882

以下是训练过程和结果：

测试结果表明：1. 训练语料相关内容都能有大概合理的回复，但仅限于不胡说 2. 非语料相关内容则会强行回复某个语料内的数据 3. 逻辑推理数学计算则没有这个能力。

看到这个结果后网友纷纷喊要失业了：

最后期待更多的中文对话模型加入进来。

参考链接：【【网址】】/blog/fine-tune-alpaca-with-lora?continueFlag=4ecae39885197【【微信】】

寰蒋鏂版悳绱㈠紩鎿庡紩鍏hatgpt 寰蒋鎼滅储寮曟搸寮曞叆chatgpt

寰寰是谁,寰螽百度百科,寰寰怎么读音是什么

本文目录一览：

1、chatpgt是什么
2、百度文心一言是什么？你对文心一言有什么期待？
3、微软和OpenAI研发的ChatGPT有哪些优势？
4、ChatGPT会取代人工吗？
5、chat gpt对教育的影响
6、人工智能会不会取代人类？

ChatGPT是OpenAI开发的大型预训练语言模型。这是GPT-3模型的一个变体训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI，经过训练可以在对话中生成类似人类的文本响应。

ChatGPT背后的算法基于Transformer架构训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI，这是一种使用自注意力机制处理输入数据的深度神经网络。Transformer架构广泛应用于语言翻译、文本摘要、问答等自然语言处理任务。ChatGPT可用于创建能与用户进行对话的聊天机器人。这对客户服务很有用训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI，因为它提供了有用的信息或只是为了好玩。

ChatGPT使用方法和注意事项:

支持中文和英文训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI，都可以问，它不是Siri这种机器人，训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI他是一种生产力的工具，要把它当作真实的人来对话，可以让它改进，支持上下文多轮对话，放心大胆的问，每次回答的字数有应该有限制，可以使用“继续问”等来追问，它会继续写。

AI届已经进入新的范式，学会提问题会越来越重要

百度文心一言是每日更新的一句古诗词，旨在激发读者的思考，增强文人文魂。我期待文心一言能够带给我更多美好的文学体验，更深刻的文化意境，以及更多有趣的历史故事。

进入3月中旬，全球科技巨头再次竞相亮相大语言模型赛道。

一周之内，开发出ChatGPT的美国初创公司OpenAI，对OpenAI投入巨资的科技巨头微软，以及中国互联网龙头企业百度，相继发布了在大语言模型（LLM）领域的最新动态。这也再次引发了全球对该领域的关注。

当地时间3月14日，OpenAI公布了其大型语言模型的最新版本――GPT-4，它比GPT-3.5的问答质量和技术都有明显提升。

3月16日下午，百度开启新一代大语言模型、生成式AI产品文心一言测试，从而成为第一家加入该赛道竞争的中国企业。

在发布会现场，百度创始人、董事长兼首席执行官李彦宏通过问答的形式，展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等五个使用场景。几个小时后，微软宣布，将把GPT-4接入Office全家桶，新名为“Microsoft 365 Copilot”。

正如财经E法在2月17日发布的文章（OpenAI独家回应｜ChatGPT为何不向所有中国用户开放注册？）所述，中国内地和中国香港的手机号均无法注册ChatGPT账号。此外，虽然OpenAI的应用程序编程接口（API）已向161个国家和地区开放，但不包括中国内地和中国香港。

一方面，业界普遍关注，在AIGC（生成式人工智能）势不可挡的科技浪潮中，谁将成为下一个弄潮儿？另一方面，在中美科技竞合的敏感期，各方亦颇为关注百度迈出的第一步带来的涟漪，以及中国企业该如何应对。

01“真的ready了吗？”

3月16日，李彦宏身着白衬衫和运动鞋演讲。开场就直面疑问，“最近一段时间，很多朋友问我，为什么是今天，你们真的ready了吗”？

李彦宏的回答是，虽然百度已投入AI研究十多年，为发布文心一言做了充分准备，但“不能说完全ready了”，因为文心一言对标ChatGPT、甚至是GPT-4，门槛很高，还“有很多不完美的地方”。但他强调“一旦有了真实的人类反馈，文心一言的进步速度会非常快”。

李彦宏解释，之所以选择当天发布，是因为市场有需求：客户和合作伙伴都希望能早一点用上最新最先进的大语言模型。

如何理解李彦宏所言的“对标GPT-4的门槛很高”？

当地时间3月14日，OpenAI公布了其大型语言模型的最新版本――GPT-4。值得注意的是，GPT-4是大型的多模态模型，即能够接受图像和文本类型的输入。而GPT-3.5只能接受文本输入。

在演示视频中，OpenAI总裁兼联合创始人格雷格・布罗克曼(Greg Brockman)用笔和纸画了一幅网站草图，并将图片输入GPT-4。仅1到2秒后，GPT-4就生成了网页代码，制作出了与草图高度相似的网站。根据OpenAI发布的实验数据， GPT-4模型相较前一代GPT-3.5已取得了巨大的进步，在许多专业测试中表现出超过绝大多数人类的水平。

浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林认为，文心一言未来还有待全面开放来获得用户检验。无论是通过B端API还是直接向C端用户开放，用户体验口碑都是硬道理。当前ChatGPT没对中国用户开放，在国内市场，百度将获得先发优势。

对OpenAI和百度的产品均做过测评的艾媒咨询CEO兼首席分析师张毅表示，GPT系列大模型，包括GPT-4与文心一言本质上都是同一类产品，只是它们各自的数据覆盖范畴和数据模型的积累长短不一。从短期看，OpenAI的产品准备时间相对更加充足，智能程度暂时领先一些。但是对文心一言而言，能在这么短的时间内训练出这样的一个产品，也是非常了不起的。

同时，张毅也对百度做出更好产品更有信心，他的理由是，从人工智能、大数据、大模型的人才储备来看，中国会更有优势。

中央财经大学数字经济融合创新发展中心主任陈端则认为，与海外竞争对手相比，百度最大的优势是立足本土，构建了语言和文化层面理解的护城河。

作为中国公司研发的大语言模型产品，文心一言的中文理解能力备受关注。重要原因是，此前很多评论人士认为，ChatGPT的中文问答能力不如英文问答能力强。

李彦宏表示，作为扎根于中国市场的大语言模型，文心一言具备中文领域最先进的自然语言处理能力。在现场展示中，文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论，还用“洛阳纸贵”创作了一首藏头诗。

李彦宏称，文心一言的训练数据包括：万亿级网页数据，数十亿的搜索数据和图片数据，百亿级的语音日均调用数据，以及5500亿事实的知识图谱等，这让百度在中文语言的处理上能够独一无二。

受访专家也指出，由于汉语的特殊性，中国企业在研发大模型时面临的难度更大，但若突破了，也会在提供本土服务时，具备更大的优势。

法国里昂商学院人工智能与商业分析教授丁文v日前对媒体指出，语言对话模型训练，需要让机器对文字产生理解，英语比中文稍微容易一些。丁文v解释，中国人工智能技术所处理的中文语言，大多都是象形词，而英文是解释性的，相较而言词语也并非特别丰富。

此外，上海交通大学约翰・霍普克罗夫特计算机科学中心助理教授林洲汉认为，未来大语言模型大概率会往多模态、交互式的方向发展，进一步将视觉、语音、强化学习等领域的技术综合进来。李彦宏也表示：“多模态是生成式AI一个明确的发展趋势。未来，随着百度多模态统一大模型的能力增强，文心一言的多模态生成能力也会不断提升。”

在多模态生成方面，李彦宏展示了文心一言生成文本、图片、音频和视频的能力。文心一言在现场用四川话朗读了一段内容，并根据文本生成了一段视频。但李彦宏透露，文心一言的视频生成成本较高，现阶段还未对所有用户开放，未来会逐步接入。

受访专家也指出，由于汉语的特殊性，中国企业在研发大模型时面临的难度更大，但若突破了，也会在提供本土服务时，具备更大的优势。

发布会前后，百度的股价经历了大落大起。3月16日，港股百度盘中股价跌幅一度扩大超10%，报120.1港元。截至收盘，百度股价跌幅为6.36%，报125.1港元。但百度股价在美股势头强劲，当日百度美股开盘低开高走，振幅超7%。截至收盘，报138.16美元，涨幅为3.8%。3月17日，百度港股表现强势，盘中一度大涨超15%。截至当日收盘，百度港股涨幅为13.67%，报142.2港元。

文心一言宣布开启邀请测试一小时内，排队申请文心一言企业版API调用服务测试的企业用户已达3万多家，申请产品测试网页多次被挤爆，百度智能云官网流量飙升百倍。

文心一言的市场热度持续飙升，资本市场也给予了价值重估。张毅认为，这也代表了公众对大语言模型/生成式AI “既期待，又担忧，然后是希望”的心情。

02谁都不能错过的科技革命

事实上，“真的ready了吗？”并不仅针对百度，也是伴随此轮“ChatGPT”热潮以来，公众普遍的疑问。

李彦宏观察到，从2021年开始，人工智能技术开始从“判别式”向“生成式”转变。

创新工场董事长兼CEO李开复3月14日在一场趋势分享会上表示，AI 2.0时代的第一个现象级应用，就是以GPT-4为代表的AIGC，又称生成式AI（Generative AI）。李开复表示，AI2.0 是绝对不能错过的一次革命，它将会是一个巨大的平台性机会，这个机会将比移动互联网大十倍。他还表示，AI 2.0也是中国在AI领域的第一次平台角逐机会。

受访专家普遍认为，此前全世界的AI企业都遇到了一个极大的问题：即使技术储备十分丰富，AI应用并没有给它们带来丰厚的收益。造成这一问题的原因在于，AI产品的应用主要集中在B端（企业用户）和G端（政府用户），AI产品在进入企业或机构时往往流程复杂，这在某种程度上会限制AI产品在市场上的快速扩张。

因此，张毅认为，AIGC的产品应用方向在C端更有可能产生巨大的商业机会。他分析说，在美国市场，此前C端市场被谷歌、亚马逊、Meta等企业抢占，让微软压力非常大，更需要一款产品来扳回一局。在中国市场，百度的优势和谷歌一样，都有强大的搜索引擎对数据的抓取能力，以及储存、整理、分析能力的基础。中国本身拥有十几亿人口的巨大市场，百度完全可以做得很优秀。

“百度和微软、谷歌本质上是两个不同市场的竞争，所以我相信文心一言以及系列产品也一定会跑出来。”张毅说。

李彦宏坚称，文心一言不是“中美科技对抗的工具”。但他也承认，ChatGPT 的成功，加快了百度推出该产品的进度。

百度CTO王海峰表示，人类进入AI时代，IT技术的技术栈可以分为四层：芯片层、框架层、模型层和应用层。百度是全球为数不多、在这四层进行全栈布局的人工智能公司，在各个层面都有领先业界的自研技术。例如，高端芯片昆仑芯、飞桨深度学习框架、文心预训练大模型以及搜索、智能云、自动驾驶、小度等应用。王海峰认为，百度全栈布局的优势在于，可以在技术栈的四层架构中，实现端到端优化，大幅提升效率。

文心一言与ChatGPT一样，都使用了SFT（模型微调）、RLHF（从人类反馈中进行强化学习）以及Prompt（提示）作为底层技术。此外，文心一言还采用了知识增强、检索增强和对话增强技术。王海峰表示，这三项是百度已有技术优势的再创新。

陈端认为，在当前技术创新的集成性越来越高的当下，全栈式布局的单一公司在内部技术研发统筹能力和后期商业化进行中的协同能力上具有比较优势。

信心很重要，但差距无法忽视。

在本月初的两会期间，中国科技部部长王志刚在回应ChatGPT相关的问题时，用足球打比方，指出中国还有很多工作要做。“踢足球都是盘带、射门，但是要做到梅西（足坛巨星利昂内尔・梅西）那么好也不容易。”

王志刚指出，中国在这方面也作了很多布局，在该领域的研究也进行了很多年，并且有一些

成果，“但目前要达到像 OpenAI 的效果可能还要拭目以待”他补充道。

王志刚说，ChatGPT出来以后，引起了大家的关注。实际从技术本身源头来讲，它叫做NLP、NLU，也就是自然语言处理和自然语言理解。ChatGPT之所以引起关注，在于它作为一个大模型，有效结合了大数据、大算力、强算法，计算方法有进步。同样一种原理，做得有区别。比如大家都能做出发动机，但质量是有不同的。

然而，无论是ChatGPT还是文心一言，其背后的大语言模型是核心竞争力。北京大学王选计算机研究所研究员赵东岩告诉财经E法，国内大模型在数据、训练方法和费用投入方面和OpenAI还有一定差距。

一位科技系统人士则对财经E法指出，客观而言，中美目前在该领域的基础研究成果差距较大。这些基础研究成果包含自然语言处理（NLP）、数据库、GPU产品，“美国切断GPU芯片（的供应），（中国的）算力就跟不上”。

大型算力的核心在于高性能GPU芯片。北京航空航天大学软件学院助理教授周号益告诉财经E法，在GPU芯片等计算硬件上，中国与国际的差距在十年左右，硬件水平会严重制约大语言模型以及科学计算类模型的发展。

周号益认为，在技术和模型上，中国的科技公司与OpenAI并没有代差，差距仅在五年以内，在一些较小的技术领域差距只有2-3年。在数据采集方面，以GPT-3大模型为例，其训练的语料中中文只占5%，中国科技企业对中文语料的积累具有一定优势，因此极有可能在中文领域实现突破。

03巨头下一步：构建生态

对于以ChatGPT为代表的大语言模型赛道如何实现盈利，是各方公认的难题（ChatGPT爆火的冷思考：盈利难题与治理挑战）。

开发出ChatGPT的OpenAI仍是一家亏损中的创业公司。而2023年1月，投资银行摩根士丹利（Morgan Stanley）的一份分析报告称，ChatGPT的一次回复成本大约是谷歌搜索查询平均成本的6倍-28倍。

但腾讯研究院高级研究员曹建峰和经纬创投前副总裁庄明浩都认为，ChatGPT能带来多少盈利，并不是OpenAI关注的重点，重点是基于它的模型能长出什么样的服务和应用，从而构建起一个生态系统。“ChatGPT的发展需要一个产业生态，比如它和微软相关应用的融合就是很好的思路。”曹建峰说。

当地时间3月15日，微软副总裁兼消费者首席营销官余瑟夫・梅迪发文表示，新版必应搜索引擎已经在 GPT-4 上运行。另据OpenAI披露，GPT-4是在微软Azure AI 超级计算机上进行训练的，并将基于Azure 的AI基础架构向世界各地的用户提供 GPT-4服务。

谷歌则宣布开放其大语言模型PaLM的API接口，并推出面向开发者的工具MakerSuite。通过PaLM API 接口，开发者们可以将PaLM用于各种应用程序的开发。MakerSuite则可以让开发者快速对自己的想法进行原型设计，并且随着时间的推移，该工具将具有用于快速工程、合成数据生成和自定义模型调整的功能。

微软迅速跟进。当地时间3月16日，微软宣布将把GPT-4接入Office全家桶。新功能名为“Microsoft 365 Copilot”。

李彦宏则在发布会上表示，文心一言定位于人工智能基座型的赋能平台，将助力金融、能源、媒体、政务等千行百业的智能化变革。

根据文心一言的邀请测试方案，3月16日起，首批用户可通过邀请测试码，在文心一言官网体验产品，后续将陆续开放给更多用户。此外，百度智能云即将面向企业客户开放文心一言API接口调用服务。该服务于3月16日起开放预约。

截至3月18日早11点，排队申请百度智能云文心一言企业版API调用服务器测试的企业用户增加到9万家，百度收到关于文心一言合作的咨询 6588条。

陈端认为，这一轮的竞争，不仅是商业主体的竞争，实际上也是关乎下一轮国家数字竞争力的竞争。所以，百度的当务之急不完全是技术层面的研发，也需要引领更多初创型企业、生态合作伙伴加盟生态阵营。

在陈端看来，中国在构建生态系统上具有优势。陈端指出，中国的移动互联网经过多年发展，应用层生态化的配套创新已经非常成熟。应用层的很多中小微创业团队，在过去配合移动互联生态做了大量的局部、垂类场景端的创新，把过去的这种模式以及底层基础设施从移动互联迁移到大模型领域依然适用。

04中小企业还有机会吗？

面对大语言模型的浪潮，中国企业该如何抓住机遇，避免风险？

在中国，布局ChatGPT的企业有两种类型：第一种是传统的互联网大公司，第二种是一些初创企业。

陈端认为，目前市场上的初创公司已经错过了布局大模型的初始创业阶段。陈端分析说，

重新打造生成式AI企业，跟时机、底层的生态支撑度，还有创始人自身的阅历、经验、视野、个人IP的自然调动能力都是息息相关的。此外，大模型在前期的投入，不管是算力还是其他的成本，以及时间窗口都很重要。

陈端表示，目前，百度有能力把自己的其他的产品与文心一言协同，就像微软把Office与GPT-4协同推出Copilot，而“创业者单纯去拼大模型却没有配套生态，这是很成问题的”。

张毅也认为，对于能够有资金、实力支撑的企业来讲，单独构建大模型产品可能会更受资本和创业者的青睐。但对于中小企业来讲，依托文心一言的开放平台去嫁接自己在细分领域的应用，也是一个不错的选择。

因为要做出大语言模型，需要长时间，以及巨额资金的投入。

OpenAI成功的背后，是微软多年来的巨额投入。美国时间2023年1月23日，微软宣布将对OpenAI进行为期数年、价值数以十亿计美元的投资。在2019年和2021年，微软曾向OpenAI两次投资。2019年的投资为10亿美元，而2021年的投资未公开金额。

AI公司“彩云科技”的创始人袁行远在接受36氪采访时指出，要想跑通一次100亿以上参数量的模型，至少要做到“千卡/月”这个级别，即：用1000张GPU卡，然后训练一个月。即使不用最先进的英伟达A100，按照一张GPU五万元的均价计算，1000张GPU意味着单月5000万的算力成本，这还没算上算法工程师的工资。

“无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。”李彦宏在发布会上表示，深度学习、自然语言处理，需要多年的坚持和积累，没法速成。大模型训练堪称暴力美学，需要有大算力、大数据和大模型，每一次训练任务都耗资巨大。

百度提供的数据显示，百度近十年累计研发投入超过 1000 亿元。2022 年百度核心研发费用 214.16 亿元，占百度核心收入比例达到 22.4%。但百度并未透露大模型研发在核心研发费用中的占比。

李彦宏在发布会上表示，百度对文心一言的定位，是一个通用的赋能平台，金融、能源、媒体、政务等千行百业，都可以基于这个平台来实现智能化变革，实现效率提升，创造巨大的商业价值。李彦宏认为，大模型时代将产生三大产业机会，分别为新型云计算公司、进行行业模型精调的公司和基于大模型底座进行应用开发的公司，即应用服务提供商。

李彦宏断言，对于大部分创业者和企业来说，真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型，这很不现实，也不经济。基于通用大语言模型抢先开发重要的应用服务，这可能才是真正的机会。目前，基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景，已经涌现出很多创业明星公司，可能就是未来的新巨头。

“大模型、生成式AI最终的产品形态还不得而知，所以这条路注定是长跑，需要整个科技界在资本、研发、模式创新上密切、持续地跟跑。”张毅说。

李开复认为，AI2.0会最先应用在能容错的领域，而毫无疑问最大的应用领域现在是内容创造。每个领域都可以把原有的App重写一次，创造出更赚钱的商业模式，最终AI2.0的生成能力会把成本降的几乎到0。

过于智能化训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI，有淘汰掉人训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI的趋势。

ChatGPT不会完全取代人工。

首先训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI，ChatGPT的“模式化”无法取代人类的“差异化”。 ChatGPT再“神通广大”训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI，也只是人工智能实验室OpenAI开发的语言模型，其流畅对话的背后是大量文本数据，机器智能一旦被概念框架限定，就只能在既有框架内运行，有时难免陷入“模式化”“套路化”的窠臼。而训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI我们人类，生而不同，正是这些“独一无二”的差异性才让人类文明得以延绵、生生不息。

其次，ChatGPT的“理性化”也无法取代人类的“感性化”。人工智能的“智能”更多是一种理性能力，而人类的智能还包括价值判断、意志情感、审美情趣等非理性内容。就像ChatGPT在回答中所说“我不具备自主意识，我的回答不包含意见或情感”。

关于与人类之间的关系ChatGPT自己给出答案训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI：

我不会替代人类，作为一个AI程序，我可以帮助人类解决困难和提高工作效率，但我永远无法用自己的感情去训练ChatGPT等模型不付钱？美国新闻集团拟起诉微软、谷歌、OpenAI了解人类，也不能靠自己的判断去思考问题。只有真正的人才能拥有这样的能力。

在那条看不见前路的黑暗隧道中，也许ChatGPT也可以是给你提供光亮、指引方向的同伴，正视它、直面它、利用它，毕竟，人工智能的前缀依然是“人工”。

chat gpt对教育的影响如下：

这是美国人工智能公司OpenAI在2022年11月推出的一款强大的人工智能语言模型，也是一款基于人工智能的聊天软件，但ChatGPT与传统AI聊天不同，比如谷歌的阿尔法，在下棋方面已经可以战胜人类，但ChatGPT这款聊天软件并不仅限于某个领域，简直做到了无所不知，包含了从聊天互动，邮件撰写、视频脚本到编写代码、到疑问解答等功能。

首先，AI软件虽然高效，但放在许多领域却不合时宜，尤其是在高校内，据悉ChatGPT的爆火，许多学会说借用这款软件来写作业、写论文，不仅违背了道德问题，同时还会产生大量的欺诈、作弊、抄袭等，而对于学生而言，甚至还能产生严重依赖性。

这给教育系统带来了巨大压力。而且许多高等级的脑力劳动、智慧活动也可能被替代，而这正是人类文明中最精华的部分，如果对ChatGPT产生依赖，人类智慧可能会被弱化、停止，甚至退化。

其次，对内容创作行业造成巨大影响，不仅成本更低，还能规避查重机制。比如出版机构、论文查询等平台。据报道，美国媒体网站BuzzFeed宣布裁员12%，并宣布ChatGPT生产内容。而在互联网行业，许多程序员甚至利用ChatGPT自动编写代码，自己则上班摸鱼。

站在机构的角度，这会给平台造成巨大影响，站在劳动者的角度来看，还会造成失业恐慌的问题。就连胡锡进都发文调侃，可能被人工智能“活埋”。

我个人的看法是会的。而且我认为这是一种科学的进步。

ChatGPT是

本文地址： https://www.528683.com//show-399092.html