open AI翻译水平

互联资讯 2023-04-29 13:40:04 0

淘宝搜：【红包到手500】领超级红包，京东搜：【红包到手500】
淘宝互助，淘宝双11微信互助群关注公众号【淘姐妹】

OpenAI API由一系列的不同价格不同能力的模型来提供服务。你也可以通过微调模型对原有模型进行一定的训练从而解决特定领域的一些问题。

模型	描述
GPT-4	基于GPT-3.5改进而来，可以更好的理解和生成文本内容或是代码
GPT-3.5	基于GPT-3改进而来，可以更好的理解和生成文本内容或是代码
DALL.E	可以根据提示词生成图像，并根据提示词上下文对生成的图像进行修改
Whisper	将引擎转换成文本
Embeddings	一组可以将文本转换成数字的模型
Moderation	进过一定微调可以判定文本中是否包含敏感或是不安全的内容
GPT-3	可以裂解或是处理自然语言（提示词）
Codex	一组可以理解和处理代码的模型，并且也提供从提示词到代码的生成，目前处于开阶段

官方也发布了包含Point-E、Whisper、Jukebox、CLIP模型在内的开源代码。通过阅读模型指南来了解我们的论文中涉及到的有哪些模型，以及就像InstructGPT和GPT-3.5之间的差异。

GPT-4是一个大的多模态模型（现在可以接受文本输出文本，将来还会实现对图像输入的支持）他可以比之前其他的任何模型更好、更准确的解决难题，这一切得益于他大量的数据训练以及超前的推理能力。与gpt-3.5-turbo一样，GPT4对聊天进行了优化但是对以往的任务处理也很好地支持。我们可以在会话指南中学习如何更好的使用GPT-4。

GPT-4目前处于有限的测试阶段，只有被授予访问权限的人才能访问，你可以通过申请链接加入等待以获得授权

模型版本	描述	最大令牌量	训练数据
gpt-4	针对回话进行优化，相对于GPT-3.5有更强的能力能够处理风复杂的任务，他也将会与随我们最新的模型一同更新	8192	截至2021年9月
【【微信】】314	gpt-4的2023年3月14日的快照，与gpt-4不同的是，该模型将不会接受更新，并且只会在2023年6月14日结束的三个月内得到支持	8192	截至2021年9月
gpt-4-32k	功能上与GPT4基础版相同，但上下文长度是它的4倍，他将与我们最新的模型一同迭代更新	32768	截至2021年9月
【【微信】】314	gpt-4-32k的2023年3月14日快照，与gpt-4不同的是，该模型将不会接受更新，并且只会在2023年6月14日结束的三个月内得到支持	32768	截至2021年9月

对于许多基本任务，GPT-4和GPT-3.5模型之间并没有显著的差异。然而在复杂的情况下，GPT-4比之前的任何模型都更强！哈哈当然最强的肯定是在未来的5、6、7、8、9.....

GPT-3.5能够理解和生成自然语言以及代码，在此版本中的系列模型中，GPT3.5-turbo是能力最强成本相对最低的模型，他对回话进行了优化同时能够很好的处理普通任务。

模型版本	描述	最大令牌量	训练数据
gpt-3.5-turbo	能力最强大的模型，针对回话进行了优化并且成本只有text-davinci-003的十分之一，他将与最新的模型一同迭代更新。	4096	截至2021年9月
gpt-3.5-turbo-0301	2023年3月1日gpt-3.5-turbo的快照。与gpt-3.5-turbo不同的是，该型号将不接受更新，并且只支持三个月的时间，截止到2023年6月1日	4096	截至2021年9月
text-davinci-003	与Curibe、Babbage、Ada模型相比可以支持更长的上下文，更高质的完成对话任务，还支持在文本中插入补全	4097	截至2021年6月
text-davinci-002	能力与text-davinci-003类似，但是是通过监督微调进行训练，而非是强化学习	4097	截至2021年6月
code-davinci-002	优化代码生成能力	8001	截至2021年6月

我们推荐使用GPT-3.5 -turbo而不是其他GPT-3.5型号，因为它的成本更低。OpenAI 的模型内容生成式不确定的，所以会存在同样的输入会有不通的输出，将temperature 设置为0将会降低这种相同输入不通输出的发生以及他们的差异化程度，但是任然不能够保证相同输入一定产生相同的输出。

通过尝试使用gpt-3.5-turbo模型是一个熟悉API有哪些能力的好方法，当你知道自己想要通过API去完成一些什么东西的时候，你可以通过gpt-3.5-turbo或是其他的模型来围绕其功能进行优化。你也可以使用GPT对比工具来同时运行多个模型并行的比较输出、设置、相应时间，并且可以将这些信息以Excel的形式下载下来。

DALL・E是一个可以根据自然语言的描述创建逼真的图像和艺术作品的智能系统。目前支持在给定提示词的情况下创建具有一定大小的新图像、编辑现有图像或或是基于用户提供的图像进行创新。目前通过API提供的模型是DALL・E第二代模型，相对于前面的模型它的图像创作更加真实、准确、分辨率也提高了四倍。你可以通过注册账号进行试用或是通过API来进行调用。

Whisper是一个通用的语音识别模型，他是在各种音频的大数据集上训练的，也是一个可以执行多语言语音识别以及语音翻译和语言类型鉴别的多任务模型。Whisper v-2模型现在可以通过API进行调用。目前开源的版本与我们现在通过调用API使用的版本没有区别。不过在API的调用过程中提供了一个优化的推理过程，这使得通过API运行Whisper比通过其他方式快得多。关于Whisper的更多设计可以阅读有关它的详细介绍

Embeddings被定义为文本的数字表现形式，他可以用来衡量两个文本之间的相关性。第二代Embedding模型“text-embedding-ada-002”被设计用来取代原来的16个第一个代Embedding模型，使用成本上相对于之前也有降低。Embedding主要用于搜索、聚类、推荐、异常检测和分类场景。相关Embedding?的更多信息可以参考它详细介绍

Moderation主要是用来检测输入的提示词中是否包含敏感词是否符合OpenAI的使用政策。这些模型提供了分类功能，分类主要包括:仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图形。Moderation模型可以接受任意大小的输入，之后将它进行切割从而适应其他模型对于上下文长度的限制。

模型	描述
text-moderation-latest	最强的调节模型,精度略高于text-moderation-stable
text-moderation-stable	性能与新的模型几乎一言但是就是老了些

GPT模型能够处理和生成自然语言，不过这些模型被更加强大的GPT-3.5所取代。不过，最初的GPT-3基础模型(davinci、curie、ada和babbage)是目前唯一可用于微调的模型。

模型	描述	最大Token	更新日期
text-curie-001	相对于Davinci能力更强，性能更高，使用成本也更低	2049	2019年10月
【【微信】】	能够完成简单的任务但是处理速度非常快，花费的成本也更低	2049	2019年10月
【【微信】】	只能够处理非常简单的任务，通常来说在GPT-3系列的模型中它的成本是最低的处理速度也是最快的	2049	2019年10月
davinci	是GPT-3系列中处理能力最强的模型，相对于其他的模型他几乎能够处理所有的任务，返回高质量的结果	2049	2019年10月
curie	处理能力略低于Davinic但是花费的成本也更低处理速度也更快	2049	2019年10月
babbage	能够完成简单的任务但是处理速度非常快，花费的成本也更低	2049	2019年10月
ada	只能够处理非常简单的任务，通常来说在GPT-3系列的模型中它的成本是最低的处理速度也是最快的	2049	2019年10月

Codex模型现在已经被废弃掉了，他晚于GPT-3能够处理处理与生成代码。他的训练数据集包含自然语言以及GitHub上数亿行的开源代码。他对Python语言的处理效果最好，但是也精通包含Ja【【微信】】, Go, Perl, PHP, Ruby, Swift, TypeScript, SQL在内的10多种语言甚至也能很好地处理Shell脚本

模型	描述	最大Token	更新日期
code-davinci-002	Codex系列中能力最前的模型，尤其擅长根据提示词生成代码。除了能够生成代码还能够在代码中进行补全。	8001?	2021年6月
code-da【【微信】】	略早于code-davinci-002版本	8001?	2021年6月
code-cushman-002	能力与Da【【微信】】几乎相当，但是处理速度更快。处理速度的优势使得他可能更适用于实时应用程序。	2048
code-cushman-001	略早于code-cushman-002版本	2048

端点也可以理解成路径，这里采用的应该是Rest风格，每个端点后面对应的模型名称应该是这个端口所对应的模型能力支持

端点	模型名称
/v1/chat/completions	gpt-4, 【【微信】】314, gpt-4-32k, 【【微信】】314, gpt-3.5-turbo, gpt-3.5-turbo-0301
/v1/completions	text-davinci-003, text-davinci-002, text-curie-001, 【【微信】】, 【【微信】】, davinci, curie, babbage, ada
/v1/edits	text-da【【微信】】, code-da【【微信】】
/v1/audio/transcriptions	whisper-1
/v1/audio/translations	whisper-1
/v1/fine-tunes	davinci, curie, babbage, ada
/v1/embeddings	text-embedding-ada-002, text-search-ada-doc-001
/v1/moderations	text-moderation-stable, text-moderation-latest

列表中不包含first-generation Embedding以及DALL.E系列模型

随着gpt-3.5-turbo的发布，一些模型现在正在不断更新。为了避免更新过程中一些改变影响用户的使用体验，OpenAI也提供了一些三个月保持静态不更新的版本。随着模型更新的节奏，人们可以通过OpenAI Evals仓库来对模型进行反馈。帮助我们通过不通的用例来提高模型能力。以下模型是将在指定日期弃用的临时快照。如果您想使用最新的型号版本，请使用标准型号名称，如gpt-4或gpt-3.5-turbo：

模型名称	废弃日期
gpt-3.5-turbo-0301	2023年6月1日
【【微信】】314	2023年6月14日
【【微信】】314	2023年6月14日

人工智能推理图解用ai推理数学猜想

人工智能推理方法,人工智能推理网络,人工智能推理网络怎么画,人工智能推理网络图

摘要:今年6月，OpenAI发布一款强大的文本生成模型GPT-3，不少网友迅速上手用了起来，有人用它写食谱、写歌词，甚至有人用它写博客，愣是以假乱真登上了新闻平台技术板块热榜第一。前不久，OpenAI再次放出大招。这次，研究 ...

人工智能学习离不开实践的验证，推荐大家可以多在FlyAI-AI竞赛服务平台多参加训练和竞赛，以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例，支持算法能力变现以及快速的迭代算法模型。

今年6月，OpenAI发布一款强大的文本生成模型GPT-3，不少网友迅速上手用了起来，有人用它写食谱、写歌词，甚至有人用它写博客，愣是以假乱真登上了新闻平台技术板块热榜第一。

前不久，OpenAI再次放出大招。这次，研究人员发布了一篇论文《Generati【【微信】】r Automated Theorem Proving》，推出了一款用于自动定理证明(ATP) 的GPT-f模型。GPT-f基于TransformeR语言模型，可以为Metamath形式化语言提供自动证明器和证明助手。

论文地址：

https://arxiv.org/pdf/2009.03393.pdf

GPT-f有什么特别之处？

论文一作Stanislas Polu在推特上进行了介绍，他们在实验中发现，GPT-f比现有自动定理证明器还要优秀，可完成测试集中56.22%的证明，而现有的SOTA模型MetaGen-IL也只能证明21.16%的定理。

此外，GPT-f还发现了新的简短证明，已有23个简短证明被收入Metamath函式库中。这是深度学习模型的定理生成证明首次被数学家接受。

那么大家对于GPT-f是怎么看的呢？

网友普遍保持中立，大佬认为没有特别之处

文摘菌想在推特上看看网友们的讨论，没想到AI界的一些大佬也发表了自己的看法。

Robust.AI、Geometric Intelligence两家AI公司的创始人，研究人工智能领域多年的科学家Gary Marcus认为，“就像GPT-3不是研究真正人类语言的正确方向一样……， GPT-f并不是达到真正人类水平(更不用说超越人了)的数学定理证明的正确研究方向。”

他还称，人们一直在误用GPT来解决它不适合解决的问题，同样的问题也不断出现。

美国通用人工智能会议主席、奇点大学顾问、人工智能软件公司 No【【微信】】公司董事长 ? Ben Goertzel 也在推特发表了自己的看法，他认为，GPT-f 又是一个在不理解的情况下指导定理证明的古怪实验……

他还专门写了一篇文章来谈论对于GPT-f的看法，发表在了自己的博客上。

博客地址：

http://multi【【微信】】.blogspot.com/2020/09/gpt-f-one-more-funky-experiment-in.html

Ben还在博客中写道，“从ATP领域正在进行的工作的总体背景来看，在我看来，GPT-f 不像 GPT-2或GPT-3 那样迈出了一大步――但可以肯定的是，它在ATP方面是有意义的进展，与这一领域其他专家正在进行的大量研究进展相符（然而，这些专家因为没有像OpenAI那样的公关预算而不被媒体报道）。GPT-f 还有一个与其他GPT类似的核心缺点――它在理解数学这方面并不比GPT-2或GPT-3理解语言的能力更强。”

那网友们怎么看呢？

现阶段网友们普遍是一种吃瓜的态度，并没有对GPT-f大肆夸耀。大部分只是转发了相关推文并陈述了论文中GPT-f实验的成果。

也有一部分网友在论坛中发表了自己的疑问。

比如网友@Jason Rute 就问到：什么才是有效的证明步骤？Jason Rute曾经是一名数学家，后来成为了数据科学家，他对深度学习很感兴趣。

GPT-f将同时返回一个定理和替换，然后它们必须与目标统一。如果替换不统一，那么我确定它被标记为无效。然而，如果这个定理不在先前证明的定理列表中呢？GPT-f是做什么的？

1）试着证明这个定理；

2）认为这是一个无效的证明步骤，还是将输出限制在已知的定理上？

（我想会是第一条，但我还是想验证一下。）

论文一作Stanislas Polu也在论坛对此进行了回复，并表示这是个好问题。

? 如果统一失败，内核会拒绝验证步骤，甚至在验证树搜索中也不会考虑它（不会添加到树或队列中，也不会由值函数赋值）。

? 如果该定理在数据库中没有被报告，那么该定理也将被拒绝。这就是说，我们正在试验让模型证明这些猜想，如果它们被价值函数认为有趣的话。在这种情况下，我们只需将定理本身添加为子目标（带有一个特殊的标记，以确保一旦找到证据，我们就重新检查不同的变量（DVs是一种元数学技术，可以在您的思维中抽象出来，如果您不知道它们是如何工作的，可以稍后再访问）），然后子目标会相应地被赋值并添加到队列中。

针对这个问题，Jason Rute在论文作者回复后还追加了提问，详细讨论可以看这里：

https://leanpro【【微信】】.github.io/archive/【【微信】】/【【QQ微信】】-【【微信】】-Theorem-Proving/topic/GPT-f.20paper.html#210087032

Jason Rute还说，“在许多方面GPT-f类似于之前出现的其他定理证明，HOList/DeepMath, CoqGym/【【微信】】, TacticToe等等。所有这些的共同之处在于它们把定理证明当作树搜索。长期以来，我们所知道的是，采用智能启发式可以避免树(和图)搜索中的组合爆炸。AlphaGo及其后继者告诉我们的是，这些启发式完全可以从例子中学习，也可以从引导和强化学习中学习。GPT-f在这方面没有什么不同。(关于GPT-f使用的特定树搜索算法，我不打算说得太多，因为我不认为他们的方法比其他类似的论文优化很多。)”

此外，文摘菌也翻了一下知乎，只有一个相关问题，而且该问题下只有一个回答。由此可见，国内网友可能还不太知道GPT-f，也可能由于发布时间并不长，大家对于GPT-f还处在比较懵的状态。

如果你对GPT-f有更好的了解或看法，欢迎在评论区分享~

GPT-f 由自动证明器和证明助手组成

GPT-f是由两部分组成的，分别是自动证明器和证明助手。

自动证明器是为了寻求更简短的证明，研究人员从 Metamath 的 set.mm 库中采样命题证明，并对比 GPT-f 模型找到的解与真值的长度，同时还验证了简短证明不依赖于额外的公理。

? ? ?

证明搜索包括维护一个证明树，其中从根目标开始探索每个目标的多种策略。

OpenAI利用在线证明助手，来帮助模型产生交互式的证明架构。下图展示了 GPT-f 证明助理的界面：

Metamath是一种用于存档，验证和研究数学证明的语言和计算机程序。研究人员使用Metamath作为正式环境，使用类似于GPT-2和GPT-3的仅解码器的转换器来创建具有各种预训练数据集和不同大小的模型。他们较大的模型具有36层和774m可训练参数。

各种模型大小和预训练数据集的性能

说了这么多，那什么是自动定理证明呢。

百度百科中是这样描述的：自动定理证明是人工智能研究领域中的一个非常重要的课题，其任务是对数学中提出的定理或猜想寻找一种证明或反证的方法。因此，智能系统不仅需要具有根据假设进行演绎的能力，而且也需要一定的判定技巧。

研究人员发现，学习证明定理与学习玩棋盘游戏之间有相似之处，因为它们都提供了自动确定成功的方法，并生成新的数据。因此，AlphaZero在围棋领域的成功表明，自动定理证明可能是神经网络推理研究的一个富有成效的领域。

open AI翻译水平

人工智能推理图解 用ai推理数学猜想

人工智能推理图解用ai推理数学猜想