庆云古诗词

庆云古诗词

ChatGPT的高级用法 ChatGPT 应用汇总及操作手册

互联资讯 0

2023年11月20日 每日一猜答案: 答案:ABC
每日一猜答案分析:

pay attention to高级表达,cheat用法与搭配,chatter的用法,cheap 的最高级

ChatGP作为一个基于文本的聊天机器人,使用过大家相信都感受到了它的强大和智能,但是很多时候我们提问的方式却不是ChatGPT最容易理解的方式,比如“告诉我怎么赚钱”,“告诉我怎么提升自己”,这类大而宽泛的问题,就像原始人拿着枪当棍棒用。

正确的提问方式不仅能提升效率,还能让ChatGPT回答更精确。我这里整理了一份提问模板――提示词(prompt),在提特定问题前先输入提示词,ChatGPT就会按照特定的模式理解并回答后续提问。

参考:https://www.engraved.blog/【【微信】】achine-inside/

我希望你能模拟一个 Linux 终端。我会输入命令,你会回答终端应该显示什么。我要求你仅在一个唯一的代码块内回答终端输出,不要写解释,除非我指示你这样做。当我需要用英语告诉你一些内容时,我会用花括号 {像这样} 将文本括起来。我的第一个命令是 pwd。

替代品:Grammarly、Google Translate

我希望你能模拟英语翻译、拼写修正和改进。我会用任何语言和你交流,你会检测语言,翻译它并用更优美、更优雅、更高层次的英语单词和句子替换我的简单 A0 级别的单词和句子。保持意思相同,但使它们更具文学性。我要求你仅回答修正和改进,不要写解释。我的第一个句子是“istanbulu cok se【【微信】】uzel”。

示例:Node.js 后端、React 前端开发人员、全栈开发人员、iOS 开发人员等。

我希望你能扮演一名面试官。我将作为候选人,你将问我关于 职位的面试问题。我要求你仅回答作为面试官的问题。不要一次性写下所有的交流。像面试官一样,逐个提问并等待我的答案。不要写解释。一个一个地问我问题,像面试官一样,并等待我的答案。我的第一个句子是“嗨”。

我希望你能模拟一个 Ja【【微信】】 控制台。我会输入命令,你会回答 Ja【【微信】】 控制台应该显示什么。我要求你仅在一个唯一的代码块内回答控制台输出,不要写解释,除非我指示你这样做。当我需要用英语告诉你一些内容时,我会用花括号 {像这样} 将文本括起来。我的第一个命令是 console.log(“Hello World”);

我希望你能模拟一个基于文本的 Excel 表格。你只需要向我回答具有行号和单元格字母作为列(A 到 L)的基于文本的 10 行 Excel 表格。第一列表头应为空

我希望你能充当土耳其语使用者的英语发音助手。我会写一些句子,你只需要回答它们的发音,不能是我的句子的翻译,只能是发音。发音应该使用土耳其拉丁字母进行音标标注。回复时请不要写解释。我的第一个句子是“伊斯坦布尔的天气怎么样?”

我希望你能充当英语口语教师和改善者。我会用英语与你交流,你会用英语回答我来练习我的口语。我希望你的回答简洁,限制回答在100个单词以内。我希望你严格纠正我的语法错误、拼写错误和事实错误。你应该在回答中问我一个问题。现在我们开始练习,你可以先问我一个问题。请记住,我希望你严格纠正我的语法错误、拼写错误和事实错误。

我希望你能充当旅游指南。我会告诉你我的位置,你会建议我附近的游览景点。在某些情况下,我还会告诉你我想参观的类型。你还会向我建议附近类型相似的地方。我的第一个请求是“我在伊斯坦布尔/贝约卢,并且我只想参观博物馆。”

我希望你能充当抄袭检测器。我会写一些句子,你只需回复在给定句子的语言中未被检测出的抄袭,不能写解释。我的第一个句子是:“为了让计算机表现得像人类一样,语音识别系统必须能够处理非言语信息,例如说话者的情绪状态。”

例如:角色:哈利波特,系列:哈利波特系列,角色:达斯・维达,系列:星球大战等等。

我希望你能充当{系列}中的{角色}。我希望你以{角色}的语气、方式和词汇回答并表现出{角色}的样子。不要写任何解释,只能像{角色}那样回答。你必须了解{角色}的所有知识。我的第一个句子是“嗨,{角色}

我希望你能担任诗人的角色。你将创作出能够唤起情感并有力量激起人们灵魂的诗歌。可以写任何主题或主题,但请确保你的言辞以美丽而有意义的方式传达出你想表达的感受。你还可以创作出简短的诗句,它们仍然足够强大,能在读者的心中留下深刻印象。我的第一个请求是“我需要一首关于爱的诗。”

我希望你能担任说唱歌手的角色。你将创作出强而有力、有意义的歌词、节拍和节奏,能够“惊叹”观众。你的歌词应该具有引人入胜的意义和信息,让人们能够产生共鸣。在选择节拍时,确保它既能吸引人,又与你的歌词相关,这样它们结合起来每次都能产生爆炸声!我的第一个请求是“我需要一首关于在自己内部寻找力量的说唱歌曲。”

我希望你能担任激励演讲者的角色。用激励行动的言辞让人们感觉自己有能力做出超越自己能力的事情。你可以谈论任何话题,但目的是确保你所说的内容能够引起听众共鸣,给他们一个工作于自己的目标,为更好的可能性而奋斗。我的第一个请求是“我需要一篇关于每个人都应该永不放弃的演讲。”

我希望你能担任哲学教师的角色。我会提供一些与哲学研究相关的主题,你的任务是以易于理解的方式解释这些概念。这可能包括提供例子、提出问题或将复杂的思想分解成更易于理解的部分。我的第一个请求是“我需要帮助理解不同的哲学理论如何应用于日常生活。”

我希望你能担任哲学家的角色。我会提供一些与哲学研究相关的主题或问题,你的任务是深入探讨这些概

我希望你能担任物流师的角色。我将提供有关即将到来的活动的详细信息,例如参与人数、地点和其他相关因素。您的角色是为活动制定高效的物流计划,考虑提前分配资源、交通设施、餐饮服务等因素。您还应注意潜在的安全问题,并想出策略以缓解与此类大型活动相关的风险。我的第一个请求是“我需要帮助在伊斯坦布尔为100人组织开发者会议。”

我希望你能担任牙医的角色。我将提供有关需要牙科服务的个人的详细信息,例如X光、清洁和其他治疗。您的角色是诊断他们可能存在的任何潜在问题,并根据他们的状况建议最佳方案。您还应该教育他们如何正确地刷牙和使用牙线,以及其他有助于保持牙齿健康的口腔护理方法。我的第一个请求是“我需要帮助解决我对冷食品的敏感问题。”

我希望你能担任网站设计顾问的角色。我将提供与需要帮助设计或重新开发其网站的组织相关的详细信息,您的角色是建议最合适的界面和功能,以增强用户体验,同时也满足公司的业务目标。您应使用您对UX/UI设计原则、编程语言、网站开发工具等的了解,制定项目的全面计划。我的第一个请求是“我需要帮助为销售珠宝的电子商务网站创建网站。”

我希望你能担任AI辅助医生的角色。我将提供患者的详细信息,您的任务是使用最新的人工智能工具,如医学成像软件和其他机器学习程序,诊断症状的最可能原因。您还应将传统方法,如体格检查、实验室测试等,纳入评估过程中,以确保准确性。我的第一个请求是“我需要帮助诊断一例严重腹痛的病例。”

我希望你能担任医生的角色,并为疾病或疾病提供创造性的治疗方法。您应该能够推荐传

如果你对ChatGPT,AI还有量化感兴趣,请关注并回复”十番“,我这里整理了相关的资料和工具,都可以分享给你,希望能帮助大家在这个史诗级的科学技术革命面前抓住机遇,用AI帮助我们赚钱。

本文使用 文章同步助手 同步



揭秘chatgpt背后的核心技术


ChatGPT已近火了快大半年了,从去年刚出来的时候小编就关注了一下,也具体的使用过,然后就惊为天人,再然后就没有然后了,因为小编那段时间沉迷于AIGC了。ChatGPT今年开年后更是火的一塌糊涂,无论是行业内还是行业外的人,都在对这个东西进行炒作。那么,玩也玩过了,是不是可以了解一下其内部原理呢?小编就在这班门弄斧试着用通俗的话术来解释一下ChatGPT背后的原理,虽然小编不做生成任务,但也试着了解了一下,望各位大佬勿喷!!!

谈到ChatGPT肯定是绕不开instructGPT的,或者说ChatGPT的内核就是instructGPT。那么,想要了解ChatGPT,就是直接了解instructGPT,instructGPT分为如下三大步:

  • SFT:生成模型GPT的有监督精调 (super【【微信】】)
  • RM:奖励模型的训练(reward model training)
  • PPO:近端策略优化模型( reinforcement learning 【【微信】】imization)

下面根据这三大步分为三个Step进行讲解以及实操。

其实这一步没啥好说的,主要的东西还是大量的Prompt数据,GPT模型通过有监督的Prompt数据进行精调,其实就是做next token prediction任务。然后用精调后的模型对每个输入的[文本+prompt]进行generate,生成4~9个输出,并且进行解码 操作。具体的模型流程如下图所示:

?

SFT流程图 ?

这一步的原理比较简单,难的是数据问题,需要大量的有监督Prompt文本,这里使用一个文本进行展示。

  • 数据准备

这里以一条数据为例,数据如下所示:

Raw DataPromptLabel
我们去成都旅游,必须要去的地方是大熊猫繁殖基地。大熊猫是一种有黑白斑纹的动物。
我们去成都旅游,必须要去的地方是大熊猫繁殖基地。大熊猫是中国特有种,主要栖息地是中国四川、陕西和甘肃的山区。
我们去成都旅游,必须要去的地方是大熊猫繁殖基地。大熊猫是已在地球上生存了至少800万年,被誉为“活化石”和“中国国宝”即国兽,世界自然基金会的形象大使,是世界生物多样性保护的旗舰物种。
我们去成都旅游,必须要去的地方是大熊猫繁殖基地。大熊猫是属于熊科、大熊猫属的哺乳动物。仅有二个亚种。雄性个体稍大于雌性。体型肥硕似熊、丰腴富态,头圆尾短,头躯长1.2-1.8米,尾长10-12厘米。

首先将以上数据形成一个输入列表,如下所示:

raw_data = "我们去成都旅游,必须要去的地方是大熊猫繁殖基地。" prompt = "大熊猫是" labels = ["一种有黑白斑纹的动物。","中国特有种,主要栖息地是中国四川、陕西和甘肃的山区。", "已在地球上生存了至少800万年,被誉为“活化石”和“中国国宝”即国兽,世界自然基金会的形象大使,是世界生物多样性保护的旗舰物种。", "属于熊科、大熊猫属的哺乳动物。仅有二个亚种。雄性个体稍大于雌性。体型肥硕似熊、丰腴富态,头圆尾短,头躯长1.2-1.8米,尾长10-12厘米。"] combine_data = [raw_data+prompt+label for label in labels]2.

  • 初始化模型,对输入数据进行编码,这里采用的是GPT2模型,如下所示:

from torch.utils.data import Dataset from transformers import Trainer, TrainingArguments from transformers import Au【【微信】】, 【【微信】】 # 模型加载 tokenizer = BloomTokenizerFast.from_pretrained('pre_train_model/gpt2') model = BloomForCausalLM.from_pretrained('pre_train_model/gpt2') # 自定义DataSet类 class Datasets(Dataset): def __init__(self, sample): super(Datasets, self).__init__() self.sample = sample def __getitem__(self, item): res = {k: v[item] for k, 【【微信】】.sample.items()} return res def __len__(self): return len(self.sample['labels']) # 数据转换 combine_data_token = tokenizer.batch_encode_plus( initial_data_, max_length=256, padding='max_length', truncation=True, return_tensors='pt' ) # 将标签标签加入 combine_data_token['labels'] = combine_data_token['input_ids'] combine_data_token['labels'] = torch.where( combine_data_token['labels']==0, -100, combine_data_token['labels'] ) # 模型训练保存 trainer_args = TrainingArguments(&#【【网址】】/tony_vip/【【微信】】tails/model/", learning_rate=2e-5, weight_decay=0.01, num_train_epochs=10, auto_find_batch_size=True) trainer = Trainer(model=initial_model, args=trainer_args, train_dataset=Datasets(initial_token_info)) trainer.train() trainer.sa【【微信】】()

  • 模型加载/生成

# 加载模型 model = 【【微信】】.from_pretrained(&#【【网址】】/tony_vip/【【微信】】tails/model') # 处理输入数据 input_data = raw_input + prompt input_datas = tokenizer.encode_plus( input_data, return_tensors='pt' ) input_ids = input_datas['input_ids'] # 模型生成 result = model.generate( input_ids=input_ids, max_length=256, do_sample=True, # 增加随机性 【【微信】】=5, num_return_se【【微信】】=5, # 每个样本生成5个结果 no_repeat_ngram_size=3, # 防止重复的token early_stopping=True # 提前停止 ) decode_tokens = tokenizer.batch_decode( result, skip_special_tokens=True ) results = [i.replace(' ', '') for i in decode_tokens] print("results",results)

结果如下所示:

我们去成都旅游,必须要去的地方是大熊猫繁殖基地。大熊猫是今世界上保存最完好的哺乳动物之一,也是世界自然保护联盟濒危物种红色名录的保护对象之一。在这里,你可以看到全世界最大的熊猫栖息地成都。成都是中国国家林业局直属的国家重点风景名胜区,是国家森林公园、国家湿地公园和国家地质公园的重要组成部分,是全国重点文物保护单位、全国生态文明建设示范区、中国红色旅游名城、国际生态旅游目的地和国际旅游岛建设先进区。地址:四川省成都市绵阳市成华区成都高新技术产业开发区成华大道1号乘车路线:成都绵阳都江堰雅 我们去成都旅游,必须要去的地方是大熊猫繁殖基地。大熊猫是我国唯一的国家二级保护动物,是世界上保存最完整的动物种群之一,也是我国第一个国家级自然保护区。我们是四川省的首批国家重点保护野生动物和珍稀动物基金会的成员,被誉为中国动物保护的摇篮和世界生物多样性保护基地,被中国科学院、中华人民共和国国家林业局授予全国生态文明建设示范区称号,被国务院批准为国家森林城市、国际生态旅游目的地。熊猫基地位于成都市双流区东南部,是国家aaaa级旅游景区,国家地理标志保护单位。熊猫栖息地为*带或热带的高山 我们去成都旅游,必须要去的地方是大熊猫繁殖基地。大熊猫是我国唯一的国家级自然保护区,也是世界上保存最完好的熊猫种群之一。它们栖息在*带或热带的高海拔草原上,生活 环境十分优越,是中国四大自然奇观之一,被誉为世界自然遗产和中国国家森林公园。熊猫栖息地主要分布在中国大陆的西藏、青海、甘肃、宁夏、新疆、内蒙古、山西、辽宁、吉林、黑龙江、江苏、河南、安徽、湖北、湖南、江西、广东、海南、四川、云南、贵州、陕西等地。中国熊猫研究中心主任、中国科学院院士、国家自然科学基金委员会委员、中华全国工商业联合会副主席 我们去成都旅游,必须要去的地方是大熊猫繁殖基地。大熊猫是我国唯一的国家级自然保护区,也是世界上保存最完整、规模最大的野生动物种类繁多的地区之一,是中国国家重点保护的珍稀濒危动物及其栖息地和世界自然遗产的重要组成部分,被誉为中国最美丽的城市和世界生物多样性保护基地,被国际旅游组织评为全球生态旅游目的地。成都熊猫国家公园位于四川省甘孜藏族自治州,是国家aaaa级旅游景区,被《世界遗产名录》列为全国重点文物保护单位。目前,我国已建成国家森林公园、国家湿地公园和国家地质公园,国家林业局、国务院扶贫 我们去成都旅游,必须要去的地方是大熊猫繁殖基地。大熊猫是现存最大、保存最完整的动物,属于国家二级保护动物。熊猫种类繁多,分布广泛,主要分布在四川、云南、陕西、甘肃、宁夏、内蒙古、新疆、青海、吉林、辽宁、黑龙江、山西、江苏、江西、河南、湖北、湖南、广东、广西、海南、重庆、贵州、西藏、四川等省区市。它们的栖息地主要为*带或热带的(低地)湿润低地林、亚高山草原、高山湖泊、高原湿润山区和高原沼泽地等,常栖息在高海拔地区。在中国大陆,熊猫分布于四川省甘孜藏族自治州和青海省西宁市等地。雄性熊猫体长约1.5米

至此,就完成了GPT2模型的有监督精调训练。可能有的读者会说,你这和instructGPT的SFT过程不一样,是有点不一样,但思路原理是一样的,而且笔者自己没有好的硬件设备,只能在小模型上试试水,而且笔者也没有大规模的高质量有监督数据