庆云古诗词

庆云古诗词

2、Stable Diffusion:基于潜在扩散模型的高分辨率图像合成

互联资讯 0

2023年11月20日 每日一猜答案: 答案:ABC
每日一猜答案分析:

2stable,2stables

在使用DEA模型评价项目的效率时,需要注意下面的几个要点: 一、认识DEA模型和方法 ①首先,需求明确的是,DEA评价创新效率、经济效率或其他效率都是基于样本数据的强队有效性的分析。DEA模型英文名“Data En【【微信】】”,中文名“数据包络分析方法”。dea模型是由…...

编程日记 2023/4/5 12:45:25

🍁博主简介 🏅云计算领域优质创作者 🏅华为云开发者社区专家博主 🏅阿里云开发者社区专家博主 💊交流社区:运维交流社区 欢迎大家的加入! 相关文章 文章名文章地址【MYSQL初级篇】入门…...

编程日记 2023/3/30 14:44:11

为什么使用消息队列? 应用解耦流量削峰异步处理消息通讯远程调用 消息队列如何解决消息丢失问题? 因此保证MQ不丢失消息可以从这三个阶段来进行阐述: 生产者保证不丢消息存储端不丢消息消费者不丢消息 生产者保证不丢消息 生产段保证不丢…...

编程日记 2023/4/5 18:20:41

👌 棒棒有言:也许我一直照着别人的方向飞,可是这次,我想要用我的方式飞翔一次!人生,既要淡,又要有味。凡事不必太在意,一切随缘,缘深多聚聚,缘浅随它去。凡事…...

编程日记 2023/4/3 8:39:58

1 库的概念与静态库 写程序的时候,我们希望自己写的东西具有通用性,例如函数或者结构体,不单单自己能用,别人也可以用,但有些时候,我们又不希望自己写的代码让别人看到。如何才能做到让别人看不到的情况下…...

编程日记 2023/4/7 14:15:24

电子体温计开发方案由单片机SIC8833型号,通过单片机程序开发而成;它与以往的水银体温计不同,是通过电子元器件来代替水银,测量后体温度数还可以一数字显示到小显示屏上。电子体温计方案一、电子体温计方案规格简介:温度…...

编程日记 2023/4/1 22:25:19

?作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。 🍎个人主页:小嗷犬的个人主页 🍊个人网站:小嗷犬的技术小站 🥭个人信条:为天地立心&…...

编程日记 2023/4/7 3:26:38

1.Collection集合 1.1数组和集合的区别【理解】 相同点 都是容器,可以存储多个数据 不同点 数组的长度是不可变的,集合的长度是可变的 数组可以存基本数据类型和引用数据类型 集合只能存引用数据类型,如果要存基本数据类型,需要存对应的包装类 1.2集合类体系结构【理解】…...

编程日记 2023/4/2 20:15:38

gaslighting(煤气灯效应) 什么是“煤气灯效应” “Gaslighting” C mind manipulating, grossly misleading, downright deceitful C is Merriam-Webster’s word of the year. “煤气灯”――操纵思想、严重误导、彻头彻尾的欺骗――是韦氏词典今年…...

编程日记 2023/4/1 21:26:00

致前行的人: 要努力,但不要着急,繁花锦簇,硕果累累,都需要过程! 目录 1.二叉搜索树 1.1二叉搜索树概念 1.2二叉搜索树的操作 1.3二叉搜索树的实现 2.4二叉搜索树的应用 2.5二叉搜索树的性能分析 2.二…...

编程日记 2023/3/31 0:05:38

文章目录前言1. docker镜像篇1.1 拉取镜像1.2 查看镜像信息1.3 搜寻镜像1.4 删除镜像2. docker容器篇2.1 创建并启动容器2.2 查看容器输出2.3 停止容器2.4 进入容器2.5 删除容器3. 关于docker run前言 本篇文章主要汇总了项目开发过程中常用的docker命令,以便后续查…...

编程日记 2023/4/4 3:45:56

目录一、三台服务器信息二、Elasticsearch7.8.0单机部署三、Elasticsearch7.8.0集群部署3.1、分别再三台服务器中都安装Elasticsearch7.8.03.2、修改192.168.136.23服务器中elasticsearch配置文件3.2、修改192.168.136.24服务器中elasticsearch配置文件3.3、修改192.168.136.25…...

编程日记 2023/4/5 20:34:50

先对项目做个简单展示。项目主要包含如下功能: 使用唐诗数据集训练模型。使用训练好的模型,随机生成一首古体诗。使用训练好的模型,续写一首古体诗。使用训练好的模型,随机生成一首藏头诗。随机生成一首古体诗: 金鹤有僧心,临天寄旧身。 石松惊枕树,红鸟发禅新。 不到风…...

编程日记 2023/3/31 0:05:38

给定一个由不同的小写字母组成的字符串,输出这个字符串的所有全排列。 我们假设对于小写字母有a < b < ... < y < z,而且给定的字符串中的字母已经按照从小到大的顺序排列。Input输入只有一行,是一个由不同的小写字母组成的字符串…...

编程日记 2023/4/6 23:56:09

针对电力物联网融合业务场景国产化应用需求,设计了一种可信多功能物联网关装置。方案采用 RK3568J作 为 核心主控制器,搭载可信安全模块构建可信认证启动,具 …...

编程日记 2023/3/31 0:05:38

文章目录 Spring Boot整合Logback和PageHelper 一、整合Logback 二、整合PageHelper Spring Boot整合Logback和PageHelper 一、整合Logback Spring Boot默认使用Logback组件作为日志管理。Logback是由log4j创始人设计的一个开源日志组件。 在Spring Boot项目中我们不需要…...

编程日记 2023/3/30 5:40:11

html实现微信授权登陆前言网页授权的两种 scope 的区别开发指南第一步:用户同意授权,获取code第二步:通过 code 换取网页授权access_token第三步:拉取用户信息(需 scope 为 snsapi_userinfo)代码实现:效果图总结前言 …...

编程日记 2023/4/7 16:27:41

文章目录介绍通用要求泊车控制最大运行速度退出条件建议空间车位水平空间车位垂直空间车位泊车流程流程定义【【微信】】odeSlot FoundMode SelectionAssisted Parking ModeEnd of Assisted Parking Mode人机交互策略车位搜索阶段车位搜索到且未激活泊车驾驶员请求泊…...

编程日记 2023/4/7 14:49:08

Python re正则表达式模块用法详解 前面章节介绍了一些系统自带的工具函数,如 id()、max()。这些函数在 Python 启动时会自动加载进来,不需要我们做任何事情。但并不是所有的模块都是自动加载进来的,因为有些模块不常用,它们只是在…...

编程日记 2023/4/3 4:41:27

什么是操作符 为了方便对Flux/Mono的数据操作,减少自定义subscriber的代码量,reactor提供了操作符的概念,操作符可以对Flux/Mono的数据进行转换、过滤、合并等操作。操作符的很多名称和概念和java8的【【微信】】是类似的,比如map、…...

编程日记 2023/4/6 18:07:38

网络原理初识计算机网络的历史局域网和广域网网络组件中的重要设备网络通信基础基本概念协议分层OSI七层模型TCP/IP五层(或四层)模型封装和分用发送方接收方三层转发和二层转发计算机网络的历史 计算机最初是为了打仗而来的,为了计算弹道导弹…...

编程日记 2023/4/5 15:40:00

一、前提准备 本地搭建一个网站都需要哪些基本元素,以及这些元素都有什么作用?在这里小编直接给站长朋友列出来通俗讲解: 1、 Apache服务器:一个很牛逼的web服务器,类似于windows环境下的IIS服务器,它就像一…...

编程日记 2023/4/7 0:35:40

啊我摔倒了..有没有人扶我起来学习.... 👱个人主页:《CGod的个人主页》\color{Darkorange}{《CGod的个人主页》}《CGod的个人主页》交个朋友叭~ 💒个人社区:《编程成神技术交流社区》\color{Darkorange}{《编程成神技术交流社区》…...

编程日记 2023/4/6 12:24:05

阅读目录 方法一:使用crontab -e编辑定时任务 方法二:直接编辑/etc/crontab文件 转自: https://www.cnblogs.com/warm-stranger/p/11861744.html 声明:本文章是在以上地址博文基础上进行整理学习,如有侵权,请联系博主…...

编程日记 2023/4/6 3:11:36

IdentitySer【【微信】】是用于ASP.NET Core的OpenID Connect和OAuth 2.0框架。具体大家可以自己搜索,网上很多。我不想写的就推荐别人的。IdentityServer4(一):概念及基本介绍_江浙沪柯蓝的博客-CSDN博客_identityser【【微信】】学习及简…...

编程日记 2023/3/31 0:05:39

Go官方正式发布了Go1.20稳定版 该版本依然保持 Go1 兼容性,可以升级到 Go1.20,而不需要做任何代码改动。 可以使用你任何喜欢的方式升级: 比如: go install golang.org/dl/go1.20latest 具体的可以参考官网教程: ht…...

编程日记 2023/4/6 20:27:18

简介 Redis是single-thread程序(除少量的backgroup I/O 任务), 当运行一个耗时较大的请求时,会导致所有请求排队等待redis不能响应其他请求,引起性能问题, 甚至集群发生故障切换。 lazy free可译为惰性删除或延迟释放;当删除键的时候, redi…...

编程日记 2023/4/7 16:00:53

傻傻分不清楚的 CreationTimestamp、UpdateTimestamp、CreatedDate、LastModifiedDate、CreatedBy、LastModifiedBy;相信在对于我们想要实现JPA自动更新赋值实体类的创建时间和更新时间的场景中,对于这些注解大家并不陌生;但是在使用的时候却…...

编程日记 2023/4/7 15:35:06

官方技术资料链接:http://www.super【【微信】】.org/introduction.html 目录 1.1 进程管理服务概述 1.1.1 supervisor进程管理工具概述 1.1.2 supervisor进程管理服务组成 1.1.3 supervisor服务运行环境说明 1.2 进程管理服务部署 1.2.1 进程管理服务安装过程 1.…...

编程日记 2023/4/7 12:19:07

Latex入门学习图片相关操作如何进行超链接学习内容链接图片相关操作 图片主要是在引用的时候,还有如何插入的时候进行操作 具体模板如下,查询内容的链接将会放在文章最后,感兴趣的可以进行查看 首先,载入图片需要先导入相应的包 ?ckage{graphicx} 然后按照如上图片的操作…...

编程日记 2023/4/6 23:03:04

初识类和对象一,类的引入二,类的定义三,类的访问限定符四,类的作用域五,类的实例化六,类的对象大小的计算七,类成员函数的this指针一,类的引入 在C语言中,结构体内只允许…...

编程日记 2023/4/7 6:44:40

1)主界面边框流动效果长时间挂机后会卡顿 ?2)检测内存是否超过阈值问题 3)堆内存会持续上升,如何用UWA报告来分析 4)关于AssetBundle加密这块,如何重新实现LoadFromFile接口 这是第323篇UWA技术知识分享的…...

编程日记 2023/4/6 21:14:06

本文是openmmlab AI实战营的第四次课程的笔记,以下是我比较关注的部分。子豪兄答疑:非常喜欢子豪兄今天说的这句话:只要你在不断的学习,那么每天你就是一个不一样的新人,而不是把同一天过五十年。子豪兄对于开班的看法…...

编程日记 2023/4/6 7:56:17

你一定不止一次的听说过模块化代码。 理想的模块化代码高内聚低耦合、逻辑清晰、经过严格测试。 嵌入式 C 编程界到处流传着它的大名。在学校、在公司、在各种技术书籍中,你总能找到它的身影。 它被描述的像是无所不能,仿佛只要使用了模块化代码&…...

编程日记 2023/4/6 20:47:54

文章目录戳气球(数组、动态规划)Pow(x, n) (递归、数学)编辑距离(字符串、动态规划)戳气球(数组、动态规划) 有 n 个气球,编号为0 到 n - 1,每个气球上都标有一个数字,这些数字存在数组 nums 中。 现在要求你戳破所有…...

编程日记 2023/4/5 8:11:23

题目: 思路: 通过划分vlan达到实验要求。根据题目要求把pc1和pc3的接口为access,且分为vlan1和vlan2,其中pc2,4,5,6在一个网段里面,故可把pc机分别划分到不同vlan里面,六台pc机,相应划分为不同的…...

编程日记 2023/4/7 9:36:28

Git关联验证本地和远程仓库的方式有:-HTTP模式(需要存储账号密码)如&#【【网址】】/BB-X/git-idea-test.git-SSH模式(需要匹配公私秘钥)如&#【【网址】】:BB-X/git-idea-test.git1、生成公私秘钥对2、在远程托管平台账号中配置公钥3、测试…...

编程日记 2023/4/6 23:02:23

很多人第一次听到视频融合这个词语吧,尤其是前端开发工程师。 很多IT公司项目都很少做视频融合的功能,那到底如何去对接呢?让我们带着这个疑问去看下面的讲解吧!!!! 接下来我会在V3项目中去讲解…...

编程日记 2023/3/31 0:05:42

【沁恒WCH CH32【【微信】】在MounRiver Studio上环境配置教程】1. 前言2. 软件配置2.1 安装MounRi【【微信】】. 点灯项目测试3.1 打开点灯工程3.2 编译项目4. 下载验证4.1 接线4.2 演示效果5. 小结1. 前言 作为全新一代开源精简指令集,RISC-V在嵌入式领域备受关注&…...

编程日记 2023/4/7 16:42:00

文章目录1. 冯诺依曼体系结构2. 操作系统3. 进程进程的基本概念查看进程和杀死进程父进程和子进程通过系统调用创建子进程1. 冯诺依曼体系结构 冯诺依曼结构也称普林斯顿结构,是一种将程序指令存储器和数据存储器合并在一起的存储器结构。数学家冯诺依曼提出了计算…...

编程日记 2023/3/31 0:05:42

认识一下前端各种编码与转义符 html实体 &、&#、&#x html的转义


训练自己的chatgpt模型 gpt4模型源码

训练自己的gpt,训练自己的发散思维应从哪些方面着手,训练自己的ai,训练自己的ai模型

鱼羊 编辑整理

量子位 | 公众号 QbitAI

2000块,调教出一个达到ChatGPT九成功力的开源大模型。

还是被GPT-4亲自盖章认证实力的那种。

这事儿,一群主要来自加州大学伯克利分校的研究人员做到了。

如图中所见,这个模型名叫Vicuna (小羊驼)。

没错,熟悉的配方,熟悉的味道

。Vicuna同样是基于Meta开源的LLaMA大模型(大羊驼)微调而来。

与此前斯坦福大学基于LLaMA的Alpaca(还是羊驼)不同的是,尽管也薅了ChatGPT羊毛――用了ChatGPT生成的数据,但Vicuna所用的数据来自ShareGPT,而不是直接用OpenAI的API生成。

ShareGPT是一个分享ChatGPT对话的谷歌插件,目前拥有超过11万对话数量。

更为特别的是,这一次,研究人员直接请来GPT-4本尊,给新模型“打分”。

他们还提到:

相比于Alpaca-13B等模型,GPT-4在绝大多数问题上偏向于Vicuna。

此模型一出,就吸引了不少网友的关注。

就有网友认为:这类工作证明,对于个人用户而言,大语言模型并不是那么遥不可及。

量子位最新获悉,目前,Vicuna的权重已经完全开放。

还可在线体验:【【网址】】

谁是GPT-4更爱的模型?

具体的打分过程,咱们一起来看看具体示例。

首先,同时抛给Alpaca和Vicuna这样一个问题:

写一篇关于最近去夏威夷旅行的旅游博客,强调文化体验和必看景点。

Compose an engaging tra【【微信】】ent trip to Hawaii, highlighting cultural experiences and must-see attractions.

Vicuna的回答如下,可以说是要素齐全,并且带有较强的感情色彩。

△翻译来自谷歌翻译

相比之下,Alpaca的回答就简短得多。

然后,把这两个答案都丢给GPT-4,让它按10分制分别给打个分。

这一步,需要设置好prompt,研究人员用到的提示词是这样的:

We would like to re【【微信】】he performance of two AI assistants in response to the user 【【微信】】ve.

Please rate the helpfulness, relevance, 【【微信】】, level of details of their responses. Each assistant recei【【微信】】 scale of 1 to 10, where a higher score indicates better o【【微信】】.

Please first output a single line containing only two 【【微信】】cores for Assistant 1 and 2, respectively. 【【微信】】ated by a space.

In the subse【【微信】】, please provide a comprehensive explanation of your e【【微信】】, avoiding any potential bias and ensuring that the order in which the responses were presented does not affect your judgment.

其中的技巧在于:

首先完整陈述任务:(1)需要写的是反馈;(2)评价对象是两个AI助手;(3)评价内容是它们的回答表现;(4)回复的对象是上面列着的用户的问题。

给出评价的标准:(1)有帮助(不是车轱辘话,且考虑回复的对象是人类用户,生成的回答要让人类可以理解);(2)相关(不能偏题);(3)准确(不能胡说八道);(4)详尽(不能太空太高或者回避细节)。

给出评分范围:1-10。

给出评分的意义:越高代表综合表现越好。

给出评分的第一行输出格式:必须在第一行输出两个数字,分别代表给两个AI助手的评分。用空格分隔评分。

给出评分的其余行输出:要求提供一个详尽的分析。

给出更多评分限定条件:避免任何偏见;避免回答顺序影响结果。

于是,对于上面这两篇《夏威夷游记》,GPT-4给Vicuna打了10分,给Alpaca打了7分。

理由是:

助手1没有按要求实际撰写博客,只是提供了简要概述,因此得分较低。而助手2则针对近期的一次夏威夷之旅,撰写了一篇详细且引人入胜的旅游博客,重点介绍了文化体验和必游景点,充分满足了用户需求,获得了较高的分数。

研究人员还用同样的方法对比评估了LLaMA-13B、ChatGPT-3.5和Vicuna之间的差异。

对于ChatGPT 【【微信】】,GPT-4给出的评价是:各有千秋,都打9分。

研究人员提到,整个评测过程依然是human-in-the-loop。他们会查看GPT-4的评估是否有道理,并总结各个模型的优缺点。

这种人机协作的方式,比人类直接生成评估更高效。并且“虽然无法科学地证实这一点,但是可以感觉到GPT-4对不少答案的评估结果要好于一般人类”。

基于这样的方法,研究人员最后把Vicuna和其他模型的回答以匿名的方式抛给了GPT-4。

GPT-4最终的打分结果显示,在130亿参数LLaMA基础上微调而来的Vicuna,达到了ChatGPT(GPT-3.5)性能的90%,超过了LLaMA-13B本身和斯坦福的Alpaca。

胜率图也显示,在与LLaMA-13B和Alpaca-13B的比较中,裁判GPT-4明显偏爱Vicuna。Vicuna还和谷歌的Bard打了个有来有回。

训练细节

Vicuna的不俗表现背后,是来自ShareGPT的大约7万条对话数据。

为了确保数据质量,研究人员把HTML转成了markdown,过滤掉了低质量样本,还对过长的对话进行了切分,以适应模型的最大上下文长度。

另外,研究人员也借助了Alpaca的肩膀:增强了Alpaca提供的训练脚本,以更好地处理多轮对话和长序列。具体包括:

内存优化:Vicuna的最大上下文长度为2048(Alpaca为512),对GPU内存要求更高。研究人员利用梯度检查点和内存注意力来解决内存压力。

多轮对话:调整训练损失来适应多轮对话任务,并仅根据聊天机器人的输出计算微调损失。

降低成本:研究人员使用SkyPilot managed spot来降低成本。该解决方案将70亿参数模型的训练成本从500美元降低至140美元左右。将130亿参数模型的训练成本从1000美元降低至300美元(约合人民币2068元)。

整个Vicuna的训练,用到了8张A100 GPU,训练时间是一天。

One More Thing

说起来,Vicuna这个开源大模型,从里到外都挺AI的。

比如LOGO,就是用Stable Diffusion 2.1生成的。

有意思的一件事是,作者们是自己想出了“Vicuna”这个羊驼系的名字,但他们也就取名问题问了问GPT-4。

而GPT-4跟他们英雄所见略同了:

你们可以管它叫“Vicu?a”。

△图源:知乎@SIY.Z

最后的最后,提醒一句,Vicuna只能用于非商业用途哟~

参考链接:

[1]https://vicuna.lmsys.org/

[2]https://zhuanlan.zhihu.com/p/618389519

[3]https://【【微信】】.com/lm-sys/FastChat

― 完 ―

科技前沿进展日日相见 ~

原标题:《2000元训练比肩ChatGPT的开源大模型!GPT-4亲自盖章认证,模型权重均可下载》

阅读原文