庆云古诗词

庆云古诗词

张栋伟谈公益项目 作者张栋伟市场营销专家

互联资讯 0

淘宝搜:【红包到手500】领超级红包,京东搜:【红包到手500】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】

张栋伟专栏,张栋伟毕业于哪所大学,张栋业张栋斌,张伟栋的个人资料

昨天有读者私信我,能否解释一下AIGC和ChatGPT是什么样的关系?

确实,在短短的6个月时间里,AIGC、ChatGPT、大模型等新词汇一下成为媒体热词,加上所谓“人工智能将取代你的工作”之类的焦虑,张栋伟觉得有必要写这样一篇科普。

本文将力求简单化的说明这次人工智能浪潮带来的新词汇和它的意义,带你一文读懂什么是AIGC、ChatGPT、大模型。

1、什么是AI

AI,人工智能(Artificial Intelligence)的英文缩写。

AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

工厂里的自动生产线,小米公司的“铁蛋”机器狗,火车站的人脸识别通道,科大讯飞的语音输入法,都是属于AI系统的应用。

2、什么是AIGC

AIGC,全名“AI Generated Content”,中文直译就是“人工智能生成内容”,也可以称为“生成式AI” (Generative AI)。例如AI文本续写,文字转图像的AI图、AI数字化主持人等,都属于AIGC的范畴。

3、什么是大模型

首先解释,什么是GPT。

GPT的全称,是Generati【【微信】】rmer(生成式预训练转换器)是一种基于互联网的、可用数据来训练的、文本生成的深度学习模型。

GPT是AIGC的一个种类。

在ChatGPT之前,被公众关注的AI模型是用于单一任务的,比如全球所知的“阿尔法狗”(AlphaGo)可以基于全球围棋棋谱的计算,打赢所有的人类围棋大师。谷歌进一步开发的“AlphaZero”在围棋、国际象棋和日本象棋等项目上,都是所向无敌。

这种专注于某个具体任务建立的AI数据模型,叫“小模型”。

ChatGPT与这种“小模型”不同,GPT大模型更像人类的大脑。它兼具“大规模”和“预训练”两种属性,可以在海量通用数据上进行预先训练,能大幅提升AI的泛化性、通用性、实用性。

基于GPT机制建立的AI数据模型,就叫“大模型”。

4、什么是ChatGPT

ChatGPT是由美国OpenAI公司发布的大模型。

由于ChatGPT 3.5展现了超出现实预期的智能数据能力,引发了一场新的全球人工智能竞赛。2023年3月,ChatGPT -4进一步提高了AI的能力。

5、中国有ChatGPT吗?

首先再次强调,ChatGPT是特指美国OpenAI公司的大模型。这是一个产品名称。

但是,领先的产品,往往会成为行业代名词,比如我们说搜索的时候,会简单的说“百度一下”。但实际上,搜索引擎还有360、Bing、谷歌等其他方式。

目前,我们把与ChatGPT类似的产品,暂时叫“类ChatGPT”产品或者直接叫“大模型”产品。

在ChatGPT火爆以后,中国的科技企业纷纷“赶上潮流”,推出了自己的大模型产品。以下是《中国企业家》杂志统计出的一些知名公司的产品列表。

但是,这种复杂的技术模型,显然不是一朝一夕就能实现。多个国内的大模型被国外技术人员质疑,是用ChatGPT进行“套壳”,用以提升品牌形象和股价。

中国的GPT大模型要成熟,还需要比较多的时间和机会,本文后面部分会继续说明。

6、ChatGPT有什么用途

ChatGPT是一种能生成文本、图像等内容的复杂系统。

OpenAI的战略伙伴微软(Microsoft)已将该技术添加到其【【微信】】办公套件及搜索引擎必应(Bing)等产品中。

微软的竞争对手谷歌(Google)也推出了类似的搜索工具Bard。

ChatGPT可以进行从历史到哲学等话题的对话,生成不同风格的文案、文章、歌词、诗歌,甚至直接生成计算机代码,或者对已有的计算机程序代码提供修改建议。ChatGPT也能处理视觉信息,诸如回答关于照片内容的问题。

ChatGPT是基于从互联网上搜罗的大量文章、图像、网站和社交媒体内容,以及与OpenAI人类雇工的实时对话(主要是英语)进行训练的。实际上,早在2014年微软公司面向中国推出了AI聊天机器人小冰,目前不知道小冰的对话内容是否也是ChatGPT学习的数据来源之一。

ChatGPT学着模仿写作的语法和结构,输出常用表达。它还学习识别图像中的形状和图案,如一只猫、一个孩子或一件衬衫的轮廓。它还可以将单词和短语与这些形状和图案相匹配,允许用户询问图像的内容,如猫在做什么或衬衫的颜色是什么。

因为ChatGPT的原始数据来自于公开的互联网,而互联网上的信息并不总是准确的。因此,ChatGPT给出的答案结果,并没有经过事实核查,不能100%保证准确,甚至有些完全是“一本正经的胡说八道”。

ChatGPT需要依靠人类员工的反馈来提高准确性。

其他类似的大模型,同样如此,都需要非常海量的人工能力,来帮助大模型提升准确性。这就是类似于在中国,虽然大家觉得高德地图、百度地图、腾讯地图很智能,但是实际上,它们不仅仅是在调用卫星数据、交通部门数据,还有数以万计的人工“标记员”在帮助和辅助数据修正工作。

7、ChatGPT之类的大模型是如何工作的?

前面已经说过,GPT的意思是“生成式预训练转换器(Generati【【微信】】rmer),这是大模型的核心技术。

转换器是在数据序列中寻找长程模式的专门算法。转换器不仅能学会预测一个句子中的下一个词,还能学会预测一个段落中的下一个句子以及一篇文章中的下一个段落。这就是为什么它能够在长文本中紧扣主题。

由于转换器需要大量的数据,它的训练分为两个阶段:首先,它用通用数据进行预训练,这种数据更容易大量收集;然后,根据它要执行的具体任务,再利用定制的数据进行微调。

张栋伟在最近的两篇文章中多次强调,大模型的核心取决于三个因素:数据、算力和场景。

所有的大模型都要受制于该公司所能合法获得的数据量,还要具备能支撑这些数据的算力。最后,还需要有可以商业化的场景,形成投资-产出的正循环。

8、ChatGPT这样的大模型收费吗?

目前,包括美国的ChatGPT,以及国内的各种大模型,都是免费的。需要个人去官网注册申请。

大模型产品都会提供一个API(应用程序编程接口),允许各公司将该技术整合到自家产品或后端解决方案中。这种企业定制版本,以及面向个人的高级版本,会收费。

需要再次提示的是,上文已经说过,目前大模型都还需要人工进行优化,因此你在大模型输入的内容,以及大模型给你输出的答案结果,这些信息都会被开发者公司阅读到。

所以,请不要输入隐私数据或敏感的公司信息。

9、政府对AIGC的态度

世界各国政府正在探索规范生成式AI工具的方式,担心它们可能被滥用于犯罪、传播虚假信息或威胁国家安全等情况。

4月11日,国家互联网信息办公室(简称“网信办”)发布通知,就《生成式人工智能服务管理办法(征求意见稿)》向社会公开征求意见,意见反馈截止时间为5月10日。

网信办表示, “国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作,鼓励优先采用安全可信的软件、工具、计算和数据资源”。

网信办定义,所谓“生成式人工智能”,是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。网信办明确研发、利用生成式人工智能产品,面向中华人民共和国境内公众提供服务的,适用本办法。

在服务提供者的准入资格方面,《意见征求稿》要求利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》(2018年11月发布)向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》(2021年12月发布)履行算法备案和变更、注销备案手续。

《意见征求稿》详细地分别对提供生成式人工智能产品或服务,对用于生成式人工智能产品的预训练、优化训练数据提出明确要求。

10、AI会抢人类饭碗吗?

任何最新发明的技术,都会对当下的岗位和未来的工作产生重大影响。

在此前的计算机、互联网、移动互联网的技术浪潮中,都会蓝领阶层产生了重大影响。

当前业内普遍认为,AIGC将对白领职业产生较大影响。

但是,回首往事,会发现计算机、互联网、移动互联网三大革命性的新技术,使得社会经济变得更加生机勃勃。

这是因为,经济学家已经发现,新技术的相关影响往往包含三个方面:

(1)一些劳动者提高了生产力;

(2)部分岗位实现自动化或被合并;

(3)产生出以前不存在的新岗位。

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

如果你也想尽早掌握AI技术,请关注我。

作者:张栋伟 (资深互联网人士、市场营销专家、大学生就业创业导师)


左手算力右手应用 北京冲刺“大模型”

左手算力右手算术,左手右手求数字,手算法左手是十位,右手算法

  由ChatGPT掀起的大模型浪潮仍在继续。被誉“AI第一城”的北京,率先将重点落在了政策上。《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》(以下简称《若干措施》)5月12日起向社会公开征求意见,5方面21条措施涵盖了算力、数据要素、大模型技术、应用场景等诸多受到广泛关注的领域。而在AI“新基建”领域,《若干措施》也画出了一条涵盖算力、算法以及数据训练的清晰图谱。作为“人工智能实现的基础之一”,教育、自动驾驶和医疗等领域都是大模型的应用场景,未来大模型或将改变短期内“碎片化的协助作用”,带来全流程的个性、精准化服务。

  算力、算法与数据

  数据、算力和算法,号称人工智能的“三驾马车”,缺一不可。而眼下的重点在于,这场始于AI领域的全球竞赛,却先在算力上引起了一波“焦虑”。上个月,OpenAI停止ChatGPT Plus的销售,便让人猜测是因为需求量过大,计算资源供不应求,随着国内大模型相继入局,对于算力紧张的猜测也自然蔓延至国内。

  《若干措施》的第一条正发力在这一领域,在组织商业算力定向满足本市紧迫需求、高效推动新增算力基础设施建设以及高效推动新增算力基础设施建设三个方面提出了具体的举措。

  具体而言,《若干措施》提到,将加强与头部公有云厂商等市场主体合作,实施算力伙伴计划,并确定首批伙伴计划成员,新增算力建设项目纳入算力伙伴计划,加快推动海淀区“北京人工智能公共算力平台”,朝阳区“北京数字经济算力中心”等项目建设,快速形成规模化先进算力供给能力,支撑千亿级参数量的大型语言模型、多模态大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等研发。

  在算法方面,《若干措施》提到,要开展大模型创新算法及关键技术研究,在数据方面,则更聚焦在“高质量”这一关键词。例如针对目前大模型训练高质量中文语料占比过少,不利于中文语境表达及产业应用的问题,《若干措施》便提到,整合现有开源中文预训练数据集和高质量互联网中文数据并进行合规清洗等。

  高质量的数据需要“国家队”的护航,在这一领域,《若干措施》表示,加快推动数据要素高水平开放的“国家数据基础制度先行先试示范区”建设,争创国家级数据训练基地,提升北京人工智能数据标注库规模和质量等。

  “《若干措施》相当于一个非常明确的专项政策,用以统筹全市资源,更好地赋能、促进人工智能的发展,这种调集全市之力制定专门的政策规划推动一件事的情况,在全国范围内都是相对比较少见的。”北京社科院研究院王鹏如此评价道。

  深度科技研究院院长张孝荣也认为,《若干措施》的亮点在于对人工智能产业三要素以及应用与监管方面都做了比较全面的部署和指导。“不过,在算法研究和基础软硬件研发方面,缺少可执行措施,有较大提升空间;在对于数据质量提升和建立统一算力调度平台方面,有些措施可以商榷,有的可以进一步完善。”张孝荣说。

  立足首都带动全国

  早在ChatGPT走红之前,人工智能便已成为世界科技竞争的焦点。2017年7月,国务院发布的《新一代人工智能发展规划》将人工智能提升至国家战略层面,其中提到,2030年人工智能核心产业规模要超过1万亿元,并将带动相关产业规模超过10万亿元。

  数据显示,截至2022年,我国人工智能产业规模已达到5080亿元,相较于2018年的2288亿元,增长了122.05%,连续五年保持稳定增长。

  首都北京的科技底色更浓。5月15日的2023中关村论坛新闻发布会介绍,2022年北京研发投入经费占比在6.5%以上,达到全国平均水平的2.7倍。在京国家实验室高质量入轨运行,全国重点实验室目前达到了80家,在全国排在第一位。2022年,北京平均每天新创办的科技型企业293家,不到5分钟就诞生一家科技型企业,独角兽企业102家,居全球第三。

  中国数实融合50人论坛智库专家洪勇认为,北京人工智能产业发展拥有优质的科研与教育资源、浓厚的创新创业氛围、丰富的产业生态系统以及完善的政策支持等优势。

  在他看来,《若干措施》对北京发展人工智能产业具有重要意义,它将促进创新发展,提升北京在算力资源和高质量数据方面的供给能力,推动创新技术的涌现。同时,它还将强化北京的核心竞争力,巩固其作为人工智能产业核心城市的地位。

  此外,《若干措施》也将促进产业生态发展,形成完善的人工智能产业生态系统,推动合作与交流。最重要的是,它将带动经济发展,成为北京经济增长的重要引擎,促进北京在人工智能领域的引领地位。

  王鹏也提到,在一系列优势的基础上,未来北京人工智能产业链布局可能会朝三个主要方向发展,首先是基础设施;其次是与数字化、城市转型升级等方面的融合;最后,北京的人工智能不仅是服务北京,还要立足北京,辐射京津冀,服务全中国甚至辐射全世界,这才是北京作为首都,拥有如此多的积累后,应该达到的目标。

  “换句话说,北京的人工智能一定处于我国人工智能的第一梯队,那么北京的目标就不单单是服务中国,而是要更好地走出去。”王鹏总结称。

  离生活渐行渐近

  “为抢抓大模型发展机遇,重视通用人工智能发展,充分发挥政府引导作用和创新平台催化作用……”在《若干措施》中,首句即是这样一句话。

  其中提到的“大模型”是什么?科技部国家科技专家库专家周迪向北京商报记者介绍,大模型是指具有数亿或数十亿个参数的深度神经网络模型,这种模型经过专门的训练过程,能够对大规模数据进行复杂的处理和任务处理,是人工智能实现的基础之一。

  关于大模型的作用,中国民营科技实业家协会元宇宙工作委员会创办人、秘书长吴高斌告诉北京商报记者,其作用在于通过对大量数据的分析和学习,建立出一个庞大的模型,使得机器能够更好地理解和处理人类语言、图像、声音等信息。“这种技术的应用范围非常广泛,包括自然语言处理、计算机视觉、语音识别等领域”。

  目前,“大模型”这个词听起来似乎离消费者还很遥远,但事实上,它已在现实生活中展现过自己的“能力”。“大模型基于大数据,背后需要极大算力支持。”张孝荣向北京商报记者介绍,大模型是大规模预训练模型的简称,其中的大规模又主要指参数量大。“比如ChatGPT模型参数高达1750亿,而与之类似的模型,参数也从数百亿到数千亿不等。”张孝荣表示,“从ChatGPT开始,大模型对文字生成、文本理解、自动问答等任务有显著的改善,现在正在向图片、视频和声音等应用领域延伸。”

  场景创新已在路上

  作为“人工智能实现的基础之一”,大模型的场景应用创新也在不断推进。《若干措施》中提到,将推动通用人工智能技术创新场景应用,其中包括探索在政务服务、科学研究、金融、城市治理、自动驾驶和医疗等领域的示范应用。

  其中,在自动驾驶领域,将支持自动驾驶企业研发多模态自动驾驶技术,发挥大型语言模型高维语义理解和泛化优势,基于车路协同数据和车辆行驶多传感器融合数据,提高自动驾驶模型多维感知和预测性能,有效解决复杂场景长尾问题,辅助提高车载自动驾驶模型泛化能力。同时,支持在北京市高级别自动驾驶示范区3.0建设中,构建车路协同数据库,引导企业开展基于真实场景的自动驾驶模型训练迭代。探索基于低时延通讯的云控自动驾驶模型测试,发展自动驾驶新技术路径。

  在医疗领域,将支持北京有条件的研究型医疗机构提炼智能导诊、辅助诊断、智能治疗等场景需求,充分挖掘医学文献、医学知识图谱、医学影像等多模态医疗数据,构建基于医疗领域通用数据与专业数据的智能应用,实现对各种疾病和症状的准确识别和预测,辅助医疗机构提高疾病诊断、治疗和预防的决策水平。

  “智能医疗和自动驾驶等技术的应用已经有好多年的探索了。”周迪指出,其普及将对普通群众带来重大影响。“以医疗为例,目前医生少患者多,患者排不上队挂不上号是常态。依托人工智能,医疗诊断、影像分析、治疗方案选择等都可以借助人工智能的协助,大大降低人力成本,改善患者看病难的问题。”周迪说。

  动态发展中求解难题

  事实上,自4月11日国家互联网信息办公室起草《生成式人工智能服务管理办法(征求意见稿)》以来,包括《若干措施》在内的各类文件接连出台,充分体现国家对推进通用人工智能大模型发展的高度重视,有望加速大模型走向千家万户。

  而在大模型“飞入寻常百姓家”的过程中,推动大模型的场景应用创新仅是一个开端。由此开端向外延伸,便可看到大模型对于普通群众的实际效用。例如,吴高斌指出,在自动驾驶领域,一个显而易见的效用便是提高车辆的自主驾驶能力,减少交通事故的发生。

  此外,周迪介绍,在医疗领域,大模型带来的前述各项作用仅是相对短期的效用,长期看来,大模型可能使生活中的各类服务更趋全流程的个性化。“比如要去看医生的话,中间存在很多流程,但是大模型训练好之后,就可以给出一整套个性化的就医服务方案。相对而言,目前比较着眼于在各种碎片化功能上的协助作用,未来各类服务则可能达到更加整体更加个性化的程度。”周迪表示。

  “全流程的个性化”不止于医疗领域。“在教育方面,大模型可以用于个性化教育,根据学生的学习情况和需求,提供个性化的学习资源和指导。”全联并购公会信用管理委员会专家安光勇向北京商报记者表示,“它还可以用于智能辅助教育,例如智能导师或智能助教系统,提供实时的问题解答和学习建议。”

  吴高斌认为,总体来说,使用大数据训练得到的大模型对于实际应用、提高工业生产力和促进社会发展具有巨大的前景。“大模型的出现为人工智能的发展提供了新的思路和方法。它的应用将会为我们的生活带来更多的便利和改变。”

  不过,在张孝荣看来,教育、医疗、自动驾驶等领域虽然对AI有广阔的潜在需求,但行业数据源封闭,孤岛化严重,难以提供训练大模型所需的大数据,“因此大模型若要满足这些行业的AI需求,仍需要经过很长的时间去探索,逐步地解决在动态发展中遇到的各种行业难题”。

(文章来源:北京商报)