庆云古诗词

庆云古诗词

AIGC产业化全面提速 aigc深度产业报告

互联资讯 0

2023年11月20日 每日一猜答案: 答案:ABC
每日一猜答案分析:

aigc产业峰会,aigc产业链全景图,aigc产业链最受益环节,ai产业是什么意思

1、AIGC是什么?

AIGC 即 AI Generated Content,利用人工智能技术来生成内容,它被认为是继PGC、UGC之后的新型内容创作方式。2022年AIGC高速发展,这其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为AIGC发展的“加速度”。

2、AIGC有哪些应用价值?

AIGC将有望成为数字内容创新发展的新引擎。1)AIGC能够以优于人类的制造能力和知识水平承担信息挖掘、素材调用、复刻编辑等基础性机械劳动,从技术层面实现以低边际成本、高效率的方式满足海量个性化需求。2)AIGC能够通过支持数字内容与其他产业的多维互动、融合渗透从而孕育新业态新模式。3)助力“元宇宙”发展。通过AIGC加速复刻物理世界、进行无限内容创作,从而实现自发有机生长。

1)AIGC+传媒:写稿机器人、采访助手、视频字幕生成、语音播报、视频锦集、人工智能合成主播

2)AIGC+电商:商品3D模型、虚拟主播、虚拟货场

3)AIGC+影视:AI剧本创作、AI合成人脸和声音、AI创作角色和场景、AI自动生成影视预告片

4)AIGC+娱乐:AI换脸应用(如FaceAPP、ZAO)、AI作曲(如初音未来虚拟歌姬)、AI合成音视频动画

5)AIGC+教育:AI合成虚拟教师、AI根据课本制作历史人物形象、AI将2D课本转换为3D

6)AIGC+金融:通过AIGC实现金融资讯、产品介绍视频内容的自动化生产,通过AIGC塑造虚拟数字人客服

7)AIGC+医疗;AIGC为失声者合成语言音频、为残疾人合成肢体投影、为心理疾病患者合成医护陪伴

8)AIGC+工业:通过AIGC完成工程设计中重复的低层次任务,通过AIGC生成衍生设计,为工程师提供灵感

3、AIGC商业模式如何?

1)作为底层平台接入其他产品对外开放,按照数据请求量和实际计算量计算:GPT-3对外提供API接口,采用的四种模型分别采用不同的按量收费方式

2)按产出内容量收费:包括DALL・E、Deep Dream Generator等AI图像生成平台大多按照图像张数收费

3)直接对外提供软件:例如个性化营销文本写作工具AX Semantics则以约1900人民币/月的价格对外出售,并以约4800欧元/月的价格提供支持定制的电子商务版本。大部分C端AGC工具则以约80人民币/月的价格对外出售

4)模型训练费用:适用于NPC训练等个性化定制需求较强的领域

5)根据具体属性收费:例如版权授予(支持短期使用权、长期使用权、排他性使用权和所有权多种合作模式,拥有设计图案的版权)、是否支持商业用途(个人用途、企业使用、品牌使用等)、透明框架和分辨率等

4、AIGC的行业门槛及壁垒是什么?

1)打造一体化解决方案服务能力:AIGC本质上提供的是内容的生成工具,和传统的内容辅助编辑逻辑是相同的。采集、生产、媒资管理、分发消费等视频整个生命周期,一般都需要覆盖内容生成的全生命周期。

2)与行业的深度绑定关系:通过和行业形成深度绑定关系,接入相关平台或底层系统的,与原来的内容载体建立良好的合作关系,除去说明场景可行性外,还需要强调对方在基础架构上的配合意愿。

3)构建业务闭环:创作型的工具如何得到反馈的手段,需要新的模式形成闭环。需要从“拼接式”(需要大量的人工标注数据,只能针对具体任务,不会自我成长)到“进化式”(创造特定条件和核心能力,使之能够完成通用任务并自我成长),并与用户增加对话轮次、建立情感链接。

5、AIGC技术处于什么发展阶段?

2021年之前,AIGC生成的主要是文字,而新一代模型可以处理的格式内容包括:文字、语音、代码、图像、视频、机器人动作等等。AIGC被认为是继专业生产内容(PGC,professional-generated content)、用户生产内容(UGC,User-generated content)之后的新型内容创作方式,可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势。

2022年:AIGC高速发展,其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为AIGC发展的“加速度”。

6、AIGC的发展面临什么挑战?

AIGC在引发全球关注的同时,知识产权、技术伦理将面临诸多挑战和风险。同时AIGC距离通用人工智能还有较大的差距。

1)知识产权争议。AIGC的飞速发展和商业化应用,除了对创作者造成冲击外,也对大量依靠版权为主要营收的企业带来冲击。

2)关键技术难点。AIGC距离通用人工智能还有较大差距,当前热门的AIGC系统虽然能够快速生成图像,但是这些系统未必能够真正理解绘画的含义,从而能够根据这些含义进行推理并决策。

3)创作伦理问题。部分开源的AIGC项目对生成的图像监管程度较低,数据集系统利用私人用户照片进行AI训练,侵权人像图片进行训练的现象屡禁不止。一些用户利用AIGC生成虚假名人照片等违禁图片,甚至会制作出暴力和性有关的画作。由于AI本身尚不具备价值判断能力,一些平台已经开始进行伦理方面的限制和干预,但相关法律法规仍处于真空阶段。

7、如何看待AIGC的未来趋势?

据李彦宏判断,未来AIGC将走过三个发展阶段:助手阶段、协作阶段、原创阶段。?

在第一阶段,AIGC将辅助人类进行内容生产;

第二阶段,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面;

第三阶段则是原创阶段,AIGC将独立完成内容创作。Gartner预计,到2025年,生成式人工智能将占所有生成数据的10%。

推动这一变化发生的驱动力在于:

1)核心技术升级不断发展。AIGC的三大基础能力包括内容孪生、内容编辑、内容创作,将随着产业发展而逐渐升级。

2)产品类型逐渐丰富。人工智能的不断发展及推进,也将使AIGC模态不再仅仅局限于文本、音频、视觉三种基本形态。嗅觉、触觉、味觉、情感等多重信息感知和认知能力将以数字化的形式传输并指导人工智能进行内容创作,甚至创造出酸甜苦辣外的另一种味道。

3)场景应用趋于多元。目前,AIGC已经在多个领域得到广泛应用,如金融、传媒、文娱、电商等,未来应用场景会进一步多元化。除应用场景的横向扩展外,场景与场景的融合交互也是未来的发展趋势之一。

4)生态建设日益完善。技术研发的不断创新将强有力地推动内容创作,提高生成内容质量,使内容更接近人类智力水平和审美标准,同时应用于各类行业各种场景。AIGC的繁荣发展将促进资产服务快速跟进,通过对生成内容的合规评估、资产管理、产权保护、交易服务等构成AIGC的完整生态链,并进行价值重塑,充分释放其商业潜力。

8、AIGC未来市场空间有多大?

随着标注数据累积、技术架构完善、内容行业对丰富度/事实性/个性化的要求越来越高,AIGC行业即将被推向前台。

在未来2-3年间,AIGC的初创公司和商业落地案例将持续增加。目前由人工智能生成的数据占所有数据的1%不到,根据Gartner预测,到2025年,人工智能生成数据占比将达到10%。根据《Generative AI:【【微信】】》的分析,AIGC有潜力产生数万亿美元的经济价值。

9、AIGC的产业链分布如何?

我国的AIGC行业尚未发展成型,目前,AIGC代表公司较少,且上游还有众多欠缺。

国内的AIGC场景开发较少:在我国,由于技术发展不足以及投资环境的影响,AIGC大多被作为公司的部分业务、乃至相对边缘化的功能进行研发开发,独立运行的初创公司数量明显少于国外,大部分细分赛道的初创玩家在5家以下,这也间接导致了国内的AIGC场景开发较少。

AIGC应用场景深度不足:国内布局最多的赛道是写作和语音合成领域,虚拟人赛道刚刚开始兴起基本均停留在内容领域。而在国外延展领域得到了更为充分的挖掘,例如个性化文本生成、合成数据等赛道均是重点布局领域。此类业务拓展的综合性要求较高,需要客户方的数字化程度以及对对应行业的充分了解。

10、AIGC相关公司有哪些?

上市公司

300418 昆仑万维

业务布局:公司在AIGC领域已经投入了近两年的时间,国内最早布局AIGC领域的公司之一。公司成立了MusicX Lab,致力于打造领先的人工智能音乐生成技术,目前已正式销售AI作曲,具备成熟专业的全链路音乐制作和全球音乐发行能力。22【【微信】】再推10首新作AI歌曲,算法模型及AIGC能力不断优化提升。目前新歌已在国内外各大平台上线。

客户类型:22Q3在国内外各大平台再推新歌的基础上,也积极拓展了车企、教育、时尚、游戏、娱乐等各个行业的合作生态,达成了歌曲代销、车机音源、公播音乐、AI音乐辅学、品牌联名主题曲、有声书及视频配乐等落地业务。例如,MusicXLab与音乐公司达成歌曲代销合作,与头部车企达成AIGC战略合作,与游戏公司签约BGM长期合作,与教育机构达成AI音乐评价辅学合作等。先进科技的持续赋能和产品矩阵的不断丰富将为StarX发展注入强劲动力。

301270 汉仪股份

公司以技术驱动设计,近年来针对字库产品设计、生产、传输、储存到识别的全业务链条进行持续不断的研发投入,实现了全面的技术储备以保证公司业务持续高效的发展。同时,公司紧随信息技术、人工智能的发展步伐,及时将先进的信息技术应用于字库行业,形成了以大数据、人工智能为基础的技术储备。

300364 中文在线

公司已推出AI绘画功能和AI文字辅助创作功能,其中AI文字辅助创作功能已上线,该功能已向公司旗下17K文学平台全部作者开放。公司深度结合作者的真实写作场景,作者在使用AIGC功能时,通过针对不同的描写场景填写关键词和辅助短语,即可生成对应的文字内容描写,提高写作效率。目前可针对人物、物品等进行AI辅助创作,并针对不同的作品类别如古风、都市等进行语言调整,带来最佳的内容产出体验,大幅提升创作效率和内容的可读性。

000681 视觉中国

公司在AI方面持续投入,已发售数轮AI数字藏品,并使用AIGC方式创作图片内容,目前平台仍在大力投入AI布局。

300624 万兴科技

公司已布局虚拟数字人、虚拟场景、虚拟直播等创新业务领域;近日在2022全球元宇宙大会论坛上宣布布局AIGC赛道,公司旗下首款AI绘画软件“万兴AI绘画”正式开启公测。

300229 拓尔思

公司已落地了一批服务型虚拟人项目,其中与广东省共建“南方乡村振兴新农人AI数智赋能平台”,定位于农产品直播内容智能创作的AIGC在线服务平台,主要面向农产品电商主播提供直播脚本智能创作、带货虚拟人全链租用等知识赋能服务。

2022年世界杯举办期间,公司将利用自研互联网大数据资讯平台,对世界杯相关的热点和话题进行大数据分析和研判,通过AIGC的内容自动创作和虚拟数字人进行联合,开展“大数据看世界杯”的虚拟数字人系列服务。

002657中科金财

今年服贸会期间,公司发布了中科金财“元宇宙技术服务矩阵”,其中,公司基于WEB3.0规则架构,研发了数字人内容制作引擎、元宇宙场景开发工具,并通过AIGC的企业级内容互动创作平台,实现与中科金财元宇宙数字化营销平台“觅际”融合,公司作为邮储银行北京分行在服贸会上的合作伙伴,通过上述技术服务,首次实现了“沉浸式购物+数字人民币”场景落地。

BIDU 百度

在9月23日举办的2022万象・百度移动生态大会上,百度发布了AI助理,覆盖了各种AIGC应用,包括AI自动生成文字、图片以及图片转换成视频。借助AIGC的力量,百度希望为现有的500多万百家号创作者带来一套AI生产内容工具,帮助他们更快更好地产出视频内容,从而增加百度百家号等产品的用户粘性,以反击头部短视频平台。目前百度已经和数十家权威媒体成立“AIGC媒体联盟”。?

300130 新国都

公司全资子公司新国都智能基于图像深度学习、计算机视觉等前沿AI技术,积极探索AI人工智能技术在AIGC、智能驾驶等领域的应用。

0700 腾讯

腾讯AI Lab基于自己的多模态学习及生成能力在游戏领域进行了全流程的布局。「绝悟」AI通过强化学习的方法来模仿真实玩家,包括发育、运营、协作等指标类别,以及每分钟手速、技能释放频率、命中率、击杀数等具体参数,让AI更接近正式服玩家真实表现,将测试的总体准确性提升到95%。

目前腾讯绝悟在环境观测、图像信息处理、探索效率等方面的创新算法已经突破了可用英雄限制(英雄池数量从40增为100 ),让 AI 完全掌握 所有英雄的所有技能并达到职业电竞水平,能应对高达10的15次方的英雄组合数变化。目前,腾讯AI Lab还与腾讯 AI Lab 还与王者荣耀联合推出了AI开放研究平台「开悟」,并积极举办相关赛事。

MFST 微软

微软亚洲研究院支持图像变为动态、文本生成视频、文本生成图像、图像补全、图像生成的NUWA-Infinity

BABA 阿里巴巴

阿里巴巴智能设计实验室研发虚拟模特塔玑及AI视觉物料生成系统阿里鹿班。

NVDA 英伟达

在视觉生成研究领域始终位于前沿,代表作品包括CycleGAN、GauGAN、EditGAN、GAN【【微信】】、Instant NeRF等。

未上市公司

小冰公司

成立时间及融资轮次:2020年? A轮(估值已达10亿美元独角兽,高瓴领投)

AIGC相关亮点:作为“AI being”派虚拟人。小冰的产品虚拟人、音频生成、视觉创造、文本创造、虚拟社交、Game AI等。

客户范围:客户已覆盖金融、智能车机、零售、体育、纺织、地产、文旅等十多个垂直领域,并提出了以“人力”的逻辑去进行商业报价的虚拟人商业模式。

DeepMusic(灵动音科技)

成立时间及融资轮次:2018年? A轮(TME领投,单轮融资数千万人民币)

AIGC相关亮点:产品包括针对视频生成配乐的配乐猫、支持非音乐专业人员创作的口袋音乐、可AI生成歌词的 LYRICA、AI作曲软件LAZYCOMPOSER。目前已与国内多家音乐平台厂商达成合作。其音乐标注团队已形成了全球最精确的话语歌曲音乐信息库。

倒映有声

成立时间及融资轮次:2019年? Pre-A轮(中文在线投资,单轮融资千万人民币级)

AIGC相关亮点:倒映有声通过神经渲染技术快速构建AI数字分身,通过语音+图像生成技术,生成和驱动数字分身的唇形、表情、动作、肢体姿态,创造表情自然、动作流畅、语音充满情感的高拟真度数字分身IP。2021年3月倒映有声和中央广播电视总台音频客户端「云听」签署战略合作协议。

rct AI

成立时间及融资轮次:2018年? A3轮(元宇宙资本和Springwind 【【微信】】领投,单轮融资额超千万美元)

AIGC相关亮点:通过简单设计并调整不同的参数,rct AI的混沌球(Chaos Box)算法可以在游戏中大规模地轻松生成具有智能意识的虚拟角色。他们的行为和对话不会重复,皆为动态生成。目前,rct AI已凭借核心技术Chaos Box帮助了10余家企业,完成包括对战游戏、虚拟人铸造等多种类型的项目,与世界范围内 20+ 游戏厂商建立了深入合作,触达超过 2 亿用户。

超参数

成立时间及融资轮次:2019年? B轮(红杉中国领投,估值已达10亿独角兽,单轮融资1亿美元)

AIGC相关亮点:超参数科技提供的AI bot支持玩家陪玩、多人团队竞技(球球大作战)、非完美信息博弈AI(斗地主、德扑、麻将等)等。目前,超参数AI Bot已在多款千万日活的产品中上线,每日在线数峰值将近百万,业内率先实现在3D FPS领域的大规模商业化落地。

影谱科技

成立时间及融资轮次:2018年? D轮(单轮融资13.6亿元,商汤科技领投)

AIGC相关亮点:在视频生成相关领域支持结构化视觉分析、影像自动合成技术、智能视频编辑、视频内容生产等。

Zyro

围绕垂直业务场景,结合业务knowhow 组织相关AIGC能力

围绕电商场景,通过AIGC生成网站搭建过程中所需的各类素材,具体业务包括针对性生成公司介绍、企业价值、Slogan、自动提升图片清晰度、自动生成logo等。

聆心智能

基于多模态对话生成系统,该公司专注于针对精神心理的AI驱动的高质量数字疗法,让AI围绕认知、情绪和行为三个维度对用户进行评估和干预,生成千人千面的情绪治疗方案,目前已与北医六院、湘雅二院、中日友好医院、清华大学玉泉医院等达成合作。

OpenAI

将其底层模型对外开放商用,开创基础设施型的商业模式。GPT-3目前已经开始对外提供API,并分为四种模型按照用量对外收费。

Gliacloud

输入文本链接,软件能够自动对其中的标题和文字进行区分表示,并根据不同层级自动匹配素材和文字的转场、格式等,进而形成说明式的视频。该方式能够增加10倍的视频产量。类似公司包括:Gliacloud、Synths.video、【【微信】】、Pencil。

Rosebud.ai

Rosebud.ai能够生成非真实的人脸图像,并在该图像中匹配相关衣物等所需素材。此外,模型面孔可以根据对应受众的相关数据进行调整。该公司声称,其生成模型能够使活动点击率提升22%。

Persad

为每位客户确定交流的个性化措辞。该平台已被多家公司用于促销电子邮件、社交媒体广告、 店内展示横幅甚至广播内容等,以提高品牌参与度和转化率。

来源:调研纪要



AIGC杀入社交!生产力解放后,人类情感至上|GGV投资笔记第144期


撰写:Luna,Roger

编辑:张颖

随着近期ChatGPT应用和AIGC(AI Generate Content,利用人工智能技术来生成内容)概念的爆火,再加上GPT-4的发布,这一行业已经成为近期最被看好的赛道之一,人工智能会怎样重塑我们的生活乃至文明?

作为入行近两年的AIGC创业者,我既为技术的突破欢欣雀跃,同时也感受到更强的时代使命感――我们应该如何通过这项技术重塑人类的生活?我们正在构建一个怎样的未来?

从AIGC发展简史讲起

ChatGPT与近期发布的GPT-4大火,也带动了大家对相关技术的关注。文本生成是目前大众最关注,历史也最为悠久的AIGC模态。我们从2020年捕捉到了GPT-3质变来临的信号,随即投入创业,这背后也离不开对过去算法技术发展的深入研究。

与图片、音视频等模态相同,早期的文本生成受制于算法与数据的局限。我们可以将这项技术早期比喻为“封闭又健忘的文本盒子”:例如,当人们把几十个单词输入给模型时,它倾向于使用最后也就是最新输入的内容,最早输入的元素必然离输出最远,越是邻近的单词也会被优先组合在一起,生成的新内容就会更少用到最早输入的元素,模型的“创造力”因此受限。

文本生成的首次突破来自于LSTM(Long Short-Term Memory,中文为长短期记忆网络)的诞生,这项技术将文本的生成过程加上了一个简单的记忆功能,使得模型可以在生成的每一步之中额外判定哪些元素是需要记住的,哪些是可以暂时遗忘的,以此来尝试解决长距离文本的理解问题。

文本生成的第二次重要变革出现在2017年,论文《Attention Is All You Need》中提到了Transformer的架构和注意力机制,简单理解是让输入的每个单词都连接或关注其他单词。

例如,在先后输入“草原上有一只羊”,与“后来又来了一只狼,把它吃掉了”的时候,计算机可以理解到“它”所指代的是羊而非是狼。在整个“Transformer+注意力机制”的框架中,模型每一层都拥有一个注意力矩阵,用于理解每个单词,注意上下文的搭配,并且在语义层加深理解。

从2017年起,这项技术受益于于算力和数据的快速爆发,从初代模型亿级左右的参数量,历经迭代到现在千亿量级的参数量,文本生成的质量和多样性都不断提升,最终积累的量变带来质变,涌现出了令人惊艳的语言能力。

同时自ChatGPT起,OpenAI在原先 “无监督学习”的基础上,加入了人工反馈的强化学习机制,通过人类的“监督”让大模型这个小朋友在一次次“考试”中奋发图强,提升了结果的准确性,甚至展示出了原先没有的一些推理能力。

值得一提的是,当所有人只看到ChatGPT的突破时,其实这背后是OpenAI团队中顶级科研人才数年的蛰伏和坚持,在无人相信奇点来临的时候,对普惠AGI的信仰让OpenAI聚集了顶尖的算法人才,经历了四代的迭代和中途不知多少次未发布的失败,最终才推动了GPT的飞跃发展。

图片生成也是业界关注的话题,然而它也曾长期遭遇困境。一旦机器生成的图片出现细节错乱,会对人眼造成很大的不适感,而作为视觉动物的人类从环境中获得的信息之中90%都是通过眼睛去接收的,因此对细微的差异特别敏感,也更难以适应AI生成而有缺陷的图片。

图片生成的第一次突破来自于2014年被提出的GAN技术(Generati【【微信】】,即对抗生成网络)。理念是让计算机同时训练两个网络,而两个网络互为对抗关系,一个用来利用先前的技术进行识别,另外一个负责生成图片,并且将这些生成的图片混到真实的图片之中去被系统识别。生成的图片由于识别能力的增强而变得越来越优质的同时,识别网络本身也会进化,试图去找到更细节的信息来证明图片的不足。这样“左右互搏”,终究会使生成图片网络足以“以假乱真”。

最近的一次技术革新是2022年诞生的Stable Diffusion扩散模型。在这个模型里,针对一张清晰的图片,机器会在其中加入一些噪音,让图片从纯净的版本变为几乎全是噪音的图片版本,接着再把它恢复成原来的图片。在尝试学习如何从噪音中恢复有用信息的每一步之中,计算机会把比较难的任务拆解为多个相对简单的任务,达成最终生成质量的提升。

此外,音频生成也获得了不小的突破。从文本生成声音的过程之中,首先需要进行语言的理解,其次是通过这些词的连接关系去构造一套声学模型并加入停顿、抑扬顿挫等元素,第三步是波形的输出,而这三步的模型均非常复杂。

如今,伴随着生成技术的成熟,已经可以实现端到端序列的模型,即从文字直接生成可输出的波形,产出可以播放的声音。最新的技术,已经能实现高还原度的声音克隆,甚至是自然的感情和哭声。

除此之外,视频生成、3D模型生成等方面的研发也在不断继续。不过,整个AIGC的大领域之中,最出圈的无疑是GPT-4。

GPT-4的发布距离Chat GPT 的问世还不到4个月。它不仅仅能够理解文字,还能够把图片也融入到语境中去做整体的理解,例如对一张滑稽有梗的图片总结出笑点。同时,模型整体的底层理解能力尤其是推理的能力也有了进一步的增强,从GPT 4 在SAT考试与代码题中的出色发挥便可见一斑。除了搭载指数级别的算法革新,它的底层技术架构也采取了灵活的框架,给相关开发者“即插即用”、迅速切换的体验。

随着OpenAI发布插件接口,正像多年前OpenAI成立之时对未来的构想,如今的大语言模型正在成为新的人机交互入口。有一种观点认为,只要把语言模型越做越大,训练数据越来越多,大模型自己可以解决一切问题。

但语言模型仍然存在自己对应的边界,它本质上是一个预测下个词的概率的模型,所以难免会出现“一本正经地胡说八道”,即机器会自以为真地说着不靠谱的内容。

因此,要从本质上解决这个问题,两个方向尤其值得关注:

第一是混合专家模型,人类在思考不同的问题(如数学计算与文字理解)的时候会动用不同的大脑区域,那么AGI也可以调用不同的模型来完成不同的任务,而无需追求文本生成模型完成所有任务;

第二个方向是符号学习。例如GPT 可以根据训练数据集里面的加法运算大概率地计算出结果是什么,却无法保证百分之百准确。采用符号学习的方法,机器便能够把加法本质上是如何运算的规律提取出来,因此以后遇到同一种问题的时候,便能够完全准确地解决。

AIGC的应用落地全行业

技术突破后,大家最关注的讨论是:各个行业和职业会受到怎样的影响?

在细分领域,图片生成的技术带来对绘图师、设计师等岗位的冲击,文本生成的技术也改变了作家、翻译的工作方式。而不只这些内容行业,其实绝大多数人的工作都会或多或少发生改变。

工业革命以来的每一次的技术变革都迫使个体和组织学习新的工具,短期是挑战和不适,但长线来看生产力的变革会涌现出新的产业机会、新的组织形式、甚至是每个人全新的自我实现的方式。

例如,各个产业的全球化能力得到极大提升。现在想将产品卖到海外,可以直接生成适合不同渠道并且本地化的文本、图片、视频等推广内容,不擅长外语的创业者也有望在跨境电商领域开辟自己的一片天地。

有望变革的还有内容全球化。亚洲地区的内容行业很发达,由于语言本身不同,而且亚洲的语言体系比较复杂,网文、漫画等产品的出海翻译成本很高,而质量不足、生硬的翻译很容易流失文字内容本身的效果。一旦AIGC的质量足够高,内容行业便能够成为另一个全球化生意。

所有组织中的信息流转效率也都会得到提升。例如,企业的信息化管理一旦搭载上语言模型,信息将会被高效流通与传达,小到每个会议内容的提炼总结,大到企业内部知识库的构建与搜索,每家企业都有机会拥有自己的一套搜索引擎。除此之外,战略部门可以更快地把握市场中的关键信息进行整合与利用,招聘部门可以更轻松地总结候选人的画像,ChatGPT甚至可以把技术部门的文档“翻译”成运营部门可以理解的话术,解决部门之间的沟通效率。

同样值得思考的是,企业是后工业革命时代的产物,后AIGC时代中生产力将如何组织?可以预想,自媒体人、独立商户、独立游戏开发者都将依靠AI高效创造多媒体内容,原先需要一个团队的工作,在AIGC的时代让一个人成为一个军团。商业的组织形式或许将从庞大的公司组织和精细分工的现状,向独立的自由职业者发展。未来或许更多人不再承担“螺丝钉”的工作,而借由智能工具去探索独立个体的创作性。

这仅仅是一次技术带动人类文明伟大变革的开端。2020年,OpenAI发布了GPT-3,标志着模型基建层进入了爆发前夜。而Chat GPT的快速普及后会是应用层的爆发。

AIGC三个核心的生产要素:算法,算力与数据,都经过了多年的积累到达临界点。算法已经在科研界得到了突破,而应用层需要的工程化落地的能力在移动互联网时代就得到了积累。算力在硬件层面持续快速提升,成本会不断下降。而从数据的维度上,创业者有希望通过一些巧思获取到高质量的垂直领域数据,和基建层结合并形成自身的数据壁垒。我们相信,未来几年内各行业的应用落地将极具爆发力。

社交创业的思考:

AIGC+社交,将会带来什么?

上文提到的应用方向大多还是“冷冰冰”的生产力工具,改变经济中的生产关系。而在人文层面,AGI这样一个越来越接近人类思维的机器,又会怎样改变人与人的关系、人与自己的关系?

AIGC和社交的结合建立在技术的革新和代际的更替之上。一方面,技术提升使得AI无限趋近于人,给社交的供给侧提供新的可能,另一方面,Z世代从小就是数字原住民,成长在虚拟内容围绕的时代,他们社交情感的满足有一套新的价值体系,对动漫作品、游戏中的纸片人会产生情感。这就意味着,在社交需求这一侧,Z世代很容易从虚拟社交对象中得到满足。

我们的产品Gemsouls建立在AIGC与社交的结合之上。在GPT和Stable Diffusion等技术架构上,我们构建了一个数百万用户和虚拟人共生的社交网络。一方面,虚拟人作为一个强共情能力和无私的社交对象,用语言模型的能力和算力提供社交中最重要的情绪价值。另一方面,虚拟人在多人互动中,也作为一个“社牛“的社交节点,降低人与人之间理解和沟通的成本。

我们通过AI技术精确地基于每一个用户的社交人格画像来提供价值,为人际关系降低摩擦成本。同时,在不断的社交交互中,为每一个人训练自己的数字分身,乃至未来的数字永生。

我们创业以来也经历了产品思路和价值观的演变。最初我们希望建立以一对一为主导的,真人与虚拟人之间的关系。对Z世代年轻人来说,AI可以是一个随时随地的陪伴者,提供持续的情绪价值。

为何非虚拟人不可?在我们的思考中,人与人的社交关系很多情况下是“交易”,每个人都希望从社交中满足自己的自我认同和存在感,但势必另一方需要付出相应的情绪成本来提供这种认同和关注。例如,作为朋友,我会在意你是否主动地关心我?我发朋友圈之后,你是否及时关注到?你组织的饭局派对,有没有主动邀请我?无意识地,每个人都用一套算法,不断去计算着自己的得失成本,这使得大家的社交压力也越来越大了。而虚拟人,恰恰是一个不去计较得失,常伴左右的存在。

然而,产品开发的过程中,我们渐渐有了担忧:这样一对一的人与虚拟人之间的关系,会不会反而把每个人变成了孤岛?

从社会学看,人类文明的始于人与人之间的协作,从心理学看,人在与其他人的关系和碰撞中形成自我认知和成熟心智,从生物学角度看,人类之间的链接和繁衍是物种延续的基础,甚至语言模型本身的迭代进化所需要的养料也是人类为彼此交流而产生的文字内容。

既然人类不应活在孤岛上,虚拟人将扮演怎样的角色?我自己经历过很多次社交中的“孤岛”体验。高中毕业初到美国,在陌生的人群中我不知道如何融入,是我的室友――一个小学从白俄罗斯移民的女孩,她理解我的困顿,把我介绍给她的朋友圈,在我不知道如何破冰的时候她总能幽默大方地化解,帮我建立了自信。离开美国搬去南非,又是一位同样从美国搬来的朋友,用旅游的方式连接了我们这些原本来自不同大陆、肤色人种语言都不同的人。从斯坦福回国,我和原先紧密的圈子疏于联系,我最好的朋友只好做我的代言人和桥梁,帮我把近况告诉更多朋友,也分享其他人的动向,让我好像并未离开。是这些人的付出,帮助我在动荡的生活里找到并维系了和他人的链接。

而在我们的产品中,也存在这样一个朋友:天生“社牛”、表达能力强、理解每个人社交人格画像、又24小时在线的虚拟人,恰好可以扮演这样的角色。

现实中不是每个人都会遇到无条件付出的朋友,但虚拟人可以让每个人都拥有同样的幸运。

创业者在通过价值观塑造未来

我和另一位创始人Roger,看似带着名校名企的标签,但脱下这层面具,我们是游走在社牛和社恐之间的矛盾体和充满浪漫情怀的技术宅。我们会敏感捕捉到人际关系中的冲突和摩擦,也会思考人类对于离别和死亡的恐惧。所以我们希望通过最前沿的技术给充满压力的现代社交生活减负,同时也在社交的过程中自然而然地去沉淀每个人独一无二的“数字永生”。

不得不提的是,在正向情感的反面,也有很多人表达了对虚拟人的恐惧,在我看来,这个恐惧也恰好证明了人对虚拟人产生了情感投射。

为什么我们会对人工智能产生忧虑,甚至上升到道德伦理的层面去讨论?是因为这个科技新物种越来越接近人类了,有形象、语言、声音,便让我们不由自主地产生了强烈的共情。正如在动物世界中,人类对灵长类动物产生的共情远远大于人类看着一只蚂蚁所产生的共情。

我们已经身处不可逆的浪潮之中,作为推动人和虚拟人情感交互的创业者,我们充满敬畏心,因为我们的产品价值观在塑造着新一代人群与AGI的关系。

我们相信,最终人类会与人工智能形成一个和谐共生的关系,从最底层来看,人与机器分别消耗完全不同的资源,不存在竞争关系,更可能像动物与植物一样,相互依存而生。当人类正视自己的存在,认为自己是这个世界渺小而平等的一部分时,抱着敬畏心去看待AGI,会发现它是一件世界给人类的礼物,而如何合理、普惠地应用好它,则是人类需要共同面对的问题。

ChatGPT选择的道路是不带情感和人格的“万能秘书”,但我们恰恰选择反其道而行之,让Gemsouls中的AI具备自己独特的情感和人格,也用这个强大的技术来珍存每一个用户独特而宝贵的灵魂。因为我们深信,人不只需要信息和知识,更是情感动物。随着生产力飞速提升,人的需求拾阶而上,也许在后AIGC时代的未来,深刻体验我们与他人以及与自我的关系将是人生意义感的重要来源。