庆云古诗词

庆云古诗词

AI一周见闻:马化腾表示AI是百年一遇的机会,OpenAI用iOS锁定用户粘性,具身智能让AI感知真实世界 | 见智研究

互联资讯 0

2023年11月20日 每日一猜答案: 答案:ABC
每日一猜答案分析:

马化腾首次回应,2018马化腾对话视频,马化腾2021,马化腾 intj

从下周开始,AI一周见闻将增加日更―每日AI见闻栏目,欢迎大家持续锁定华尔街见闻・见智研究。

本周AI见闻新增―见闻新视角

本周要点汇总:

1、马化腾表示AI堪比电力工业革命;美团扩张算法招聘,悄悄研发大模型。

2、 OpenAI发布iOS版本chatGPT,向Plus用户开放70款插件

3、 Meta发布AI芯片-MTIA,25年才能问世,目前还会采用英伟达GPU。

4、 AI绘图新里程碑-DragGAN实现大象转身,汽车一键“敞篷”。

5、具身智能开创AI主动感知,人工智能的下一个浪潮。

6、云从科技发布从容大模型,垂直领域的商业化路径才是国产大模型的机会。

7、 AI黑科技-在家也能体验迪士尼的“飞跃地平线”;半机械“蜘蛛人”颠覆人机交互的认知。

在腾讯 2023 年股东大会上,马化腾表示:“最初大家都以为AI是互联网十年不遇的机会,但是现在对AI的认知已经上升到百年发展机遇,可类比电力工业革命。”腾讯当下也在埋头研发AI技术,但是不急于短期求成,未来会在应用、内容生态创造更多的价值,不仅仅专注于toC端,同样重视to B端的机会。

此外,美团在秘密研发大模型,从3月初开始布局该领域,近日算法团队也在扩张中,并且还在筹划成立单独的“平台部门”,帮助美团大模型通过具体的商业化形式落地。

见智研究认为:当下大模型的竞争非常卷,许多开源的大模型的出现更是加大了这个内卷速度。但是开源大模型的问题在于很难进行商业化,更多的是用于学术性研究;而海外封闭式的先进大模型如果应用在一些关键领域,又会有安全性的隐患问题。

所以发展国内大模型的趋势则在于中文预料库的丰富程度,并且本地化优势强的特征,具有较高的安全性和保密性,未来中文专用大模型的市场化需求会非常高。

特别值得关注的是:大模型和应用结合的商业化价值。无论是openAI、微软还是谷歌都已经陆续开始生态版图扩张,这也是国内AI发展的必然路径,研发成果最终都要变现,产生更大的商业价值。

1、OpenAI发布iOS版本chatGPT,向Plus用户开放70款插件

本周,OpenA宣布正式发布iOS版本chatGPT,需要 iOS 16.1或更高版本才能使用。并承诺安卓版也即将发布。

手机端的ChatGPT支持跨设备同步用户的历史记录,还集成了OpenAI的开源语音识别系统Whisper,用户可以用语音输入内容;能够进行问答、语言翻译、教育辅导、以及自动生成文本等。

此外,ChatGPT向有PLUS用户开放联网功能,允许70个第三方插件使用。

见智研究认为:无论是手机端应用的推广还是开放第三方插件的使用,都是OpenAI为提高用户粘性,进一步做到用户下沉所做出的努力。

移动端的开放会极大提高用户使用频率,在便捷程度方面远高于PC端。自ChatGPT发布以来,用户就一直反馈想在移动端使用ChatGPT。而随着移动端的开放,ChatGPT的日活数量将会再突破新高,商业价值也会达到新的高度。另外,访问量的激增,对算力的需求也会进一步扩大。

此外,第三方插件目前虽然说是仅向PLUS付费用户开放,但是以当前AI内卷的程度来看,全面免费也是指日可待的。

2、 Meta发布AI专用芯片-MTIA

MTIA是专门为训练和推理设计的可编程芯片,MTIA的推出极大大提高了Meta在AI方面的硬件实力。科技巨头的竞争最后都无法逃离核心硬件,特别是在发展AI的时代,算力水平是发展的基石,无法掌握算力,发展进程势必会受制于“他人”。

但是MTIA还有很大的优化空间,预计还要等到25年才能问世。在与NNP和GPU性能测试上来看,MTIA在低、中等复杂度模型上有更好的表现,但是在高复杂度上和GPU还相差甚远。

见智研究认为:Meta发展AI芯片是为长远计,毕竟芯片才是握在手中的核心硬实力,但高性能芯片研发之路非常漫长,该款芯片的设计也早在2020年就开始了。而在当前来看,Meta仍旧会采用英伟达的GPU,毕竟在22年的时候Meta刚刚为引入英伟达GPU而对自己的数据中心进行了颠覆性设计,之后还会主要依靠RSC超算中心发展AI。

3、AI绘图新里程碑-DragGAN实现所有想象

AI绘图被Diffusion模型独领风骚的日子,被DragGAN彻底打破了。名为《Drag Your GAN》的沦为引爆AI绘图圈,该论文由MPII、MIT、宾大、谷歌等机构的学者联合发布,目前已被SIGGRAPH2023录用。

该模型几乎能够实现人们对修图的所有需求,从物体形态、细节、甚至是方向、布局都可以改变,堪称核弹级Photoshop。

用户只需要对照片设置几个操作点(红点)、目标点(蓝点),然后进行拖拽,就可以生成新的图像。

见智研究认为:DragGAN的出现表明机器在图像学习的训练又达到了一个新的高度。值得关注的是:DragGAN具有更强大的泛化能力,可以创建出超出训练数据的图像,比如狮子的嘴型就被完全改变,这基本上就是全新生成内容,而不是原本人们认知中的修图功能。

DragGAN与之前的方法相比,并不依赖于特定领域的建模或辅助网络,而是采用一个通用的框架,利用GAN来辨别图像质量,用点追踪的方式完成图像变形功能。有了这个强大的功能,摄像师、修图师都要偷着乐了。

4、 具身智能开创AI主动感知,人工智能的下一个浪潮。

在ITF World 2023半导体大会上,英伟达CEO黄仁勋又放出豪言,人工智能的下一个浪潮将是具身智能。

见智研究认为:具身智能带来的AI价值远比人形机器人更大。具身智能最大的特质就是能够以主人公的视角去自主感知物理世界,用拟人化的思维路径去学习,从而做出人类期待的行为反馈,而不是被动的等待数据投喂。在人类的五大感官中视觉获取的信息占比超过80%,并且让机器理解人类语言也是非常重要的,所以机器视觉和多模态大模型正是开启机器自我感知学习的两把钥匙。详情内容参见英伟达带火的“具身智能”是什么?AI价值远比机器人更大。

5、云从科技发布从容大模型

人工智能平台公司云从科技在广州发布从容大模型,并展示从容大模型的对话、编程、阅读、中考真题答题等基础能力。从容大模型目前处于内测阶段。该模型属于文生文大模型,还不能完成文生图等多模态大模型的功能。

在开放测试中表现情况:反应速度快,但内容准确性还有待提高。并且数据库的时效性比较低,还在21年。另外,该模型在数学、推理能力上表现还没有达到预期。

见智研究认为:国内大模型的优势在于中文语料库上的丰富程度远高于国外先进大模型。虽然在领先程度上很难追赶ChatGPT,但是从容大模型未来会在垂直产业的应用发展上具有领先性,特别是在金融、政务和制造业领域进行专属行业模型的开发,致力于模型的商业化变现。

1、在家也能体验迪士尼的“飞跃地平线”

国外 Nils Bakker 开发者用 ChatGPT 成功打造一个「虚拟空间传送」系统,采用虚幻引擎 5.1 + ChatGPT + Google Maps 3D Tiles API,用户只需要输入地点,系统将会将采用第一人的视角,带你俯瞰全世界的美景,在家体验飞越地平线的快乐这不就来了。

将 Google 3D Tiles 和 ChatGPT 的 API 结合起来,再利用虚幻引擎的能力,让用户能够身临其境般的感受空间穿梭。这下躺在家里也能感受飞跃地平线的魅力了。

见智研究认为:AI尚且属于行业发展的早期,想象力和创造力都非常重要,行业赛道和商业机会将会如雨后春笋般出现。

2、半机械“蜘蛛人”来了

Jizai Arms的日本机器人公司设计了一种蜘蛛状机器人肢体系统,让人类拥有了可自由操控的机械臂。该系统由六个手臂组成,可以由佩戴它们的用户控制。可最多安装四个机械臂,值得关注的是该系统改变了人机交互的方式。

该假肢非常灵活,可以执行各种任务,应用范围从仓库到医院手术室,未来能够帮助改善残疾人的生活质量。

见智研究认为:机械臂与真人“合体”打开了人机结合的想象空间,刷新了人们对机器人发展的认知上限,未来还会有更多的不可能被实现。

期待OpenAI的第一个开源大模型,能否改写Meta的开源王者地位?



主流aigc产品有哪些 aigc下一次技术革命

主流AIGC 介绍,主流AI工具,主流爱情,主流Ai绘画软件

来源|Tech星球

|何煦阳

策划|杨晓鹤

2016年,李彦宏站在百度联盟峰会的讲台上,向所有人宣布:互联网的下一幕是人工智能。同年,Google 旗下 Deep Mind 开发的 Alpha Go 战胜围棋选手李世石,直接推高市场对AI的想象,一批AI公司崛起,有人把这一年称作“AI元年”。

七年后,李彦宏的预言成真了。这七年里,人们发现“AI赋能千行百业”的愿景,是个美丽的“误会”。商业化困境剥落了AI企业在实验室中的光芒,让其面对最粗糙的波折。

直到2022年末,ChatGPT3.0 横空出世。七年前 Alpha Go 战胜李世石,更多被当作一则惊爆的新闻或奇观,而这一次,人们开始相信AGI(通用人工智能)时代正在到来。上线后仅一个月,ChatGPT全球用户便破亿。前世界首富、PC时代浪潮最大获利者比尔・盖茨惊呼,ChatGPT的出现,不亚于PC或者互联网的诞生。

而由GPT引发的AIGC浪潮,更是让科技生产力实现跃迁。无数新的应用将基于大模型来开发,如同十几年前各种基于Android 、iOS 的应用大量涌现一样,AIGC(人工智能生成内容)相关产品也正在喷涌而出 。更振奋人心的是,AI时代的创业团队将更小、更快,Open AI 只有300人,顶流AI绘画软件 Midjoureny,团队只有11人。

应用层的机会属于每一个有野心、有想象力的人。在被 ChatGPT 点燃的各地“黑客松”比赛中,有人通过 ChatGPT 生成教学视频,用ChatGPT搞投资,折现现金流分析教学;有团队意图利用文生图的能力,帮助每个人画出自己的梦;有产品能识别用户面部情绪,让ChatGPT更恰当地回复......无数冲浪者在屏幕面前敲击键盘,如同即将踏足月球的阿姆斯特朗,或者刚刚分开海水的摩西。

浪潮来临之际,很多“海边的人”会首先受到波及。高盛集团发布了一份报告,警告称,未来五年内,全球将有3亿人因为AIGC而失去饭碗。Stability AI 的 CTO(首席技术官)Tom Mason也提到AIGC影响不只是10 亿人,但这是他们当前的目标。

面对如此大的时代浪潮,AIGC 应用层会有哪些新挑战、机遇?AIGC会给内容生产和职场关系带来什么样的改变,普通人又该如何应对?为了解答上面的问题,Tech星球《产品挖掘机》栏目特别推出“AIGC应用测评Top25”专题,挖掘了国内上百款 AIGC 产品,制作了一份AIGC产品推荐表单。

以“国内可以无障碍使用、AI驱动的产品化、适合不同角色的推荐”为衡量标准,该表单将国内市场的AIGC 产品分成“AI对话、AI数字人、AI办公助手、AI绘画、AI影像制作”五大类,每一类从四个维度进行测评,根据评分分别得出前五名。

该推荐表单致力于发掘国内最好的AIGC产品,帮助用户甄别产品实力,以及明晰哪款产品对自己或公司业务更适合匹配。

同时,Tech星球还访谈了AIGC赛道多位CEO、专家与投资人对未来趋势的洞察,AIGC 降临后,各行各业将会如何重构与洗牌,以及将会如何塑造AI时代的未来。

AIGC产品测评详情如下:

2022年11月30日,ChatGPT上线,仅一周就获得百万注册用户,被视为具备成为下一代互联网入口,甚至开启第四次技术革命的潜力。此后,ChatGPT的发展就一路“狂飙”:母公司被投数十亿美元、与微软打造新版搜索引擎产品Bing、推出插件系统......就在几天前,ChatGPT已推出移动端App,仅半天就登顶App Store。

一个问题浮现出来:为什么人工智能发展这么多年,国内没有能预见到大模型的“涌现”能力?

在访谈调研中,Tech星球向多位受访者提出了这个问题。APUS CEO 李涛告诉Tech星球,他不认为有任何人可以预料到,哪怕是OpenAI 的投资人埃隆马斯克和其CEO Sam Altman。2019年,李涛在硅谷游学时,就曾与 Sam Altman交流 。据李涛讲述,当时 GPT-2 还集中在游戏方向,没引起多少重视。”所谓的‘智能涌现’,是事后总结出来的结果。现在看来,过了100亿参数(涌现)就会发生。”

小冰公司CEO李笛表达了相同的看法,他将OpenAI的成功概括为“工匠精神”。据美国《时代》杂志报道,OpenAI在训练ChatGPT时,在肯尼亚雇佣了大量员工进行数据标注,但李笛告诉Tech星球,当时业内已很少再用人工标注,这是一个没有人愿意尝试的方案。“就像有一个铁杵,你把它磨成针。如果效果不好,那就是功夫没下够。”

但不管如何,一场不入局就会被淘汰的竞赛已经开始。

像在中国科技圈点了一把烈火,国内各大厂、机构争先推出自己的大模型及在此基础上的AI对话产品。而随着国内大模型“百舸争流”,各种测评标准也被陆续提出,如真格基金的Z-Bench v1.0,以及中文通用大模型评测基准SuperCLUE等。社会讨论热度呈指数级激增。

更聚焦大模型产品化的Tech星球测评结果显示,文心一言与讯飞星火表现不相上下。当然,讯飞星火正陷于市场质疑其是“套壳GPT”之争,而百度目前已基于文心一言大模型推出搜索产品“百度AI对话”(又名“搜索AI伙伴”),可进行联网搜索、语音输入,并设有众多垂直场景入口,因此处于领跑阶段。综合测评中,阿里旗下的“通义千问”在数学、编程能力稍逊一筹,其他方面表现良好。“商量”与“天工”则在实测中均出现等待时间较长、作答卡顿的现象,产品化还有很长的路要走。

国产AI对话产品离ChatGPT还有多远?

国产AI对话产品离ChatGPT还有多远?是否还有后来居上的可能?5月5日,一篇来自 Google 内部泄露的文件被广泛传播,该文章声称开源AI会击败Google和OpenAI,获得最终的胜利。昆仑万维CEO方汉对Tech星球称,“长期看,开源大模型与闭源大模型之间永远是相互补充并存的关系。”李涛同样赞同,“开源会将所有人的认知、技术水平都拉平,届时算法将不是取胜的关键要素。”

那未来国产大模型与AI对话产品如何取胜?李涛认为,关键在于“场景”,国产大模型需要尽快把所有应用场景都铺满,用新鲜的、高质量的数据进行训练。而李笛更直言,目前大模型同质化严重,一条突破路径是“做垂直领域模型,用垂直数据训练,请垂直专家调优,卖给垂直领域客户。在一个参数规模上,把模型调到极限。”

大模型在一些场景涌现的拟人能力,加快了数字人行业的发展,他们已经开始在部分场景完整取代人类。

硅基智能创始人司马华鹏用“润物细无声”形容公司的数字人短视频和直播业务。司马华鹏告诉Tech星球,目前硅基智能在各行各业中已经生产了接近150万个数字人,预计2023年预计收入达40亿元,业务遍布抖音、TikTok、Youtube、亚马逊等国内外平台。战绩来源于其较早大范围深耕SMB客户,拿下了较容易得手的“低垂的果实”。

2020年从微软独立出来的小冰则独辟蹊径,追求与人类建立“深度关系”。腾讯微媒数字会议CEO天狐接受采访时称:“目前市面上的(数字人)公司除了小冰的算法,其他都只能算起步。”

小冰公司CEO李笛告诉Tech星球,小冰推动了数字人从动作捕捉+知识图谱的第一代技术,向深度神经网络渲染+小冰框架大模型的第二代技术演变。因此,小冰公司有实力拿下遥望科技等直播行业KA客户,以及追求“每个人都配备数字人”的“野心”。但一直追求技术化,走高端路线,商业化盈利还有很大提升空间。

在可预见的未来,AI数字人的竞争将越来越激烈,也面临更多的挑战。一方面,政策、平台对数字人的监管正日趋严格,抖音日前发布新规,要求虚拟人需在平台进行注册,虚拟人技术使用者需实名认证。

在抖音打响“反智”第一枪后,数字人直播行业引发了震动,百度、硅基智能等支持真人驱动数字人的企业,因为对古早技术做了备份研究,因此能够迅速转型。

另一方面,数字人企业越来越多,制造数字人的成本越来越低,如小冰目前在日本推出“GPT克隆人计划”,只需收集用户三分钟数据;腾讯云智能近期推出小样本数智人平台,费用最低至1200元。数字人制作成本急剧降低,也在引发“会有千万个董明珠分身,不会有下一个孟羽童”的讨论。

AIGC抢打工人饭碗,哪些行业“高危”?

在具备完整形态的数字人方面,人们有充分的警觉意识。但在一些行业中,AIGC带来的效率提升,悄然产生了裁员,很多人惊觉“时代抛弃你时,连声招呼都不打”。

焦虑首先蔓延到内容生产行业。4月12日,有截图显示知名公关及广告服务商蓝色光标华东区总部运营采购给部下发邮件,称无期限全面停止创意设计、方案撰写、文案撰写、短期雇员四类相关外包支出。对此,蓝色光标方回应称,相关邮件内容属实。

原画师行业同样是AIGC时代中的“高危”行业,同样在4月份,有游戏外包公司裁员接近30%,其中原画师所占比例大。

海德格尔曾经形容现在的时代为“世界图像时代”,技术的平民化大大降低了图像生产的难度,为AI训练提供了丰富的数据,因此AI绘画领域门槛较低,技术成熟,竞争激烈。Tech星球观察发现,事实上,不同的AI绘画产品经进行细致调整后,均有较好的效果,产品策略、功能种类、用户生态等其他因素,在抢夺用户心智上中更为重要。

比如,年营收达1亿美元的Midjourney,追求的是AI绘画能力的天花板,文心一格的定位就是与其对标,比的就是谁能准确理解“车水马龙”。而Stable Diffusion则利用开源路线丰富自身的定制能力,*AI就是利用其迅速推进产品化,优化出上百种风格。没有自研大模型,也许会影响*AI的发展潜力,但却能获得当下用户的喜欢。

在AIGC产品中,最难啃的“硬骨头”可能是“AI影像制作”。相比绘画,AI影像创作更复杂,国内AI影像创作产品不多。投资了达观数据等大模型企业的红点创投执行董事张学思表示,视频的一帧中可能就具有多个元素,如何在连续帧中做各种效果,并保证视频不会变形,很具挑战性。该类产品主打的AI能力为图文转视频,考验图文与视频匹配度。腾讯智影、剪映科技因背靠腾讯视频、西瓜视频两大素材库,能调动的视频资源丰富,与图文匹配度高,天然具有优势地位。

因此,上榜的后三个产品分别选择从不同的细分场景切入。如一帧秒创CEO雷涛表示,一帧秒创瞄准的客户是不会剪辑的初学者,强调的是全部AI自动生成。一览科技创始人罗江春则认为,“中国不缺剪辑、后期,缺一个好故事”,因此一览运营宝主打“AI编剧”。而讯飞智作则一直深耕音频领域,在影像制作的配音环节表现良好。

如何抓住红利和“下个十年的船票”

当然,AIGC带来的不止竞争,也有机遇,比如接入AI后的办公助手。该类产品又可分“企业AI办公助手”与“个人AI办公助手”,前者多为原来企业办公应用的延续,后者的开发对标国外微软copilot、Notion AI。该类产品总体较少,功能相似,且均在开发中。“Word你也是个成熟的软件了,应该学会自己赚钱了”,这一天或许并不遥远。

这五类产品远不是AIGC产品的全部。在调研和测评过程中,Tech星球发现了更多有意思的产品,如 APUS 开发了一款面向海外市场的《圣经》产品 KJ【【微信】】 ,目前 DAU 已过百万;有海外公司推出AI助手“【【微信】】”,帮助创业公司检验创业想法;还有开发者将AI与睡眠场景相结合,开发了“私人睡眠教练Centenarian”......

一幅风起云涌的时代画卷正徐徐展开。张学思向Tech星球表示,To B业务可能不会被改变太快,但AI对To C业务将影响深远,而且将可能出现后来居上的局面,如移动互联网时代中后来者抖音、拼多多的强势崛起。新的火花将在大模型的基础上点燃,“人工智能吞噬世界”的未来或已渐渐浮出水面。

熊彼特将经济的发展形容为“创造性毁灭”的过程。继人类迈入数字社会以来,我们已见证过两次革命,第一次PC互联网革命,诞生了网络写手、电商运营、电竞玩家,也冲击了百货商场,凋零了路边报亭。第二次移动互联网革命,诞生了自媒体人、带货主播、网约车司机,也取代了古典网络论坛,淘汰掉BB机与现金。李笛觉得,从更长的时间轴来看,新技术影响的从不超过两代人,新一代人总会找到新的岗位,组建新的社会。

不管如何,AIGC已然成为了数字时代不可逆的洪流,时代的浪潮不留恋顾影自怜者,而奖励那些灵活求变的冲浪人。

未来已来。