庆云古诗词

庆云古诗词

中国版chatgpt之战

互联资讯 0

2023年11月20日 每日一猜答案: 答案:ABC
每日一猜答案分析:


人工智能(AI)聊天机器模型ChatGPT风潮狂飙超过百日,包括马斯克在内的商界大佬、科技巨头以及各国政府都已开始着手围剿GPT。

钛媒体App获悉,北京时间4月25日凌晨的RSA 2023大会上,美国科技巨头谷歌(Google)宣布推出基于Sec-PaLM LLM大模型技术的谷歌云安全 AI 工作台(Security AI Workbench),与微软GPT-4版Security Copilot竞争。而5天前,谷歌CEO官宣谷歌大脑和DeepMind两大团队合并,组成“Google DeepMind”部门,以应对ChatGPT带来的技术冲击以及领导研发谷歌多模态 AI 模型项目等。

不止是谷歌,亚马逊(Amazon)也加入到了GPT战局,日前推出AI大模型服务Amazon Bedrock等,阻击基于GPT-4的微软云全新大模型云服务方案;亿万富翁、特斯拉CEO马斯克(Elon Musk)日前也成立了一家人工智能公司X.AI,囤下1万张英伟达A100 GPU(图形处理器)芯片,目标要对抗ChatGPT和其背后的OpenAI公司。

GPT的风险问题也引起各国重视,开启了下场调查和监管。

3月31日,意大利打响调查ChatGPT第一枪,要求暂时禁止使用ChatGPT,并对OpenAI公司展开调查;随后法国、爱尔兰、西班牙跟进,欧洲数据保护委员会则成立专门工作组开展调查;美国商务部下属部门4月11日向公众征求意见,研究是否在新型 AI 模型发布前进行审核认证;马斯克等科技大佬发布公开信为暂停开发 AI 模型之后,微软、谷歌、苹果、英伟达4月12日共同商议并制定AI相关安全协议。

国内方面,3月以来,互联网科技大厂纷纷下场,一些前AI大佬们也重新出山,开启“百模大战”。阿里通义千问、百度文心一言、商汤日日新SenseNova体系、华为云盘古、昆仑万维“天工”和京东言犀等大模型产品陆续公布,创新工场CEO李开复、前百度总裁陆奇、美团联合创始人王慧文、搜狗创始人王小川、前谷歌科学家李志飞等商业大咖陆续下场,加入到这场大模型竞速中。

所有人都已感受到GPT带来的焦虑,纷纷下场开启围剿GPT行动。

据钛媒体App的梳理统计,自去年11月末至今,全球企业、科研机构已经公布总计超过20个大模型产品。

多位行业人士告诉钛媒体App,目前国内类ChatGPT基本等同于GPT-3及以下的技术水平。与最新GPT-4相比,国内产品差距的主要原因与技术不强、算力不够、产品体验差、工程化能力弱等因素有关。

如今,为了争夺“中国版OpenAI”席位,国内 AI 行业处于尴尬局面。如果跟随,不一定有足够资源做出媲美大厂的产品,如果不跟,又很容易被新进入者颠覆。因此,“重复造轮子”情况已然发生,“你有我也要有”、“人人都做大模型”时代正在到来。

OpenAI似乎也开始“灭火”。公司CEO奥特曼(Sam Altman)4月中旬表示,目前OpenAI没有训练GPT-5,而是要继续优化和扩展GPT-4功能,此前消息称GPT-5将会在2023年底公测。

国内外类ChatGPT技术布局及应用场景不完全统计(图片来源:钛媒体App编辑整理)

三方围剿:大厂追赶、大咖下场、政府担忧

谁也没有想到,短短几个月内,AI 就在各行各业掀起了一阵狂风暴雨。

“这两个月GPT大模型风靡全球,远超过去十年 AI 技术与产业的发展热度,也使得过去二十年互联网科技发展被取代。”一位行业人士告诉钛媒体App,她认为这是继2021年“AI 四小龙”(商汤、旷视、云从、依图)集体被美国制裁之后,AI 行业新一轮热潮。

自去年11月发布至今,ChatGPT(Chat Generati【【微信】】rmer)访问量已飙升至8.89亿次,也是历史上最快达到1亿月活的应用,而且整个热潮已蔓延至微软、谷歌、英伟达等科技大厂,以及学术界、产业界当中。

从独角兽到大厂,从使用者到投资人,从业界到学术界,所有对其感兴趣的人士都在讨论ChatGPT以及 AI 技术带来的影响与未来发展。

不仅如此,ChatGPT还在不断进化。今年3月初,ChatGPT的APl接口开放,允许开发者技术开发;两周后,GPT-4问世,语言交互长足进步,具备针对文宇、图片进行分析、分类创作等功能,使得ChatGPT成为全球使用人数最多的多模态通用大模型产品;十天后,ChatGPT又开放了插件测试,实质上拥有了自己的应用商店。与此同时,Bing必应搜索引擎和Office套件等微软各类产品均接入GPT-4技术,使微软的 AI 能力领先同行一大步。

最近一场播客节目中,英伟达CEO黄仁勋直言,GPT-4的突破之一是可以同时学习语言和图像内容,就跟人类学东西一样,阅读图文比只看文字更容易理解事物。

如今,GPT大模型的发展速度已经让外界望尘莫及。所以为了防御,谷歌、百度等科技大厂,马斯克等商业大咖,以及各国政府积极开启“围剿”模式。

今年2月7日,谷歌CEO桑达尔·皮查伊(Sundar Pichai)在官方博客上宣布推出谷歌下一代 AI 对话系统 Bard。随后谷歌展示“多重搜索”功能,并更新多个旗下App,而且砸下超过20亿元投资OpenAI的竞争对手Anthropic,后者估值增至近50亿美元。

3月初,Bard对外开启测试,但效果不如外界预期,和ChatGPT的产品体验相比有一定距离。

4月中旬,皮查伊表示,Bard将从基于轻量级LaMDA模型,升级为更大规模的PaLM模型,他表示升级后,Bard在处理常识推理和编程问题等任务时能力更强,升级版Bard很快推出。“随着时间的推移,将出现能力更强大的模型。我在乎的不只是领先,完全掌控AI模型对我们来说非常重要。”

甚至连“OpenAI黑粉”马斯克也下场参与竞争。

4月14日,华尔街日报援引知情人士称,马斯克计划成立了 AI 初创公司X.AI,与对手OpenAI竞争。据内华达州备案文件显示,美国X.AI公司于今年3月9日就注册成立,目前马斯克担任董事,马斯克家族办公室主任Jared Birchall担任秘书。

据报道,马斯克还从谷歌的AI部门DeepMind等开挖LLM专家,目前已成功挖到约六位,其中包括高级工程师Igor Babuschkin、软件工程师Manuel Kroiss等。

与此同时,国内互联网科技大厂也集体下场。阿里、华为、腾讯、知乎、商汤、百度、京东、360、昆仑万维等企业纷纷进入大模型竞争中,一把手带队,堪称10年来中国科技圈最卷的一个月。

4月18日,GPT产业联盟正式成立。据悉,该联盟由中国移动通信联合会、中国电信、中国移动、中国联通、中国广电等单位共同发起。

不过从整体水平上,国内类ChatGPT还有很大差距。

王小川却告诉钛媒体App,追上GPT-4或者GPT-5,中国企业不会低于两年,可能需要3年左右的时间。周鸿t也表示差距在三年左右。

而前Google(谷歌)科学家、出门问问创始人兼CEO李志飞告诉钛媒体App,中美大模型的差距为16个月。他解释称,2022年1月谷歌发布指令学习大模型FLAN,之后的2022年10月ChatGPT发布,2023年3月GPT-4发布。中国企业目前发布的一批大模型与FLAN水平相近。

如今,ChatGPT大模型已经成为中国 AI 史上的一个重要发展目标。

华西证券研报总结了现有国产大模型两个特征:“一是头部厂商主导,To B为主要模式,赋能原有优势业务;二是均未对公众大面积开放,未有明确的To C入口,实际水平不透明。”

旷视科技联合创始人、CEO印奇对钛媒体App表示,未来12个月将是AI大模型技术发展的关键节点。他指出,未来的一段时间,能不能有一个公司首先把大模型真的做出来,且性能真的是达到GPT-3.5,这是所有事情的起点。国内一方面要用最艰苦朴素、奋斗的状态来攻坚核心 AI 技术,另外中国 AI 公司想活得长,必须要把大模型商业化。

“大模型这波肯定会‘一地鸡毛’,因为技术这件事情还真不是‘大力出奇迹’。我认为五、六个月之后 AI 行业一定会有很多‘泡沫’,”印奇对钛媒体App表示。

同时,AI 正影响着人类工作和生活,风险如何控制似乎成为了重要课题,各国政府开启对GPT的“围剿”。

3月下旬,意大利数据保护局(Garante)以涉嫌违反数据收集规则为由,对ChatGPT的开放公司OpenAI展开调查,并宣布禁止使用ChatGPT,且暂时限制OpenAI处理意大利用户数据。

4月11日,美国总统拜登(Joe Biden)已经开始研究是否需要限制ChatGPT等AI工具。美国商务部下属的国家电信和信息管理局当天就其所谓的问责措施正式公开征求意见,包括具有潜在风险的新AI模型在发布前是否要走认证核准程序。

同一天,中国下发《生成式人工智能服务管理办法(征求意见稿)》的通知,并向社会公开征求意见。

4月13日,法国国家信息自由委员会决定对ChatGPT提出5项指控,并展开调查。同日,西班牙数据保护局也发表声明,称该机构已经正式对ChatGPT可能的违反法律行为展开初步调查程序。

观韬中茂律师事务所合伙人王渝伟认为,生成式 AI 对于监管行业来说是一个非常新的事物,现在针对算法、技术等立法监管并不能完全覆盖目前出现问题,对于监管来说是很大的考验。难点是如何找到一条既能做好监管,又能不影响行业发展的路径。“在具体执行中,对于 AI,立刻出台一个全面监管显然不现实。”

就目前看,关于生成式AI的法规争议问题主要集中在三个方面:知识产权例如版权、商业秘密保护等问题;涉及数据安全与个人信息保护;涉及数据跨境问题。

微软、亚马逊等国际巨头企业亦对自己的员工发出预警,不要与ChatGPT分享公司的相关敏感信息,因为它们可能会被ChatGPT用于训练未来的语言模型。

4月12日,在解决监管机构的担忧后,意大利当局称将暂停对OpenAI处理该国用户数据的临时限制令,OpenAI也将再次在意大利开放。

钛媒体App询问 ChatGPT,为什么科技大厂、商业大佬、各国政府三方会集体围剿GPT?

它认为主要有三个原因:一是GPT威胁到各大科技公司自身的核心技术和市场份额;二是GPT存在一定的道德和伦理问题,引起公众的关注和质疑;三是企业内部存在利益冲突,导致科技大厂集体围剿GPT。

算力、商业化成挑战

算力资源是这场大模型竞争中的入场券。

“超过千亿级别的大模型,它的训练大概需要1000-2000张A100的卡,没有2000张A100的卡,实验都做不了。硬件成本约5000万美金,加上人力、电力、网络支出,一年需要5000万美金到1亿美金的投入。”昆仑万维集团CEO方汉表示。

工信部最新数据显示,截至2022年6月,中国算力总规模仅次于美国排名全球第二,在全球算力分布中占比26%。近5年,中国算力总规模年均增速超过25%,算力需求不断提升。

事实上,尽管 AI 算力发展不是一个新鲜的话题,但随着ChatGPT的崛起,基于服务器芯片的 AI 算力需求愈加强烈,在外界高需求、高关注、高压力之下,现有的服务器瞬时算力很难支撑高达千亿参数的大模型推理训练,大模型已经遭遇算力瓶颈。

4月初,以“访问需求量过大”为由,OpenAI暂停了一天ChatGPT付费服务注册,并在亚洲等区域大规模清理批量注册的OpenAI账号。随后有市场有人猜测,ChatGPT已有GPU(图形处理器)芯片已不够承载目前的用户量,进而质疑ChatGPT的盈利模式是否持久,引发市场关注。

无独有偶。钛媒体App发现,4月17日下午,百度文心一言也出现了访问需求量过大问题,显示“当前使用人数较多,服务可能响应缓慢”。

据央视财经引述一位行业专家称,虽然中国的数据中心已形成较大规模,但智算中心和边缘数据中心的占比仍有待提高。据悉,中国 AI 服务器的市场规模大概400亿至500亿元,今年市场增速将超过30%。

根据英伟达公布的信息,训练一次1750亿参数的GPT-3需要34天、使用1024张A100 GPU芯片,同时,OpenAI可能至少需要3.24万张A100用于日常推理,显著高于此前训练底层模型时的用量,以此推算,ChatGPT硬件成本达8亿美元以上。

印奇则透露,要做成GPT大模型,至少得要1万张英伟达A100 GPU芯片,硬件投入就需要20亿元,中国目前可用作大模型训练的A100芯片总共只有4万张。

据The Information报道,包括亚马逊、微软、Google 和甲骨文等主要云计算供应商都在限制客户对云服务器的使用,一些客户称租用硬件的等待时间长达数月,核心问题仍是GPU等算力芯片供不应求。尽管像微软这样的厂商已经在其60多个数据中心部署了数十万张GPU芯片,用于 AI 模型的日常推理。

随着GPT-4发布,市场普遍认为需百倍的芯片及其算力支持,英伟达(NASDAQ: NVDA)股价也随即飙升,年初至今大涨86%以上。

不过,受2022年10月美国商务部半导体出口管制新政影响,英伟达A100及H100以上芯片不能出口给中国客户,从而在硬件上对中国大模型发展形成钳制。

钛媒体App了解到,中国目前能采购的A800实测性能比A100低5%-10%,而最新应用GPT-4的英伟达H100新片,比中国特供版H800的性能差距超过60%。但目前国内拥有英伟达A100/A800的厂商只有阿里、腾讯、字节跳动等几家科技巨头,大部分企业对高端GPU并没有直接采购需求,而是用更经济的调用云服务商的云计算能力,或是租用GPU芯片等硬件设备。

印奇认为,中国 AI 大模型发展过程中,“缺芯”将是一大风险。他告诉钛媒体App,AI 芯片制造(Fab)是很大的技术难点。

一位行业人士对钛媒体App表示,由于大模型需要巨大的算力支持,现在百度缺少芯片,其正在为文心一言大量、溢价50%以上采购英伟达A100/A800芯片和服务器卡,“百度现在说有多少就要多少。去年百度采购的英伟达服务器芯片现在才发货,现货溢价很高,因为英伟达也在涨价。”上述人士表示。

据芯片分销平台数据,国内A100芯片现货市场价已经从7万元涨至9万元。另据财新,英伟达A800在国内也已被炒到原价2倍多,且紧俏到脱销。

目前,国内外大模型厂商普遍追加了对英伟达GPU的采购预算,而国内厂商未来一年算力需求主要还是在训练,对GPU的需求更高。

不过,国产 AI 芯片算力是否成为大模型“卡脖子”因素还存疑。王小川告诉钛媒体App,中国可以购买的英伟达A800芯片,性能差距不大,目前不会成为“卡脖子”的瓶颈,尤其他对未来国产芯片技术突破有信心。

但清华大学计算机科学与技术系教授唐杰却指出,随着大模型训练参数不断扩大,国内大模型厂商在底层算力的差距将进一步放大。“英伟达H100也逐渐量产了,它训练千亿参数非常快。如果我们未来的芯片不能快速发展,差距会越来越大,目前也没有任何机会跟他们缩短距离。”

一位行业人士向钛媒体App直言,目前国产GPU类型芯片无法取代英伟达A100/H100,国内 AI 芯片很难跑动大模型。

商汤科技联合创始人杨帆今年2月的一次演讲中提到,国产 AI 芯片在产业落地中会遇到两大挑战:一是 AI 芯片与框架耦合性差,适配工作量巨大;二是链路长,国产芯片对 AI 场景的理解能力不强。他提及,训练大模型常遇到“梯度爆炸”或者硬件故障造成机器过载迭机,整个系统都会跟着受到影响,以前迭机频率是10分钟一次。

今年3月业内消息称,英伟达已经向台积电增加A100/H100和【【微信】】芯片生产订单,但其生产交付周期大约为两到三个月。这意味着,企业当下预定英伟达芯片,预计今年下半年或明年才能到货,但届时国内外大模型产品早已遍地开花。

除了算力之外,商业化变现也是GPT大模型发展的另一挑战。

消费端方面,今年2月2日,OpenAI公司宣布推出付费试点订阅计划ChatGPT Plus,定价每月20美元。付费版功能包括高峰时段免排队、快速响应以及优先获得新功能和改进等,同时该公司仍将提供对ChatGPT的免费访问权限。据媒体测算,基于1亿用户、每月20美元计算,ChatGPT年收入将超过200亿美元。

同时,企业端方面,OpenAI技术与微软业务融合不断加深,微软正借助GPT技术加持,在搜索广告、云服务模式等领域实现商业化落地。不仅如此,消费端可以明显感受到,当前微软Bing已经集成GPT-4, Office和电子邮件已经集成了由GPT-4驱动的Copilot,可以大幅提升办公效率,吸引更多微软付费用户。

多家券商研报认为,随着GPT-4、文心一言等大模型逐渐优化和完善,搜索引擎、智能客服、内容创作(小说、广告文案等)等相关应用有望率先商业化,尤其在媒体、广告营销、文学、教育、金融、智能汽车等领域均有望迎来变革。目前,Shopify、返利科技等多家电商相关企业开始接入ChatGPT,称希望提升运营效率。

创新工场董事长兼CEO李开复表示,以ChatGPT为首的AI 2.0将在电商/广告、影视/娱乐、搜索引擎、元宇宙/游戏、金融、医疗六大领域加速 AI 的商业化潜能,进入提升生产力的应用井喷期,并提高社会生产力。他引述报告称,预计到2032年,AIGC 全球市场规模将超过2000亿美元。

不过,晨星亚洲高级分析师王凯却表示,目前讨论中国企业能否从类ChatGPT产品中获得多少收入或利润还为时过早,大家仍在探索应用场景,仍需要弄清楚国内类ChatGPT产品将如何商业化。

IDC中国研究总监卢言霞则指出,仅仅依靠大语言模型不会为任何公司提供持续的优势,类似 ChatGPT 的技术目前对市场的影响也有限,而从长远来看,许多相关的 AI 模型甚至可能变得无关紧要。很多科技巨头花费大量资金最终可能却无法获得成功回报。

“要做出AI大模型,在硬件工程、算法和数据三方面,都需要专业经验的沉淀和积累,拿到资金和硬件等资源,只是拿到了张入场券而已。”杨帆表示,产业对 AI 的理解不足是重要问题之一。

王小川告诉钛媒体App,他认为最终科技大厂会一人推出一个模型,本轮参与的创业公司里面可能最终只有不到5个大模型会拿到“通行船票”。

人人造大模型,但 AI 不能取代人类

4月12日,微软宣布开源DeepSpeed Chat,帮助用户轻松训练类ChatGPT等大语言模型,用户通过DeepSpeed Chat提供的“傻瓜式”操作,能以最短的时间、最高效的成本训练类ChatGPT大语言模型。

例如,一个130亿参数的类ChatGPT模型,只需1.25小时就能完成训练。

这意味着,这类开源大模型商业化,正使得每个人、每家企业都能拥有自己的ChatGPT。人人造大模型的时代正加速到来。

周鸿t向钛媒体App进一步解释,现在GPT技术已经开源而且扩散,这个不存在重复开发问题。“就像你可以用公有云的服务,但很多公司也会用私有云、自己的私有数据库,因此每家企业都可以训练一个私有的GPT只给企业自己或客户。从保密和专属需求来说,看企业根据自己的需要设置公用模式或专用模式。”

不过,这种人人造大模型是否存在实际商业化应用需求,技术风险是否存在,目前仍未知。

实际上,ChatGPT不仅让 AI 迎来“iPhone 时刻”,而且还打开了一个 AI 算法的“潘多拉魔盒”。

可以遇见,未来借由通用人工智能(AGI)等新技术,教育、科技、内容生产等几乎全社会各行业都面临着生产力和生产关系的重塑。

高盛公布的一份报告预计,全球未来平均18%的工作岗位或可由生成式AI自动化完成,约有3亿个全职岗位将受影响。由于生成式AI目前还无法进行体力劳动,受影响的主要是白领工作,且对发达国家的影响将比发展中国家更大。

因此,马斯克等千余名业界、学界人士3月29日联署发表公开信质问OpenAI:是否该让 AI 替换人类的工作?是否应该发展非人类思维,让它们最终在数量和智力上超越、淘汰井取代人类?

“虽然 AI 很多能力不断在发展,甚至它的一些能力已经等同于甚至超过人的能力,但是 AI 也永远不会跟人的智能完全划等号。AI 运行还是在人类设计的这些算法,以及教它学的这些数据的基础上,完成他的一些智能的这种理解生成动作等。它并不具备控制人类的能力。”百度CTO王海峰在4月16日一场演讲中表示,他认为 AI 不会产生像人一样的意识行为。

商汤联合创始人、CEO徐立则表示,“AI是生产‘生产力工具’的工具,它将开启软件开发新范式,把我们带入‘新二八定律’的时代,80%的工作由机器完成,20%的工作由人来做。”

更多 AI 行业人士普遍认为,AI 依然是一个辅助工具。

不过,马斯克却认为,人类文明未来面临的最大风险之一是 AI。他认为AI 发展不受限制会带来危险,“人工智能比核弹头危险得多。”

实际上,过去70多年间,全球 AI 技术发展迅猛,尽管此前数据量不够、算法不强、商业化不如预期,但如今,在ChatGPT催化下,全球 AI 行业迎来新一波狂潮。这一次,AI 算法、算力、数据“三驾马车”同步突破,AI 技术已经蓄能完毕,所有人终于可以大展身手。

在 AI 逐渐平民化的今天,商界大佬、科技巨头以及各国政府都开始围剿ChatGPT,建构自己的“护城河”

随着市场从火热转回冷静,重新回归商业化本质,这场 AI 大模型战争似乎仍会持续下去。



商汤们等待ChatGPT的日子

商汤 npi,商汤 a+h,商汤sp,图文识别商汤科技官网

2010 年,乔布斯将 iPhone 4发布会的「One more thing」留给了Facetime。他故技重施,在现场拨通好友John Ive的电话――曾经接到初代iPhone首个通话的幸运朋友。两秒等待后,乔布斯按下通话页面上形似摄像机的图标,他留着银灰色短胡须的削l脸庞出现在屏幕上。随即,现场响起了“woo”的惊叹和起伏的掌声。

这是苹果首次在 iPhone 上引入前置摄像头,虽然只有 30 万像素,却让一部分技术爱好者,看到了前置摄像头的应用前景。清华学生印奇和唐文斌是其中的代表。他们制作了一款名叫《乌鸦来了》的游戏,功能很简单,立在田地里的稻草人,驱赶四处飞来的乌鸦,防止看守的南瓜被偷走。

但区别于同时代需要触屏操作的游戏,《乌鸦来了》是通过摄像头操作,用户对着镜头左右晃动头部,控制稻草人摆动,达到驱赶乌鸦的效果。游戏2011年上线,属于很早期、形式简单的AR游戏。但由于玩法新奇,很快就上升到苹果App Store中国区免费榜前三名。

联想之星的投资人王明耀注意到这款游戏,找到印奇团队,投了几百万人民币的天使轮。不久后,《乌鸦来了》在 App Store上推出付费版,售价为0.99美元,但是用户的付费意愿不高。就这样,印奇团队的第一个创业项目,在没有走通商业化的情况下,搁浅。

此后,印奇、唐文斌带着团队又开发了几款游戏,均未能成为爆款。他们开始反思,游戏并不是他们最擅长的,他们的长项是机器视觉。在清华姚班读本科时,印奇和唐文斌就已经在人工智能领域崭露头角,印奇在微软亚洲研究院实习期间,师从孙剑,研究人脸识别。

李开复曾想把印奇挖到谷歌,未果。不过,两人也因此相识。后来,李开复离开谷歌,创办创新工场,转型创业导师,印奇曾经找他商讨创业做图像处理器GPU的想法,他想打造中国的皮克斯――被乔布斯收购的那家电脑动画企业。李开复听了当即反对,他当时想不清楚GPU能用来做什么。这款后来在人工智能时代广泛获得增长的产品,在当时并没被看出应用潜力。

早期风投的重要投资逻辑是投人,李开复投了印奇,但当时还叫Face++的旷视团队,拿得出手的作品只有创始人参加各类人脸识别竞赛获取的冠军,验证过的商业模式是游戏场景并不能让机器视觉技术发挥出最大价值。至于它应该用来做什么,无论是李开复还是印奇,都没想清楚。

在一片混沌中依稀中飘出来的概念:智能手机应该会提供使用场景,这是当时广聚共识的投资方向。彼时,古早互联网时代的创业者奔走在拥抱新时代的道路上。财富自由的雷军想做智能手机,他想过投资魅族,但初中出来打拼的黄章对股份极其看中,跟雷军详谈过好几次,最终无法接受雷军提出的投资入股并出任董事长的方案。后来雷军扯旗,自建团队,喝下了那碗小米粥。

硬件是当时的主旋律,新的产品终端产生,代表着会催生出新的软件服务机会。小米造手机也是从软件系统MIUI开始的。周鸿t看懂了雷军用硬件卖软件的思路,也要做手机。但他不如雷军幸运,找到类似周光平的人物搞定供应链。于是,他退而求其次,想做特供机,联合手机厂商一起对抗小米。

可惜,行业里很多人看不到周鸿t的视野,还没有长大的小米,也不足以令他们畏惧,继而集中在红衣教主的麾下发起进攻。联想高管的一段表态,大致能代表当时主流手机厂商的看法:小米几百万台的销量,只不过是联想的几分之一。

无论持有何种视角,中国智能手机的“造机”浪潮,在小米的推动下开始了,手机出货量以指数级攀升。而智能手机上搭载的那颗前置摄像头,让机器视觉从各大比赛以算法创造出正确率提升的竞争中,以及各大研究室的故纸堆里爬出来,找到了技术可以落地的应用前景。印奇团队搭建Face++平台,通过API的方式,为企业提供服务。种子用户是美图秀秀,李开复帮忙找来好友蔡文胜,达成合作。后续又找到蚂蚁金服,为支付宝提供人脸识别技术。

回头来看,这一切要感谢iPhone将前置摄像头装进手机,催生出美颜、人脸识别的需求。随后,人工智能开始具体应用于很多单向领域。2015年,马云在德国汉诺威博览会,亲自演示“刷脸”支付,引发广泛讨论,作为技术提供方的旷视也随之沾光。

中国不算悠久的人工智能商业史中,绝大多数的时间,都是在寻找技术的落地场景。在人工智能1.0时代,以旷视、商汤为代表的企业,搭上移动互联网时代带动的视觉需求,OPPO、vivo等手机厂商,美图、百合网、快手等企业,成为它们在四顾茫然的商业化道路上,可以暂时歇脚的石凳。用旷视科技副总裁吴文昊的话来说,世界上60%摄像头用在手机上面,AI一定要进入这个市场。

但这些业务无法支撑起一家独角兽企业的估值,以及与之相匹配的营收。随着手机镜头像素的持续性迭代,依靠算法带来的视觉优势被一点点吞噬。当手机厂商陆续喊出1亿像素的宣传卖点,CMOS图像传感器的芯片,成为真正决定一部手机拍照功能好坏的决定性因素。

加入果链,为iPhone提供CMOS图像传感器的索尼,拿走了手机摄像头的绝大多数市场份额。它常年占据着CMOS图像传感器一半的市场。跟硬件进化产生的优势相比,算法带来的视觉优化方案,变得不那么激动人心。

显然,第一波人工智能企业,还没有摸到商业化的入门砖,找到连通人工智能从实验室算法到应用场景落地之间的桥梁。

探索仍将继续,随后人工智能企业开始在不同“地图”刷金币的商业化之旅。好在,移动互联网时代提供了不少讲述新商业故事的场景。上半场,AI与互联网金融的结合,成为重要的人脸识别场景。“互联网+”浪潮的高峰期,旷视服务近七成的互金客户。

进入移动互联网下半场后,在向线下要流量的使用场景中,无人零售为AI企业创造了另一波需求。2016年末,亚马逊推出了无人便利店 Amazon Go,以“不用排队,拿了就走”的购物体验出圈,消费者进入商店,在开放货架上选购商品,然后走出商店,整个购物结算环节就完成了。

硅谷的风潮吹向中国,中国零售企业的创新热情被点燃了,无人零售成为撑起“新零售”业态的全村的希望。外界讨论它会是第四次零售变革吗?行业会产生下一个滴滴吗?

不知前路,但行动者已经在路上。阿里巴巴在第二届淘宝造物节上,推出无人超市“淘咖啡”’、大润发推出缤果盒子,苏宁、京东同样上新无人零售业态。旷视、商汤再次成为站在大厂背后的企业,为这些应用场景提供技术支持。

创投圈最爱拥抱新变化。当时正值共享经济的创业风口式微,无人零售迅速崛起。IT 桔子的数据显示,2017 年共有 93 起无人零售事件获得融资,占新零售领域投融资事件一半以上,行业出现了「果小美」,「小麦铺」、「猩便利」等明星公司。在资本的热情驱动之下,街头巷尾涌现出无数无人零售项目――但现实是,很多人进去不是为了购物,而是乘凉,那里有空调。

正如创投圈涌动的各类风口一样,风起时资本和创业项目入场很快,而在资本发现投钱也无法改变战局后,热情就会迅速消退。同之前的情况不同的是,此前资本的意志可以迫使行业第一名和第二名合并,达到近乎垄断行业的作用,但无人零售做不到,一位创业者说,行业第二名和最后一名没有区别。

风口此起彼伏,商汤、旷视等活跃在大厂背后的技术提供方,也无非是带着相近的技术,从一个风口过渡到另一个风口。

2017年,苹果 iPhone X 的发布,带动了「AI+3D」的人脸识别方案。商汤和旷视迅速加入到手机行业的新一轮军备竞赛之中。竞争激烈之时,两家企业分别派遣十多人的团队,进驻各品牌手机厂商的办公场地。两家企业的房间紧挨着,中间是透明的玻璃,能看见彼此。两个团队每天发布一个版本PK。手机厂商不看别的,就看谁的算法更好,择优选择。

在会议室睡了四个月之后,在人脸识别解锁上,旷视拿下了vivo部分机型、小米、荣耀、锤子、美图等,商汤拿下了OPPO和vivo部分机型,以及一些机内应用。

对于自己打“辅助”的身份,两家企业的创业人有过类似的表述。旷视创始人印奇说,“创业之初对人脸识别、图像识别、机器大脑这些技术能有什么用,在哪里落地,是很模糊的。”商汤创始人汤晓鸥对人工智能的商业前景,抱有理性的说道:人工智能也不过是一个辅助性的工具,并不是事情的全部。这个工具本身并不能产生独立的价值,而一定是在跟各个行业相结合以后,为各个行业生产效率的提升来服务的。

这些先进入行业的创业者,看起来都不相信,中国可以产生通用大模型的故事。

尽管没有一直站在风口,中国的人工智能创业热情却多年保持在高位,融资金额在2017年首次超越美国,位居世界第一。根据深圳人工智能行业协会统计,自2012年至2020年上半年,北京、上海、深圳、杭州四地的AI产业融资达4260亿元,融资规模在2018年达到顶点,当年融资近1500亿元。

类似商汤、旷视这项的明星企业,更是资本的宠儿。它们吸引外界广泛关注的时刻,通常也是跟融资新闻联系在一起。2017年10月,旷视获得4.6亿美元C轮融资,刷新人工智能领域的融资记录。然而,不到一年,记录被孙正义的软银愿景基金以10亿美元投资商汤的单笔融资再次刷新。孙正义以一己之力,将商汤科技估值抬至60亿美元。

孙正义的投资方法是下重注,别人投几百万的,他投几千万,别人投几亿,他投几千亿。他喜欢问创业者的问题是“如果钱不是问题,你会怎么做?”,“我们怎么才能帮助你扩张100倍?”

但是,初代人工智能企业的业务扩张是人工+智能的模板。也就是说,业务扩张总要跟人力成本的支出增长联系在一起,基本成正比。

人类凭借肉眼可以辨别出不同物体之间的差别, 但是机器视觉记住不同物体之间的特征,需要通过大量的训练。训练人类认识什么是小狗很容易,但是训练机器认识小狗很费钱,它需要通过无数张图片,才可以让机器认识什么是“小狗”。换到另外的场景,比如说让机器认识什么是猫,就需要将算法重新训练一遍。

而且,它所需要的成本也很高昂,不仅仅是算法、数据、还包括算力支持。还在谷歌大脑供职时,吴恩达(Andrew Ng)曾经跟好友,担任英伟达首席科学家的比尔・戴利(Bill Dally)抱怨,他的课题组要用数千万条YouTube视频来训练神经网络AI分辨猫与人的不同。结果训练神经网络AI的算力不够。如果用CPU来执行此类任务,完成课题大概需要1.6万块CPU。对任何一家存在于商业公司的研究项目组而言,申报1.6万块CPU的预算,也是十分困难的,即便是在不差钱的谷歌。

对中国人工智能企业而言亦是如此。商汤投入巨资建立了自己的超算中心,很烧钱。按一下“run”字按钮,进行一次数据训练迭代,整体花费至少50万元。CEO徐立称,“我们有150多个博士天天在算法平台上按‘run’,这还不算每年追加的数亿元GPU集群采购预算。”

商汤、旷视为代表的AI四小龙,收入高,亏损也高。导致亏损的核心是巨量的人力资本投入。它们总收入的75%花在人力成本,加上硬件成本及其他成本,最终总是难逃亏损。这让它们在安防领域的竞争优势,远远比不上老牌安防巨头海康威视,后者每挣一元钱,在人力成本上只花不到0.2元,硬件及其他成本约0.6元,最终还能挣0.2元。

更扎心的是,AI四小龙用亏损换来的,也不过是落地场景分散、产品标准化程度低,算法模型没有深度突破的局面。

风口来来去去,兜兜转转不停歇。旷视、商汤这样的企业,始终作为技术服务方的形式存在。

在人工智能概念火爆后,一轮轮融资和上市,为初代AI企业带来充沛的现金流。比如商汤,上市后,大手一挥花费33.28亿元,买入上海西岸国际人工智能中心西楼4楼至26楼。近日陷入现金流短缺危机的宝宝树,看到商汤的现金流,是要留下羡慕眼泪的,这样企业的CFO,大约是不会上演手持宝剑闯门的剧情。

商汤在现有费用的基础上,拥有能支撑企业5年运转的现金流,但仅凭借这些资本却无法让它们成为消费级的企业。

人工智能从2017年就开始成为国家战略,作为21世纪三大尖端技术――基因工程、纳米科学、AI――之一,曾被给予中国科技弯道超车的众望,但这些希望被分散在做自然语言、做语音识别、做机器视觉等细分领域大大小小的各类创业项目上,被错付在找寻可以支持商业化变现的落地场景上。

通用大模型,没有成为一种具备产业共识的选项。产业端没有出现过哪个创业项目,想要做可以语音识别、机器视觉、机器翻译、能沟通,可以回答问题的通用人工智能。

但是,创造出ChatGPT的OpenAI不是这样,它成立之初,就是要做通用大模型。

出门问问的创始人李志飞说,OpenAI成立就一直目标是做AGI,做通用模型,而不是完成具体任务的系统。在GPT-3后,OpenAI是产品驱动的AI研究。这跟Google或别的组织不一样。别的要么是偏学术的研究――一帮人做出一个系统,写一篇论文,弄个PR,又去干别的了;要么是像DeepMind是项目制,AlphaGo做一做,又做AlphaZero,又做AlphaFord。OpenAI与它们最大的不同在于,它是以产品为导向的迭代。

当 OpenAI 推出“ChatGPT+插件”的新结构时,它实际上已经完成了身份转化,变成一家消费级技术平台公司。全球的创业公司都可以通过它,推出自己的服务。目前已有的插件包括旅游、餐厅预定等,今后还会有更多。

至少在现在,“商汤”们还没准备好自己当主角。受限于野心、技术、资本等资源或者创新压力,被推上风口的中国AI公司们,研究的还是生意,如何让原本的生意与ChatGPT带来的机遇更好地结合――这确实也是它们等待多年的时机。

人工智能领域可以称之为以产品为导向的研究,无人驾驶算一个。正如周鸿t当年对雷军办小米的预测――新终端会产生新的软件,电动汽车也带动了软件系统创新,比如无人驾驶辅助系统成为电动汽车智能化的重要支撑,就像理想汽车将自己定义为人工智能企业,而非造车企业。

蔚来、理想、小鹏三家造车新势力的软硬件一体的方案,留给其他人工智能企业的空间,是跟传统厂商合作。可惜,传统车企还在完成电动化的上半场,绝大多数没有进入到智能化的下半场。即便是电动车销量一骑绝尘的比亚迪,其创始人王传福也将自己抛进“无人驾驶是骗局”的争议里。

既没有硬件优势,又缺少软件算法和数据的初代人工智能企业,提供的智能驾驶解决方案――比如商汤的绝影,可以为车企提供驾驶员疲劳状态实时提醒、儿童遗忘检测系统等乘员感知技术,也不过是为人脸识别方案寻找新的落地场景而已,跟智能驾驶可以说是毫不沾边。旷视的智能汽车系统解决方案,跟商汤几乎是复制、粘贴形式的相似,都是提供车主身份验证、司机驾驶状态分析,本质当然也是一样,找个新瓶子装旧的汤药。

至于日前商汤发布的“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力,也不过是在宣传话术层面向大模型的靠拢。“体系”二字已经说明它不是一个模型,而是将人脸识别应用在不同场景的平台集合。

以上种种拥抱新能源汽车的方案和产品,都是功能单一的单独模型,只能语音识别,只能语义理解,只能画图。而且,商汤在发布会上的演示环节,出现AI模型站civitai的图片,引发网络质疑。商汤方面的解释是:秒画SenseMirage包含商汤自研AIGC大模型,也提供第三方社区开源模型。

图:被质疑来自AI模型站civitai的图片

商汤的大模型是应用场景层面的大模型。它被行业人士所知晓,但又没听闻有博主测试过。毕竟它只面向政企开放API接口。即便是开源模型,商汤对用户群体的选择也有要求,参照一下,2023年 2月,meta AI开源了LLaMa模型,有650亿的参数,它开源就是想让多人拿到更多的参数,此外,它还写了一篇介绍LLaMA模型的论文,介绍模型参数,并谨慎的称自己是“小模型"。而商汤从开源模型中拿到参数,却打包组合进“日日新”体系,变成给政企客户测试用的服务。

商汤在商业化上的更近一步,是从卖技术服务方案的企业,变成想要卖算力的企业。商汤在上海临港的AIDC算力中心,完成2.7万块GPU的部署并实现了5.0 exaFLOPS的算力输出能力。

卖算力是人工智能领域稳赚不赔的生意。当年面对吴恩达对算力不足的困惑,好友戴利的回答是:何必整1.6万块CPU,用英伟达公司的显卡产品,几十块就搞定。对于研究领域,算力太重要了。李彦宏讲过,吴恩达在谷歌的时候,据说很不爽,因为谷歌不相信GPU的方向,(吴恩达)到了百度随便买GPU,所以百度有了最大的GPU集群。

商汤的联合创始人徐立曾介绍,一位投资人跟他聊完之后,获得了灵感,买入英伟达的股票,获得了7倍回报。但是商汤给不了资本市场如此高的回报,它赶在2021年最后一个交易日上市,以3.99元的发行价上市――抢在跟投资人对赌协议到期之前。上市之初,商汤股价翻过一倍。目前,则是已经呈现腰斩的状态。

而英伟达成为人工智能行业的“水电煤”。2020年,全世界跑AI的云计算与数据中心,80.6%都在用英伟达的GPU驱动。2021年,英伟达宣称:全球前五百个超算中,七成由它家的芯片驱动。在最新的超算系统中,此比例是九成。

如今,人工智能卷向动辄几百几千亿参数的大模型领域,作为支撑模型运算的最基础的力量,算力更显重要。没有充足算力就带不动大模型。英伟达创始人黄仁勋说“AI进入iPhone时刻”的预测无论是否成真,这边卷向大模型的方向,英伟达都稳赚不赔。比如,百度的文心一言在画图理解上还需要进化,画的驴肉火烧、松鼠桂鱼等菜谱,让人啼笑皆非,却并不妨碍,其背后的算力提供方百度云,以此宣传自身服务。根据百度副总裁沈抖的说法:百度云是国内第一个训练出大模型的云。

对于商汤而言,情节相似。虽然只是大模型体系,且特供测试名额,但是它在发布会优先讲的是大装置,也就是临港AIDC出售算力的商业故事。创业近10年,商汤的梦想也不过从中国AI先驱转换为成为“英伟达平替”而已。它提供算力支持的绝大多数芯片,还是购于英伟达。

要求一家中国AI公司直接去奔赴宏远高大的梦想,在眼下还是个奢望。但至少,对于商汤们而言,在迷雾中摸索前行的商业化之路,因为大模型的进化而变得更加清晰。

印奇已经在最近的访谈中喊出了旷视要在5年内实现盈利的小目标。毕竟,先活下来,才有后续赶超的其他可能。在更令人激动的故事出现之前,或许能祈祷的只是:所有的等待和尝试都值得。

海量资讯、精准解读,尽在新浪财经APP