庆云古诗词

庆云古诗词

李彦宏重新发起了一场ai大讨论 李彦宏推进ai的建议

互联资讯 0

2023年11月20日 每日一猜答案: 答案:ABC
每日一猜答案分析:

李彦宏发言,李彦宏2020,李彦宏2021,李彦宏all in ai

以免错过重要行业信息

回应关于文心一言的几个质疑,李厂长还给AI创业者提了几点小建议。

2023年,全世界的关注焦点,都在AI大模型的焦灼竞赛。

中国参赛选手、百度“文心一言”在研发阶段时,百度技术团队曾与ChatGPT进行对比测试,李彦宏对36氪回忆,当时“差距是40分的水平,一个月能追得上。”

可过了一个月,技术团队再次测试后,发现差距反而拉大了――AI大模型的发展速度不是线性的。

紧张追赶之后,到文心一言今年3月16日发布时,甚至“能达到它(ChatGPT)今年1月份的水平。”李彦宏对36氪说。要说文心一言和ChatGPT差距多大?“可能最多是两个月。但这两个月什么时候能追上,才是更重要的问题。”

过去一周,AI领域处于更强烈的疾风骤雨之中。百度文心一言发布会前一天,OpenAI发布了新一代GPT-4大模型;后一天,又有微软发布搭载最新GPT-4的AI助手Copilot――均是震撼业界的产品进展。

百度文心一言随之成为激烈争论的对象。带着人们围绕文心一言的诸多质疑,36氪独家访问了百度创始人兼CEO李彦宏,直接发问:为什么发布会用了Demo而不是实时演示?为什么产品在不甚完美时就发布?

这些质疑折射出国人的复杂情绪:人有我无的焦虑,民族情绪的高涨、期待与失望间的起伏……

在回应质疑之外,36氪在与李彦宏交谈中,印象更加深刻的,是他给出了关于AI行业的许多直接论断。

比如,被问到中国创业公司里会不会再出一个OpenAI?他直接回答“基本不会了”,“没有必要再重新发明一遍轮子。”

比如,“在应用层,将会出现全新的、十倍于现在微信和抖音的创业机遇。”比如“AI将会颠覆云计算市场”。

比如,AI虽然会取代人类工作,但有更多意想之外的机会。一个针对个人的提示是,不会面向AI写提示词(prompt,人与机器进行交互的指令语言)的人会被淘汰。

无论如何,我们正站在一个历史性的时点:基于AI大模型技术,可能开启一个新增长时代。就在两天前,英伟达发布了专用于大模型计算的新GPU,能让大模型处理成本下降一个数量级。“我们正处于AI的iPhone时刻。”英伟达创始人黄仁勋在会上三次激动地强调。

暂时忘却历史臧否,而是把百度视作一家在AI领域深耕十余年、花费千亿的公司,李彦宏的声音此时格外有时代意义。

以下为对话全文,经36氪编辑整理:

回应文心一言发布会的所有质疑

36氪:3月16日文心一言发布会之后,网上有非常多的声音,其中有祝福,也有质疑,今天我是代表质疑的声音。首先问一个小问题,今天这样一个突然的采访,会不会让你觉得有压力?

李彦宏:不会。确实像你讲的,3月16日之后,网上有各种各样的声音,我自己也确实有一些话想说。

36氪:有人说你在发布会现场比较紧张,是这样吗?

李彦宏:我真没觉得自己紧张。因为这个东西(指文心一言)是我非常熟悉的,包括那5个演示场景,基本上都是我选的,或者至少是别人给我建议、我认真看过的。

后来我也回看了发布会实况,也没觉得我在任何时候紧张。我猜测,是因为当时在台上,我看不到股价变化,所以没有被它所影响。但是很多在台下的人,包括看直播的人,能够看到一些资本市场的反应,又看不到我们真实产品是什么样子(因为当时还没有发布出来),所以会有此猜测。

36氪:在发布会中,你提到产品还没有准备好。为什么要在还没有完美的情况下发布?

李彦宏:最主要的原因,是因为有市场需求。我们有好多客户都在问,这个东西什么时候出来?我们什么时候能够用?你能不能保证我是第一批试用产品的人?不断有人在问这方面的问题。

目前整个大环境,是ChatGPT非常火,甚至被神话了。大家一定是有焦虑感的,如果我们的客户不能及早地用最先进的产品,他们也会有焦虑感。在这种情况下,我们确实希望尽早把它推出来。

从技术发展的规律来讲,这一类型的产品,确实需要有人类反馈之后,它的演进与能力提升才会更快。我们也希望它更快提升,所以必须要及早推出来。

36氪:选择在3月16日开发布会,这个日期是怎么确定的?

李彦宏:一开始我们想的是3月底,其实哪一天我觉得都是可以的。

但我在很早的时候,答应了去参加今年的亚布力论坛,亚布力是3月17日,那时我会见到很多新老朋友,包括政府领导、媒体,大家一定会问(文心一言),那个时候我们还没有发布的话,别人问起来,我真不知道该说什么了――你说得少,大家会觉得你一点信息都不透露,你不拿我当朋友;说得多,我们是上市公司,等于选择性地披露一些东西,也是不行的。

所以想来想去,决定稍微往前赶一点。为了适应3月17日亚布力论坛,就决定3月16日来开发布会。

36氪:所以碰上OpenAI发布新版本,这是偶然。

李彦宏:对,我们事先并不知道OpenAI会在那一天发GPT-4。对于我们来说实际上也没有那么重要。我们自己能看到的可提升的地方已经足够多了,先把这些东西做好就够了。

36氪:发布会现场为什么会用先做好的Demo,而不是实时展示?

李彦宏:我是希望能现场演示的,因为人机对话产品具有极强交互属性,但后来两个因素让我改变了主意。一是生成式AI每次给出的答案不一定一样,会带来不确定性。二是真正说服我的理由,是全球所有类似发布会,没有一个是现场演示的,都是录好的。如果大家都可以,那我们也OK。

36氪:文心一言发布的产品有五个场景,包括文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成,为什么是这样的五个场景?

李彦宏:这是很好的问题。我们选择的逻辑是这样:文心一言对标ChatGPT,所以大部分ChatGPT有的功能,我们也要有。

但同时,我们毕竟植根于中国,所以,我们的对话型产品,一定要体现我们对于中文、对中国文化更好的理解。我们确实有一些ChatGPT没有的东西,希望在发布会展示给大家。

所以,前三个场景是对标ChatGPT已有的功能,我希望大家能够感受到我们的东西不差。比如第一个例子是,三体的作者是哪里人?我在ChatGPT里面试过很多次,它答的都是错的,每次生成的答案都不一样,有时候说甘肃天水人,有时候说山西吕梁人,答案非常随机。所以,我第一个例子用了那个例子,但是前三个例子的那些能力,大家已经看过了,在ChatGPT里面那些能力都是有的。

到第四个例子,文心一言对于中文的理解,或者对于中国文化的理解,确实是更加到位一些。我们综合了一些知识增强,检索增强等能力,对“洛阳纸有多贵”“刘慈欣的籍贯”这类事实性问题,文心一言能够理解,并且作出正确的回答,准确率更高一些。

第五个例子,是多模态能力的展示。有一个四川话,有一个文生图,一个文生视频,这代表了百度过去十几年在AI上综合能力的积累。

做这五个例子的时候,我给团队提了个要求,我希望产品发出去之后,能让大家玩起来。第一个就是刚才讲的四川话,我们有语音合成的能力,也对中国情况更了解。所以,我希望当用户提问的时候,不管是提什么问题,我们都能够用语音合成,并且能支持用各种各样的方言说出来,不管是四川话还是广东话。我希望大家觉得很有意思,喜欢去玩这些东西。

第二个要求,当用户的问题本身存在事实性错误时,我们能够辨别,比如“二战期间苏联为什么轰炸波兰?”其实苏联没有轰炸波兰,是德国轰炸波兰。我希望文心一言能够辨别用户问题当中是有错误的,并且告诉你说,你刚才说的不对,我告诉你正确答案是什么。

所以当用户有这样的问题,或者故意进行错误引导的时候,如果产品能够辨别,用户会觉得你很聪明。

36氪:有人说这是为调皮的人类而准备的。

李彦宏:能够给大家多带来一些欢乐的话,何乐而不为?

36氪:提及ChatGPT,别人一定会把它跟文心一言对比,你觉得哪个更领先?假如ChatGPT更领先的话,你觉得它领先文心一言几年?

李彦宏:这个问题应该这样说,ChatGPT发布是去年11月30日,我们现在已经发布了,也就是说不可能被领先几年。

但是科学地去评比,文心一言到底是处于去年ChatGPT 11月30日的水平,还是12月30日的水平?这个我们没有特别严谨的方法评测,我们自己可以保留(产品状态),但是ChatGPT当时的状况我们已经保留不了了。

但是我可以给你讲一个我们内部开发的过程。第一版产品出来的时候,我们和当时的ChatGPT做了一个对比,和它大概差40分。

36氪:这个对比怎么做的?

李彦宏:我们的对话式人工智能大语言模型应该具备的各种各样的能力,每一项能力去挑了提示词(prompt)。

36氪:满分是100分,差了40分?

李彦宏:对。当时我们能看到的提升空间远不止40分,所以我们觉得说一个月之内肯定追上它。但是过了一个月,我们又做了一次评测,发现这个差距不仅没有缩小,而且拉大了。

所以我们当时很紧张,说这个东西越做,跟人家差得越远了,但后来发现,其实ChatGPT那种升级不是匀速的升级,虽然提升很快,但是它有自己的发展规律。

而百度这种一版一版的迭代方式,升级速度是非常非常快的。等到我们敢说3月16日开发布会的时候,我们觉得就是至少可以达到它去年11月30日的水平,甚至说按照理性判断的话,应该达到了ChatGPT今年1月份的水平。所以,那个时候我们才敢出去发的。

尤其当你去测试ChatGPT比较擅长的能力(英文、编程等),会发现差距很大,那是因为ChatGPT也发生了很大的变化。我们发布会前一天,OpenAI上了GPT-4,和GPT-3.5也是不一样的。

所以你要说我们和ChatGPT差距多大?我觉得可能最多是两个月,但是这两个月什么时候能追上,才是更重要的问题。

36氪:可以说,文心一言在两个月后能达到ChatGPT的水平吗?

李彦宏:远远不够,因为人家也在进步。百度进步的速度要比它快,有一天不仅要追上它,还要超过它。

刚才我们讲的文生图能力,百度的能力打磨比较久,大家玩起来挺嗨。GPT4本身没有文生图能力,站在另一个角度比较的话,ChatGPT落后百度,文心一言早就有这个能力了。

早在文心一言发布之前,大家用文心一格(指代百度基于文心大模型的文生图系统)就能体验这个能力,这是我们做得好的地方。ChatGPT发布的时候,大家都说它跨时代、震撼发布等,它发布的理解图片能力,不是文生图,只是输入图片告诉你这个图片是什么。

客观比较下,我们有我们的长处,我们也很有信心在综合能力上,能够迅速追上甚至超过。

刚才我们讲的文生图的能力,百度的能力打磨比较久的时间,我们目前就是大家玩起来挺嗨,但是ChatGPT本身没有文生图的能力,站在另一个角度比较的话,ChatGPT落后百度,文心一言早就有这个能力了。

ChatGPT4发布的时候,大家都说它跨时代震撼发布之类的。其实它发布的所谓理解图片的能力,不是文生图,输入图片告诉你这个图片是什么。我们搜的只是官网上的能力,没有人体验过。

36氪:相比ChatGP的调用成本,百度的成本是更高还是更低?大概是多少?

李彦宏:成本比较类似。但是这个东西不重要,重要是我们可以通过端到端的优化,让这个成本迅速下降。

36氪:比如使用的时候,价格会是ChatGPT的百分之多少?

李彦宏:会稍微便宜一点。

36氪:现在百度已经为文心一言投入了多少,还会继续投入多少?

李彦宏:这很难划分清楚。例如,我们对于大语言模型的投入算不算在内?可能有些投入是去做了辨别式的东西,比如去优化搜索等等,有些是生成式的。

如果单讲生成式AI可能是十亿、几十亿,未来投入会更大。如果是整个这四层(指应用层、模型层、框架层、芯片层),因为需要四层端到端的优化,大语言模型才能够有竞争力,芯片、框架、等等这些都加起来的话,十年投了上千亿元。

如果没有那些投入,根本就不可能出现文心一言这个模型。

中国基本不会再出一个OpenAI

36氪:我看到你自己发的百家号视频,说百度是在全球大厂中第一个发布类ChatGPT产品的,领先于微软,因为微软调用的是OpenAI的接口,Meta、Google没有发布真正同类型的产品,为什么这么说?

李彦宏:人工智能如果按语言模型来分类,一种叫辨别式AI,典型应用是搜索。搜索就是根据你提的需求,看一个个网页跟你的需求匹配不匹配,主要是在辨别;另一种是ChatGPT,也就是生成式AI产品,你提一个提示词,它根据提示词发挥,甚至发挥错了都有可能,这个方向早期并不被大厂看好,积累也没有特别深厚。

相比下来,百度在语言模型方面,积累还是不错的,我们在AI上连续十几年投入,第一版的语言模型,文心大模型2019年就发布了。过去一年半时间,我们一直很看好生成式AI,有不错的投入。所以当发现这有大机会的时候,我们迅速增加资源,把它做出来。

在这过程中,其他大厂像Google、亚马逊、Facebook,你说它们重视不重视?现在肯定很重视。想不想做出这么一个东西来?肯定很想。听到这就很容易理解,为什么我会说百度是大厂当中第一个做出来的。

36氪:很多人都在准备做类似OpenAI的创业,比如李开复、王小川、王慧文,你对他们有什么建议?

李彦宏:很多人也在问我,中国会不会再出一个OpenAI?基本不会了。OpenAI诞生是因为美国大厂都不看好这个方向,但现在中国的大厂都看好AI大模型,都在做这个方向。创业公司重新做一个ChatGPT其实没有多大意义。

我觉得建议有两点。第一,创业公司的特点是方向可以不停改变,船小好调头,在市场状况发生变化时迅速调整战略,公司成立时想做的事和后来做的事可以不完全匹配。

第二,我觉得基于这种大语言模型开发应用机会很大,没有必要再重新发明一遍轮子,有了轮子之后,做汽车、飞机,价值可能比轮子大多了。

36氪:现在大家都在担心大模型的算力的问题,包括芯片,百度会怎么解决算力问题?

李彦宏:其实算力是很笼统的说法,你的CPU怎么样、GPU怎么样,芯片跟框架匹配程度怎么样,框架跟模型的匹配程度,里面可提升的空间都是很大的。

百度在四层架构都有领先的产品。芯片本身不管是摩尔定律,或者GPU的发展速度也非常快,框架也不能叫成熟,我们的工程师还在日以继夜优化框架。

模型更新得就更快了,一天能够上线三次升级,这种速度一定会使效率越来越高。将来制约整个大语言模型发展的很可能不是算力。今天我们看到算力很紧张,将来你可能发现算法突然变了,不是这个算法了,(制约发展的)可能就是另外一套东西。

36氪:在整个生态圈,芯片层、框架层、模型层、应用层,你觉得最大的创业机会在哪?

李彦宏:在应用层。回看移动互联网时代,今天特别成功的微信、抖音、淘宝,都是应用。操作系统其实没几个,一个IOS,一个安卓,仅此而已。很难讲安卓的价值比微信、抖音大。在应用这个层面,机会很多,能够创造的价值也非常大。

36氪:因为在搜索上市占率较低,微软可以热衷于做这件事,但百度做生成式搜索引擎会颠覆自己的商业模式。你怎么看待这个观点?

李彦宏:我确实听到了这种说法,但我觉得离我们真实的想法差得太远了。

首先我觉得不会颠覆,你用的其实还是百度搜索。当这个能力(文心一言)被赋予到百度搜索上的时候,几乎不会改变你的使用方法。你不需要重新再花很多精力去学百度搜索怎么用,只是答案更精准了,过去篇幅比较小的答案,现在可以更加详实、更加生动、更加活泼,它扩大了搜索的边界。

我们并不是整个移动互联网,只是整个移动互联网的很小一部分。干的事变多之后,会有越来越多的用户从别的APP转到百度。从这个角度来讲,我无论如何都希望百度APP被文心一言所赋能,它能够颠覆现在的百度搜索,我无比渴望发生这样的事情。

但是,这只是整个故事的极小一部分,更大的故事其实是在云计算。因为刚才也讲到四层架构,就是芯片层发生了变化,从CPU到GPU,在框架层也发生变化。

框架层我多讲两句。百度在全球大厂当中最先做出来是有道理的,我们在芯片层、框架层、模型层、应用层都有自己的布局,全球大厂在这四层上都有领先产品的是没有的。

看这四层架构的话,我们在每一层都可以说是提早了很多年来布局,当你这些能力都很完整的时候,未来人们再去开发应用,基于百度智能云是最方便的。这个机会要远远大于一个百度搜索颠覆自己的机会,我真正兴奋的、包括我3月16日发布会上主要讲的都是这个机会。

36氪:可今天我去搜索百度的东西,当中有15个搜索结果,其中有两三个是广告,简单说这是百度的商业模式。未来如果文心一言只给出一个答案,这怎么商业化?

李彦宏:这个商业化的可能性有很多。今天如果看ChatGPT的话,它的做法实际是付费使用,买一个会员,一个月多少钱,它靠订阅来养活自己,就不需要广告。

我从来没有觉得商业模式是一个问题。如果我们给大家(不管是个人还是企业)提供了价值,他们就会通过市场机制来回报我们。

36氪:你自己提到很多,在美国生态当中,大公司和大公司、大公司和创业公司之间似乎更紧密,在中国是不是不一样?大公司不会用彼此的产品。

李彦宏:Google可以索引几乎所有互联网的内容,但是中国的话每一个APP都有自己的这种独立的生态,也有一定的壁垒。所以用户在获得信息上确实没有那么方便。

36氪:美国五大互联网巨头(FANNG),似乎是一个联盟。中国好像不是这样。

李彦宏:联盟也说不上,我觉得美国人的这个思维方式也竞争,比如微软和Google就是竞争。但是它的思维方式是说,如果你已经很领先了,我最好别做一个跟你一样的东西,我如果通过创新做一个跟你不一样的东西来竞争,那才是我的本事。

在中国,大家的思维方式更像是这条路你跑通了,我也跑同样的路,咱看看谁跑的快。

36氪:文心一言会接入哪些产品,以及对百度的业务矩阵有哪些机会和变化?

李彦宏:这些天我们各个部门也都在开会讨论,文心一言是一个通用能力,它跟各个产品的结合都是很自然的,跟搜索、贴吧、文库、百度健康、小度等等。几乎公司里面每个产品拿出来,包括百度书法,都能自然地想到和它怎么结合,让产品变得用户体验更好,更加【【微信】】。

36氪:百度会是自己的第一批用户。

李彦宏:是的。

云计算是Game Changer,应用层有十倍机会

36氪:你在财报会上提到,文心一言会是改变云计算的Game Changer,为什么?

李彦宏:过去,云计算主要卖算力,算力就是你的计算速度有多快,存储能力有多少。两三年前人们的理解是,基于一个AI开发框架去开发应用就好了。

今天就会看到,我们完全没有必要基于芯片层、框架层来开发应用――基于大模型就好了,又快,成本又低。

那么以后当人们在购买云计算服务的时候,他会看你的模型好不好,而不是你底层的算力怎么样,存储怎么样,所以,AI大模型会颠覆整个云计算市场。

我认为微软其实也是这样想的。大家都知道,ChatGPT和微软的产品真正结合,是非常厉害的。这是很多云厂商非常害怕的事情。

36氪:百度云会不会因为文心一言的使用,会成为中国领先的云供应商?

李彦宏:我对此充满信心,一旦大家明白过来,你以后选择云服务的时候应该看什么,或者其实也不需要它自己去琢磨。你有你的需求,你有你的客户需要去维护,什么样的方式能够让你更好地维护你的客户,收入更多,利润率更高,那他一定会从这些角度推演到:用百度的智能云是更好的选择。



360周鸿祎的发家史 360周鸿祎控股比例

360周鸿祎谈chat,360周鸿祎简历,360周鸿祎身价,360周鸿祎 gpt

周鸿t|360集团创始人、董事长

在不久前落幕的两会中,ChatGPT再次成为了一个热门的科技话题,科技部部长王志刚十天内提到了两次ChatGPT,足以说明国家层面对这款软件的重视程度。

360公司创始人、全国政协委员周鸿t认为,以ChatGPT为代表的人工智能大模型技术的巨大跃升将掀起一场新的工业革命,我国理应迎头赶上,并提出了“中国要做自己的ChatGPT”的观点。

近日,民生证券副总裁、研究院院长胡又文与周鸿t围绕近期GPT的热点话题展开对话。

以下为对话实录:

提问:ChatGPT哪些上游场景很关键?

周鸿t:算力不是最关键的问题,场景和数据是关键。我们一个账上200多亿人民币的二线队伍,还有国家的很多超算中心,都没事情做,现在发现配了GPU就可以做了。Transformer算法是谷歌发明的,实现靠的是“大力出奇迹”,几千亿参数是个工程问题。中国从1到n做得很快,OpenAI中国做得很快,谷歌和META会很尴尬。Meta开创了它的大语言模型,技术的Know-How会快速传播。

关键的东西,第一是数据,有知识量的数据做训练,聊天的语料不包括知识,ChatGPT中文语料占了不到5%,大量知识在外文期刊里面只用中文训练语料是不够的。很多机构表示用了很大的参数,但是不敢拿出来展示,大概率是数据不够。还需要人类的反馈强化学习和调优,激发GPT理解人类的查询意图,这是问题的关键。

第二是场景,微软放弃了对小娜的研究,聚焦AI场景化,让大家看到人工智能有什么场景。搜索引擎一直在做NLP(自然语言处理),大家都在跟踪使用,搜索引擎在获取海量数据方面有优势。百度抓取的网页是千亿万亿的规模,需要清洗垃圾网页进行工程化索引,我们的搜索引擎要抓取英文维基百科和语料,是现成的。初创公司可能会卡在工程化的初始阶段,这个对工程化的要求比较高。还有人工标注的调优,微软做了很多贡献,搜索引擎帮助很大。360搜索份额占比30%,百度占比60%。微软帮助OpenAI占据了很多场景,下一步可能会把Teams( 视频会议 )等TO B的场景做结合。

提问:以后会不会很多行业不存在了,机器把人替代了?

周鸿t:我不是很认同。我认为这是个洗牌的机会,如果你不重视它,不赶上这班车就不行。我们企业内部要求每个部门都用AI提升我们的能力,用AI的大语言模型赋能,这样会成为我们手里有力的竞争武器。GPT-4的知识能力和考试能力已经超越了每一个地球人,GPT可能是用3.5和4互相训练。我们也考虑过,用BERT这种理解性的模型进行反馈和奖励。这是个生产力工具,是能给各个产业赋能的,关键是你需要找到相应的场景和场景化的能力。

提问:现在行业巨头扎堆,360的优势是?

周鸿t:第一个问题已经讲了,第一是数据的能力,不能光用中文的数据,要有全球数据的抓取能力,要能做到对垃圾信息的判别和清洗。我们有用户上亿次搜索的数据,而且和百度有知识问答的栏目,我们用这种涉及用户真实的使用场景来进行训练。

数据我们有优势。GPT-2和BERT是开源的,真要做到上千亿上万亿的模型,几干张GPU的显卡,几个T的数据进行几个亿的训练,这个对工程化要求很高。第二,我们搜索引擎的市场份额是百度的一半。搜索引擎不具备生成性,不会编出林黛玉倒拔垂杨柳的故事,但生成式AI会无中生有,如编的结果是不对的,普通人很难验证就很麻烦。我们做泛化的知识图谱的搜索,前面的十条、二十条结果给大语言模型做提炼,这样就不会让生成式AI无中生有。我们每天搜索引擎有一个亿的DAU,大语言模型可以做及时的翻译和推荐,我们可以让用户很好地体验到人工智能的场景,形成商业化的闭环。

我在政协提交了一个提案,大家忽视的是ChatGPT真正的破圈了,之前无论是AlphaGo还是蛋白质折叠,离生活比较远,得益于微软工程化产品化的能力,一方面要打造核心技术,全方位最大化地调用公司的资源,大模型的方向已经出来了,要做到大力出奇迹,500亿到1000亿的参数训练,用有质量的语料。谷歌现在很尴尬,模型做出来了商业化的场景可能也被微软抢完了。微软专注场景和产品化的结合,OpenAI专注技术,这样能实现很好的效果。

提问:360的场景和应用?

周鸿t并行的。360也在做To B,也是我们很重视的机会。我们的安全大脑帮助企业抵御攻击。我们的机会是,中国企业不接受公有云希望有个私有化部署的GPT和数据。未来每个企业可能都有自己的大脑。只做垂直行业的训练肯定是不行的,我们离GPT还有24个月到36个月的差距,第一个版本能做到几百亿参数的模型时,做到GPT的六成的功力,做到企业内部是够用了。To B和To G端是有大量的机会的。面对中小企业端,我们打算推出生成式AI的办公套件和应用。OpenAI找了100家垂直的SaaS公司,会专门训练垂类的应用。我们这两年很关注SME(中小企业),对企业数字化的要求功能明确,少花钱、使用简单,SaaS更合适,我们去年面向企业的SaaS云服务,一年120万客户。我们的浏览器国内份额最大,做了个SaaS商店,我们会找合作伙伴做一些场景。To C我们有大量的使用场景,浏览器加上AI插件变成AI个人助理。To B、To SME和To C三十多个场景使用不同的能力,尽快占据用户的使用场景。

提问:360会做芯片模型全覆盖的平台吗?

周鸿t:我们肯定不是这个方向。谷歌自己做过GPU,自己用。训练最好还是用A100和A800,框架没必要自己做,自己做个框架还要花精力和别的芯片适配。微软这么强大只做应用,OpenAI用的框架也是用的行业通用框架。我不认为产业链全都做了是好事。我们坚定地沿着Transformer框架把模型做到千亿,首先是要占据应用场景。

提问:百度内测效果不错,对于360未来应用的推广是不是更有信心了?

周鸿t:百度搜索一哥肯定能做好的,微软的搜索份额比谷歌要小,可以放开手做创新。百度为什么做一个聊天机器人我不理解,我要做的话可能更愿意和搜索相结合。国内我不认为会和美国一样一支独大,头条和其他互联网厂商不会相互支持,会互相竞争,360、微博、B站、知乎、小红书、美团、滴滴,等等,他们也不敢用巨头的服务,肯定要自己做。还是希望在这个模型上做出几个超级应用,有应用有场景的公司加上模型会有价值。

提问:中国电信布局了企业版的ChatGPT,对这个的关注提升到了国家战略的高度,国家的重视会对行业产生什么影响?

周鸿t国家队做这件事不是坏事,互联网上大家都做过。从目前拥有的数据和团队能力来看,民营企业和国企都在一个起跑线上。只要牌照才能搞大语言模型,这样都有机会。GPT不是媒体一样管制,是个生产力工具,这将决定未来国际竞争当中的国运,美国人对于大语言模型也有政治正确的要求。

提问:中国和美国相比有24到36个月的时间差?

周鸿t:不是和微软比。GPT-4验证了我们很多观点,它的参数量我觉得应该到了万亿,训练的数据比原来大了5到10倍。人类反馈强化学习不再是十万组,而是几十万组。目前来看多模态是胜过国内的能力的,国内的图像识别还是传统的图像识别,OpenAI把所有都看做序列,图像也是序列,它能把图像组成部分的关系和逻辑相关性总结出来,它在阅读文档上的能力国内做不到。它能支持5万字的输入,表示它的深度记忆能力越强,对上下文的理解越好。GPT-3.5我们认为国内和他的差距18个月,GPT-4是24个月。云谈了这么多年,企业上云的比例也还不高,这比光刻机的难度小多了。

提问:怎么看GPT-4,会不会取代操作系统成为战略级的入口?

周鸿t这是两个概念,需要host一个应用,需要操作系统。人工智能没有突破之前,大数据给企业不好用。GPT相当于是发电厂,这个比喻比较贴切。纯做GPT的公司有点来不及,要么是有GPT丰厚的场景。场景越大爆发性就越大,如果场景很小,就做了个虚拟人挂个GPT跟人对话,这个场景就很小。场景未来可能有多家服务提供商。

提问:场景是我们非常关注的点,特斯拉的机器人也是爆款,多模态和机器人的关系?人形机器人是终极目标吗?

周鸿t:我不这么认为。不考虑机器人的外形,音响之类的用自然语言和人交流这关是过了,但GPT能否处理好机械手臂,寻找空间定位是个问题,除此之外,还有传统的语言识别和图像识别也有问题。人形机器人有个最大的问题是机械手臂抬起的力量,这和人工智能没有关系。如果机器人手里拿不了太重的东西,这可能会成为妨碍。自动驾驶汽车也是个机器人,只不过长了4个轮子。GPT的大语言都可以赋能,你们和智能音箱聊过天,聊两句就能知道他是个笨蛋,GPT肯定通过了图灵训练。

提问:GPT-4在物联网终端的广泛应用是大趋势了,边缘计算的需求是?

周鸿t:这跟边缘计算有什么关系呢?构不成边缘计算的节点。真正的能力都在云端,运算都在云端。