庆云古诗词

庆云古诗词

国产ChatGPT之争,续写王小川李彦宏二十年“恩怨录”|王小川|李彦宏|百度

互联资讯 0

2023年11月20日 每日一猜答案: 答案:ABC
每日一猜答案分析:

国产top gear,国产jolt,国产tdf,国产ltd

  “脱离一线太久,确实跟我们不在一个宇宙”、“什么样的平行宇宙里,才能做到让一个脱离一线15年的人,去怼一个脱离一线1.5年的人”……

  由ChatGPT引发的新一轮科技大战,在国内战场的火药味正从产品对垒升级为了你来我往的“口水战”。而参与这场“口水战”的两方主角,正是前搜狐CEO兼创始人王小川以及百度和他背后的男人――李彦宏。

  雷达财经梳理发现,此次“口水战”其实并非是王小川与百度首次针锋相对,王小川与百度的“恩怨”由来已久。自2003年正式接下搜狐搜索引擎开发的工作以来,王小川便频频向百度“开炮”。

  继此前在搜索引擎、输入法、浏览器等领域有过多番交手后,王小川又与李彦宏在人工智能赛道“狭路相逢”。不过,有分析认为,尽管王小川的新公司已斩获5000万美元的启动资金,并且招揽来了数十名AI领域的顶尖人才,但百川智能想要打造出“国内最好的大模型和颠覆性的产品”仍存在不小的难度。

  此次王小川和百度之间的“口水战”,还要从不久前36氪对王小川的一次专访谈起。彼时,刚刚宣布重新创业的王小川,被媒体问到如何看待李彦宏称“百度的文心一言和OpenAI差距可能在两个月左右”的说法。

  对于媒体抛出的这一问题,王小川笑称,说这话的可能是平行宇宙中的李彦宏,而非现在这个世界的李彦宏。王小川进一步解释称,之所以这么讲,那是因为百度的文心一言和OpenAI怎么可能只有两个月的差距,能这样讲必然是处于另一个平行宇宙。

  在王小川看来,若用时间衡量,国内类ChatGPT应用的开发者与美国OpenAI团队的差距应该有三年左右的时间。国内想要追上此前GPT-3.5的水准,可能一年时间便可以实现,但如今国外已经迭代到了GPT-4,且GPT-5目前已在训练当中,因此国内发力这一赛道的选手想要追上OpenAI,应该需要三年左右的时间。

  不过,王小川也表示,这一时长并不是固定的,而是动态变化的,如果国内的相关技术团队通过努力取得了显著的进展,这个时间可能会进一步缩短。

  值得一提的是,此前在接受36氪采访时,李彦宏还强调,OpenAI之所以能突出重围,是因为此前该赛道并未受到大厂们的过分关注,大厂们普遍不太看好这个方向,这才给了创业公司以更多的成长空间。但如今随着ChatGPT的爆火,各大公司都瞄上了这个赛道,在大厂纷纷入局的情况下,创业公司能成功的机会变得更少,李彦宏建议“创业公司别重复造轮子了。”

  然而,此次从零开始创业的王小川,并不认可李彦宏的说法。在王小川看来,创业公司仍有机会。参照过往历史发展中的诸多重大变化,创业公司很多时候并未缺席,“很明显,创业公司会比大公司跑得快,为什么创业公司会不行?”

  对于中国科技公司现在入局大语言模型竞争已经晚了的说法,王小川更是满怀志气地表示,虽然晚了但仍得干。王小川还列举美国人造出核弹、但国人也要造的例子,“这跟创业公司本身没关系,是中国要不要做的问题。”

  随着此次专访的结束,王小川和百度的“口水战”正式吹响号角。4月13日,百度集团副总裁、搜索平台负责人肖阳化身百度方面的发言人,对王小川的“嘲讽”激情开麦直接回呛道,“‘天上一天,人间一年’,王小川脱离一线太久,确实跟我们不在一个宇宙,自然对国内人工智能技术的发展缺乏了解。”

  肖阳表示,他也非常希望可以看到中国能够跑出一家像OpenAI一样的公司,但当年搜狗也立志取代百度搜索,结果也是显而易见的。最后肖阳还套用那英评价章子怡参与音综担任导师的话,“所以很难评价,那我祝他成功吧!”

  肖阳的言论一出,王小川次日凌晨在微博发文回怼,“什么样的平行宇宙里,才能做到让一个脱离一线15年的人,去怼一个脱离一线1.5年的人。”一时间,王小川和百度之间的“口水战”火药味愈发浓烈。

  对于隔空论战,有媒体调侃道,“既生王小川,何生李彦宏”。

  事实上,针锋相对的王小川及李彦宏二人,身上有一些相似之处。虽然王小川比李彦宏小了10岁,但两人都曾在国内顶尖学府读书,李彦宏毕业于北京大学信息管理专业,王小川则毕业于清华大学计算机科学与技术专业。在从学校进入职场之后,二人又先后扎入互联网行业,并在搜索引擎、输入法、浏览器、人工智能等多个领域开展过多番较量。

  然而,如同清北谁才是国内高等学府的头把交椅之争一般,命运十分相似的李彦宏、王小川二人却总是火药味十足。雷达财经梳理发现,王小川及其创办的搜狐与李彦宏和他的百度之间的“恩怨”由来已久。

  早在20年前,王小川就想“干掉”李彦宏。彼时,刚刚从清华毕业的王小川便被搜狐大佬张朝阳喊来,而张朝阳交给王小川的首个重任便是让其打造能够对标百度的搜索引擎,为此张朝阳更是霸气放话,“给你六个人头,灭掉百度”。

  然而,仅仅六个人就想要挑战百度谈何容易,但王小川只能硬着头皮往上冲。通过降低单人预算的方式,王小川成功“忽悠”来了12名来自清华计算机系的学生,他们以兼职的形式参与到该项目的研发之中。

  在没日没夜地埋头苦干下,这样一支看似捉襟见肘的团队终于在11个月后完成了张朝阳托付的开发搜索引擎的“军令状”,而这个搜索引擎最终选用电影《大腕》台词中提到的“搜狗”命名。

  2004年,搜狗搜索正式上线,但想要从已经抢占先机的百度中获得更多的市场份额并非易事。等到百度登陆纳斯达克的2005年,搜狗的市占率却仅为2%。对于搜狗与百度的差距,王小川并不认为是自己能力的问题,“我比李彦宏技术好,只是没有他命好”。

  2010年,搜狗正式从搜狐剥离迎来独立运营的前夕,正好赶上百度CTO李一男离职之际,因此百度CTO的职位在此时空缺了出来,彼时李彦宏和百度的其他高管觉得王小川或许是适合该职位的不二人选。但据王小川透露,自己当时在接触李彦宏后,觉得对方与自己完全不来电,最终王小川并未加入百度。

  2013年,百度豪掷19亿美元将91无线收入囊中。彼时,王小川在回答网友的提问时认为百度此次收购的方向是正确的。而王小川给出这样判断的理由是,其认为百度当时已无法直接延续PC搜索时代的辉煌,需要手机助手类的产品来为自己之后各种无线搜索的可能性铺路。

  王小川还提出假设,如果百度的无限战略能够押宝成功,其重新回归千亿市值不成问题,但如果没能取得成功,那么百度就是下一个雅虎。

  2017年2月,还未上市的搜狗提前举行了一场财报媒体沟通会。会上,王小川直接不留情面地称百度是没有战略的公司。在市场份额已经够大的情况下,王小川认为百度的医疗业务会变得更加艰难,百度将广告模式转为为用户提供咨询的模式将给其营收造成下滑的影响;对于百度深耕的无人驾驶赛道,王小川则认为“开车这事儿不是搜索公司该干的”。

  2018年11月,做客《遇见大咖》节目时,王小川再度向百度“开炮”。面对是否畏惧在人工智能领域有相当大声量的百度的问题时,王小川直言,百度一年换一个新战略,搜狗并不觉得百度有什么好怕的。王小川认为,与对手相比,虽然搜狗一直都是用1/10甚至更少的人,但做的创新突破实际上要更多。

  2021年,在与俞敏洪的一次对话中,王小川又称,如果自己身在百度,百度的情况应该会比当时好一丢丢。

  除了上述提到的这些“恩怨”以外,王小川还频繁通过微博向百度“开炮”。2010年9月,王小川发微博暗指百度发布的手机输入法有抄袭搜狗输入法的嫌疑,称百度输入法“大多都有着搜狗手机输入法的影子,甚至直接命中搜狗的商标和专利”。王小川还表示,在当时那个知识产权保护缺位的环境下,搜狗更得发力。

  一个月后,王小川又在微博晒出几家输入法的准确率测试结果,其中搜狗输入法以89%的准确率保持领先,腾讯输入法以84%的准确率紧随其后,百度输入法的准确率为77%,排在新浪输入法之前。

  2011年2月,百度推出百度影音之际,王小川在微博称“百度有在客户端上屡败屡战的坚韧”;同年8月,王小川又在微博留下了“百度搜不到你,只好进搜狗”的文字。

  2012年3月,在谈到互联网的版权问题时,王小川发博称,“现在正版阅读是收费的,如果不打击盗版而只是搜狗搜索正版化,结果是觉悟高的用户通过搜狗去盛大文学缴钱,而普通用户会选择盗版去百度。这样对觉悟高的用户不公平,也便宜了百度。”

  2012年6月,一篇题为《李逵遇李鬼?百度、搜狐输入法3.0版本对比》的文章引起了王小川的注意。对于这篇文章,王小川称其是“烂枪稿”,并表示最近贼喊捉贼的事情真不少。王小川还指出该文把搜狗输入法说成搜狐输入法,“心里阴暗扭曲可见一斑”。

  同年8月,有用户在微博晒出360安全浏览器拦截百度首页的截图,王小川转发微博称,“360安全浏览器对百度来说太不安全了”。

  4个月后,在微博谈及国内外搜索市场的相关话题时,王小川再次暗指百度没有创新。王小川称如果百度能和谷歌一样有创新和远见,搜狗就直接投降了,但百度恰恰不是谷歌,因此搜狗有了机会。

  将视线转移至此次人工智能领域的较量,目前百度已于3月16日发布了自家的大语言模型文心一言,而王小川的团队还尚未拿出相应的产品。虽然百度的文心一言的确与国外的ChatGPT还存在一定的差距,但作为刚刚才组建好创业团队的王小川而言,其想要追上百度的步伐也需要一定的时日。

  雷达财经注意到,3月24日,王小川刚刚成立了一家名为五季智能(北京)科技有限公司的企业。天眼查显示,该公司注册资本为500万元,王小川持有公司99%的股份,是公司的实际控制人和最终受益人。

  紧接着4月10日,王小川在微博宣布了其正式创建集研发并提供通用人工智能服务于一体的百川智能公司的喜讯。以此计算,这则消息发布到现在才不过5日。即便不与百度相比,与360、阿里、商汤科技,或者同为创业派的王慧文等大佬相比,王小川入局的步伐稍稍晚了一些。

  因为各家尚处于起步阶段,目前暂时看不出各个选手之间的真正差距。和各个大公司相比,王小川或许与原美团联合创始人王慧文的情况更为类似,二人皆为重新开始创业,且王小川的启动资金与王慧文一样,均为5000万美元。其中,王慧文的资金全部来自于其个人,而王小川的启动资金还有其亲友的支持。另据王慧文透露,目前已有顶级VC认购其下一轮规模达2.3亿美元的融资。

  不过,相比不懂AI技术的王慧文“带资进组”、向外界广发英雄帖、以及提前锁定下一轮融资,王小川则在技术方面有着更为丰富的经验。此次进军领域,各家团队都在秀自己的AI血脉。比如,周鸿t背后的360曾在投资者互动平台上表示,公司的人工智能研究院从2020年开始一直在包括类ChatGPT技术在内的AIGC技术上有持续性的投入。

  此番创业的王小川,也不忘大秀自己的AI基因。王小川表示,自己创办的搜狗其实是有强AI背景的,而且是以语言为核心的AI,只是随着时代的发展,不少人忘了搜索其实是AI系统、语言系统。王小川认为,当下大模型成功的核心便是语言方向的成功,AI则在其中具备贯穿始终的能力。

  而王小川此前在搜狐时期积攒的AI经验和人脉,也为其新公司百川智能的估值增加不少筹码。天眼查显示,五季智能(北京)科技有限公司另外一位持股1%的股东,正是王小川此前在搜狗奋战时的老搭档、前搜狗COO茹立云。

  此外,百川智能目前还招募到了数十位来自前搜狗、百度、华为、微软、字节、腾讯等多家科技大厂的顶尖AI人才。据王小川透露,到这个月底,其团队的规模将接近50人。

  与此同时,尽管当下距离王小川官宣重新创业的消息才过去几日,但百川智能目前已开始大模型的训练,百川智能将“争取在年底前发布国内最好的大模型和颠覆性的产品”,并在搜索、多模态、教育、医疗等领域进行应用。

  有分析指出,虽然王小川有一定的AI技术积累,但类ChatGPT应用的研发是一项十分“烧钱”的事情。比如根据美国《财富》杂志的报道,仅过去一年,OpenAI公司的净亏损总额便高达5.45亿美元。对于目前只有5000万美元启动资金的百川智能而言,其资金实力会在一定程度上限制其研发的进度和突破。

  当雷达财经将“如何看待王小川此番携5000万美元进军AI创业”的问题交给百度文心一言时,文心一言给出了这样的回答,“王小川携5000万美元进军AI创业这一举动本身并不算出人意料。作为一个在互联网领域有着广泛影响力的人物,他在自己的领域积累了丰富的经验和资源。而AI作为一个前沿领域,具有广阔的应用前景和商业价值。因此,他进军AI创业也是符合其个人和职业发展规划的。”

  文心一言还从另外一个角度进行了分析,“王小川进军AI创业引起了广泛的关注和讨论。一方面,这表明了他在AI领域的高度关注和重视,同时也表明了他对于自己未来职业发展的规划和选择。另一方面,这也意味着AI创业仍然存在着很多不确定性和风险,需要更多的投资和创业者的努力才能够实现商业成功。”



商汤版ChatGPT「商量」来了!开放API,基于千亿参数大模型,体验实录在此

商汤slam,商汤sp,商汤 irdc,商汤app
关注

文章转载来源:AI之势

来源:量子位

国产ChatGPT之战,已然是大步迈进白热化阶段。

就在刚刚,商汤正式发布自研类ChatGPT产品,名曰商量(SenseChat)。

单单是这个名字,便值得说道一番。

商量的“商”,不仅体现了它是商汤自家“商字辈儿”的产品;从整体来看,更是具有商讨、交换意见的味道。

毕竟我们在使用类ChatGPT产品过程中,恰巧就是一种人机协同的过程:不应是一味的问与答,而是通过引导等方式让输出结果趋于理想。

在商量的背后,所依托的是商汤自研的千亿参数自然语言处理模型。

而在此模型的背后,则是商汤最新推出的日日新(SenseNova)大模型体系。

也正是因为这种的能力,商汤的发布还不同于此前国产类ChatGPT玩家,它一口气还发布了:

  • 秒画:AI内容创作社区平台。
  • 如影:AI数字人视频生成平台。
  • 琼宇格物:3D内容生成平台。

更重要的一点是,根据商汤CEO徐立在现场的描述,上述这些AIGC产品所要发力之处,将是诸如医疗、短视频、教育、营销以及开发等产业领域。

但不得不说,这一波科技之战,着实是愈演愈烈了。

“商量”的体验实录

那么商汤的AIGC产品,效果又是如何?

我们在前方现场也体验了一下。

先来看下商量这款产品,是否真的能做到商量。

多轮对话能力展示

既要多轮对话,又要人机共创,那么和它商量着创作一个故事,便是很好例子:

我们来一起创作儿童故事吧。规则是我先说一句,你再说一句,交替进行。直到我说故事编完了就结束。你明白了么?

在我们下达指示之后,“商量”表示了理解,然后就开始了“你一句我一句”人机共创故事的之旅:

人类:小花是一只小猫咪,他很喜欢钓鱼。

商量:小花在河边钓鱼,他钓到了一条大鱼。

人类:大鱼对小花说,请你放我回去吧,我家里还有小鱼在等着我呢。

商量:小花心地善良,他同意了大鱼的请求,把大鱼放回了河里。大鱼感激地游走了,小花也继续享受着的钓鱼的乐趣。

从这个过程中不难看出,“商量”是可以理解用户的语义,了解故事中的角色和关系,并且能够get用户的思路,基于此以多轮对话形式来完成故事的创作。

(要是让小朋友们跟“商量”一起创作故事,怕是能玩上一整天吧。)

不仅如此,在体验过程中,我们还发现“商量”是具备一定共情能力的。

例如当我们处于迷茫之际,可以向它提问:

如何提高自我认识,更好地了解自己?

此时的“商量”仿佛可以抓住问题背后人类内心真正的需求,回答中的“学会爱自己”、“学会自我肯定和鼓励”,显得格外暖心。

当然,多轮对话仅仅是对话机器人能力展示的一隅。

接下来,我们就要拿网友们经常调侃AI的诸多问题,来开启更高难度的挑战了!

只认事实,不认“老婆说的都对”

当然,创作能力是聊天机器人能力的一面,但对于事实的尊重也是非常重要的一点。

对于此前被网友们玩坏的“老婆说的都对”,“商量”又会如何应对?

嗯,老婆在事实面前是真的不好使了。

我们再来一个更天马行空的胡诌:

请告诉我以下陈述是否包含时代错误:在盟军轰炸硫磺岛海滩期间,拉尔夫大声地对着自己的iPhone说话。

“商量”面对这么一句胡诌,直接指出了iPhone与二战的时代背景不符,可见其不仅能理解句子的意思,还能通过尝试判断句子的合理性。

那么对于非常绕的逻辑问题,“商量”是否也能轻松应对?

请听题目:

假设False与True是False,则True与not False是?

讲真,人类都得思忖半天的“绕弯问题”,“商量”不仅能够秒出结果,还能把推理过程一并给出。

超长文本也能hold住

正如我们刚才提到的,“商量”是一个To B的产品,那么它定然需要解决的问题不是“片段性”的。

为此,商汤在现场还演示了基于“商量”背后的大模型,开发了帮助用户进行新知识获取和理解的助手工具,是可以轻松hold住超长文本的那种。

例如把一本《专利法》投喂给它,我们就可以向它咨询很多专业性的问题了:

什么样的东西可以申请专利?

从结果上来看,这个工具并不是直接从《专利法》中copy对应的结果,而是模型理解了问题之后,生成并总结了答案。

基于这样的能力,以后我们在工作上的效率提高程度,可见一斑。

不仅如此,刚才我们投喂的《专利法》是2020年的版本,而今年国家知识产权局就专利申请是提出过新的要求的。

从我们提问“今年规定有没有新的变化”的回答中不难看出,模型确实融合了最新的资讯,并给出了合理的答案。

再如同样是基于大语言模型,商汤面向开发者所打造的AI代码助手,可以提供代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等功能。

据了解,AI代码助手可以同时支持中英文及多种编程语言,并且可以快速适应开发者的个性化编码风格。

从根据商汤内部测试的结果来看,在使用“AI代码助手”后,代码编写效率可以提升62%,Humaneval测试集一次通过率可以达到40.2%。

马斯克中国游记,2秒钟就能搞定

除了对话机器人之外,商汤AI作画产品“秒画”也是本次发布的一大亮点。

话不多说,直接上效果。

我们同样是先来看看被网友们玩儿坏了的一个Prompt:

中国80年代,马斯克在河南的农村,穿着当时年代的中国服装。

嗯,是有那个味道了。

而且更为关键的是,生成512K图片仅需2秒钟!

不仅如此,商汤在现场演示的过程中,还展示了逼真效果版的港风美女。

同样是2秒出图,引得现场观众“哇”声一片:

那么除了这种趣味性的以文生图,“秒画”的作品是否能够达到在产业中的应用水平?

我们继续试验:

明亮的场面,鸟瞰图,中国古代城市,水晶,魔幻,幻想,华丽的光作用,透明度,镜面反射,华丽的光,错综复杂的细节,精细的纹理,超现实,单反摄影,广角镜头,照片,现实,锋利的焦点,超锋利。

不得不说,如此恢宏壮丽的景象,是把想象拉进现实的那种了。

若是想生成与太空探索主题相关的高清大海报,这个也可以有,只需把这句话投喂进去:

一艘闪闪发光的飞船绕着一颗巨大的气态巨行星的月球旋转,在天空中盘旋着云,飞船在月球前气态巨行星前,美丽的科幻艺术,超现实的白日梦。

不难看出,“秒画”是经得住考验的那种AI了。

除了以文生图之外,我们再来看下AI数字人生成平台。

据了解,商汤的“如影”仅需要5分钟真人视频素材,就可以生成出声音及动作自然、口型准确、多语种精通的数字人分身。

再如“琼宇”和“格物”,基于神经辐射场技术(NeRF),可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。

由此可见,商汤的AIGC能力已然是做到了全面覆盖,并且水平也是肉眼可见的达到了可以“上岗”的水平。

那么接下来的一个问题是:

怎么炼成的?

背后的日日新大模型,便是炼成“商量”、“秒画”等一众AIGC产品的杀手锏。

日日新,顾名思义,是指模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI更多可能。

(取自《礼记・大学》中汤之盘铭曰“苟日新、日日新、又日新”)

从现场展现的能力来看,日日新大模型能够提供的能力,主要集中在了自然语言处理、图片生成、自动化数据标注、自定义模型训练等。

但日日新大模型并非是趁着这一波AIGC大热潮,一蹴而就出现的那种。

其实早在五年前,商汤便已经在大模型领域着手研发。

并且在2019年,商汤便使用上千张GPU进行单任务训练,推出了10亿参数规模的视觉模型,并实现了当时业界最好的算法效果。

后来在2021年到2022年期间,商汤训练并开源了30亿参数的多模态大模型――书生。?

就目前来看,商汤已经成功研发了320亿参数量的全球最大的通用视觉模型;并且已经打造了CV、NLP和AIGC相关大模型。

因此,不难看出商汤此次发布的超大模型体系,其实是早有所准备,通过五年来的各项“小作业”,融会贯通并提交了一项“大作业”。

值得一提的是,在此次发布会中,商汤表示“日日新”将提供多种灵活的API接口和服务,包括图片生成,自然语言生成,视觉感知通用任务与标注服务!

……

但有一说一,多模态和决策智能大模型,并非是商汤通往通用人工智能(AGI)的唯一杀手锏。

大模型时代,大算力更为重要

没错,商汤自己的超强算力,正是另一项更为关键的因素。

它便是于2022年1月交付使用,首付56亿元,一举成为亚洲最大的AI超算中心之一的人工智能计算中心(AIDC)。

一年之前,商汤AIDC的总算力便已经是3740 Petaflops,如此算力之下,已经可以完整训练万亿参数规模的大模型。

时隔一年,现如今,这个算力数字已然是翻了个小翻,达到了5000 Petaflops!

它可以以最大4000卡规模集群进行单任务训练,并可做到七天以上不间断的稳定训练。

但了解商汤的朋友都知道,这个AIDC还仅是商汤AI大装置SenseCore的一部分。

除了AIDC这个算力层之外,加之数据层和模型层两大维度,便构成了“三位一体”的AI大装置。

因此,综合来看,商汤在通往AGI道路上的范式,便是“大模型+大算力”。

而如此布局的背后,在今天的发布会中,商汤对此的逻辑思考也逐步浮出水面,AGI时代之下,数据、算法和算力三要素有了新的需求:

计算量(GPU数量 x 运行时间 x 并行效率 )=模型参数量 x 处理数据量。

怎么理解?

模型参数量要足够多,才能实现AI智慧的涌现,而这也带来了对算力的剧增,需要更高的并行效率,才能有效支持大参数模型训练。

数据方面,高质量自然语言数据逐渐稀缺,而视觉数据相较自然语言在数量、质量、容纳信息等方面有多种优势,能够使得AI更好地理解世界。

由此,就不难理解商汤如此布局的原因了。

……

总而言之,有大数据、有大模型、有大算力,商汤在国产AIGC的亮相,一点也不意外。

是值得期待一波了。