庆云古诗词

庆云古诗词

AIGC“尖峰系列”丨李维博士:ChatGPT海啸狂飙,谁将被取代?谁将借力跃升?

淘文章 0

2023年11月20日 每日一猜答案: 答案:ABC
每日一猜答案分析:

尖峰jeff,尖峰2016,尖峰集团董事长是谁,尖峰v1

来源:源码资本

在上一篇文章《AIGC“尖峰系列”丨李维博士:人类语言“通天塔”建成,【【微信】】的辉煌与挑战》中,我们分享了李维博士关于【【微信】】对于人类和机器交互的意义,以及其背后LLM(Large Language Model)语言大模型是如何炼成的等话题。

本篇文章我们将分享李维博士对于“【【微信】】让AI生态重新洗牌”“语言大模型(LLM)的生态和应用”等话题的独到观点,以下为演讲内容精选。

01

经历【【微信】】海啸之后

AI生态面临洗礼和洗牌

【【微信】】海啸引发的直接影响就是,NLP生态面临全面洗礼或洗牌,每一个现存的NLP产品服务或赛道都要在LLM参照系下重新审视。

一开始我们内部AI老友热议【【微信】】的时候,大家首先思考的是,【【微信】】怎么和搜索技术结合起来,它能颠覆搜索吗?

搜索是可追踪的,返回的每条结果都有记录,谈不上信息融合。【【微信】】是不可追踪的,长于信息融合:【【微信】】本质上不存在抄袭的可能性,它给你吐出来的每句话,都是自己消化之后的语言。可见,传统搜索与【【微信】】是两个完全不同的处理方式,各有优缺点。

搜索是信息服务之王,无处不在,有自己的巨头(谷歌,还有中国的百度)和非常稳定的商业模式。自从Web1.0时代搜索崛起以来,搜索的形态和模式基本没有改变,二十多年了。其实,多年来一直不断有新技术和创业者企图挑战搜索,风险投资界也一直关注可能成为“next Google”的潜在的搜索颠覆者,但搜索的地位一直固若金汤。但这一次有所不同,微软携【【微信】】的独家代码授权,大刀阔斧高调发布所谓“new Bing”。躺着赚钱的谷歌不得不紧急动员,正面迎战。一场搜索+LLM的大戏正在上演,像个活话剧,告诉我们虽然融合两项技术还有很多困难需要克服,但大势所趋,重塑搜索新生态势在必行。

除了搜索,那些被打磨得很圆的定向信息产品和服务,现在全部面临被重新审视和洗礼的宿命,包括聊天、功能对话、文法纠错、机器翻译、文摘、知识问答等等,这些方面的代表作品(Siri、小冰、Gramnarly等)以前曾有的技术护栏,一下子被降低了,真好像大水冲了龙王庙。

NLP龙王庙中,虽然不少产品由于多年的打磨以及用户的惰性,还不至于面临灭顶之灾,有的还可能存续很长时间,毕竟都在走下坡的路。这是通用AI对于传统AI的划时代胜利。是我们以前不敢相信的,曾经那么地怀疑通用路线,就等着看鼓吹AGI人的笑话,谁想到人家不笑则已,一笑倾城,甚至“倾国倾球”,所向披靡。

看看13年前苹果就发布的Siri。13年比深度学习革命黄金十年的历史还要长,但搞到现在Siri才刚刚推出两轮或者三轮的对话能力。现在来了个【【微信】】降维打击,苹果怎么办?肯定只有拥抱LLM。亚马逊的风云产品Alexa也是一样,也打磨了好几年了,积累了那么多的用户数据。虽然它在边边角磨得很圆,不可能马上被取代,但依然会面临技术上的调整。

再者是大家常见的电商客服,众所周知,无论是阿里、还是京东的在线售后客服都打磨得很圆了。因为售后服务的问题相对比较集中,问题集不大,在积累了足够数据以后,用户体验就慢慢好起来了。但客服不仅仅局限于售后的问题答复,当客户提出的问题超越了预期的问题集的时候,目前客服常常显得“人工智障”,无论理解和回应都捉襟见肘。面对【【微信】】的问答超能力和多轮对话的丝滑性,怎么办?除了拥抱它,没有别的出路。

在【【微信】】之前,小冰算是把多轮聊天推到了极致,据报道有人痴迷于与她聊天,聊一个晚上还意犹未尽。它打造具有人格化的形象,可以与人做情感上的交流。在前【【微信】】时代,小冰是聊天的绝对天花板,多轮交互的能力把对手远远抛在后面。谁料想半路杀出个程咬金,【【微信】】出来后,小冰的地位就显得非常尴尬。【【微信】】可不是为了闲聊设计的,chat只是它为了达到多任务的一个桥梁,本质上是人机接口,聊天只是它的副产品,即便如此,通用大模型还是实现了降维横扫定向产品的效果。在【【微信】】的丝滑度和通用性面前,一个人格化的聊天机器人跟它不在一个层次上。除了去拥抱它,仍别无他法。

在国外,怎么修改作文的拼写、语法错误这一块,用户体验做得最好,唯一活下来站稳市场的只有Grammarly,有上亿用户了。现在它的地位也极为尴尬,因为同样的辅助写作,【【微信】】也是拿手好戏。长远一点来看,Grammarly的选择也终将如此,要么去拥抱【【微信】】,要么就走向末路。

谷歌MT是机器翻译领域的代表,国内的有道、搜狗和百度也是用的神经机器翻译,但同属神经路线的【【微信】】出来以后,仍然是一种降维打击。用【【微信】】去做机器翻译,译文更加地道而且多样化。生成大模型的随机本性使得每次翻译出来的结果都有所不同,你可以拿同一个文本不断的试它,然后挑其中一个你最满意的。专项机器翻译系统显然面临如何拥抱LLM的问题。

最后谈谈教育。【【微信】】大模型降维碾压所有的教育产品,是很显然的。在教育赛道,搞生态产品应用的人,都需要在大模型的框架下重新审视一遍怎样拥抱这个LLM新时代。教育本身是跟语言打交道的,无论文理。虽然现在的大模型理工科能力不怎么强,但这个知识短板应该很快就会得到不同程度的弥补。【【微信】】必然对教育带来颠覆,同时也为教育现代化提供了一个最大的机遇。语言学习与电脑编程教育就不用说了,【【微信】】本身就是一个语言大模型。虽然目前它的编程还不到专业工程师的水平,但是常用的代码形式已经学得很好了,至少它能辅助你的编程,实际上,GPT赋能的Co-pilot已经成为越来越多码农的辅助工具了。

往后退一步,我们同时也面临着一个巨大的风险,比如说假新闻。如果你希望吹捧一家公司,你可以让【【微信】】生成出五花八门的软文来,讲得头头是道。那些大众点评将来也会被真假莫的评论所掩盖,因为制造假新闻的成本趋近于零。如果没有很好的防范措施,这一切就会把人类置于真假莫辨的世界之中。我们现在一直在讲它的好处,LLM怎样赋能新生态,相信在新生态下,今后的五到十年一定会出现新的阿里、百度等等,这是从发展的角度看技术生态的大转变。但我们面对的LLM滥用的危险同样巨大,人类准备好了吗?显然还没有。当然,这是另一个话题,我们这里就点到为止。

02

大模型:万众创业的浪潮正在到来

以【【微信】】为巅峰的LLM好比核弹,有了它,还有更多的产品形态和赛道等待创业者开拓和落地。

关于这个话题,我们需要特别强调【【微信】】带来的前所未有的创业条件:【【微信】】本身已经成为一个产品的试验场,它就是一个门槛无限低、人人可玩的playground(游乐园)。门槛低是因为前面提到的人机接口的范式改变(paradigm shift)。AI历史上第一次,机器开始迁就人,而不是人迁就机器。是人类语言,而不是计算机代码成为人机交互的工具,这个改变对于NLP新生态大爆发的意义,怎么强调也不过分。实际上,这是为“万众创业”提供了条件。

AI创过业的人应该都有这个体会。创业团队要有成功的机会,最基本的一条是产品老总与技术老总能够密切配合和沟通。产品老总凭着自己的市场直觉和对于客户需求的了解,努力寻找技术转化为服务的最佳市场切入角度,形成产品的设计方案。这个设计方案的可行性需要技术老总来验证和背书。然而,很多时候,由于不同的专业背景和知识结构,产品老总与技术老总鸡同鸭讲的情况也不罕见,一旦出现这种情况,这个创业公司基本上注定没戏。

【【微信】】根本上杜绝了鸡同鸭讲的问题。以前只有技术老总和码农可以验证一个方案的可行性,现在好了,产品老总/CXO、工程技术人员、数据分析员、用户这些不同背景和专长的人,都有一个统一的平台【【微信】】,可以交流产品的创意。大家可以在上面去做模拟的服务。不仅是人机之间,而且人类之间的交流障碍都被克服了。这个东西的发生,就是一个产品大爆发和万众创业的先机条件。

在美国,有好几百家初创公司,现在跟着大模型去做,你上游的大模型还没有完全理顺,他们在下游做的东西就是正在进行时了。还有无数的普通大众,不断的在网上现身说法,告诉大家如何两三个小时就能利用【【微信】】赚到5000块钱,这一类分享越来越多,这意味着草根群众的创业积极性被调动起来了。每个人似乎都可以利用这个机会去找到一个创业视角。归纳总结这些草根的创意,也可能找到可以流程化规模化的满足市场需求的信息服务的新赛道。

【【微信】】这样的大模型最终是一种操作系统级别的存在,每一个与AI有关的,特别是语言和知识有关的信息产品和服务,都离不开它。当年英特尔主导的时候,那个著名的logo是Intel Inside,将来就是Chat-Inside,这还不够准确,应该叫Chat-In&Out。怎么讲?【【微信】】这样的大模型赋能产品的时候,它既是服务员也是大厨,服务员可以跟你接单子,对话交互,了解需求,同时,它还自己去做工,满足你的信息需求,交付也还是它。既有表又有里,既用到它的语言天才,也要用它的知识技能。

这就是我说的在未来的五年可能是最大发展的一个新生态形式,叫做LLM专家坐台,它或许会打开了无数的创业大门。基本的服务形态就是各行各业的在线信息服务,不管是在线教育、在线律师、在线顾问、在线金融、在线旅游,都是奔着大幅度提高服务的效率去的。有了【【微信】】之后,你只需要雇一个专家,来代替以前需要10个专家甚至100个专家才能应对的任务,最后迎来的就是生产力大爆发。

至此,应用生态很清晰了,也靠谱。原则就是对结果要专家最后把关(human judge as final filter)。这是最基本的设置,当然也不排除专家对于输入做提示词的调配,以便激发LLM回应更好的结果。

对几乎每一个场景应用,都有一个打造专家工作台(“坐台”)的任务。下游创业沿着这个思路去,有无数切入市场的机会,包括补充现有产品或服务的不足,例如在线教育的每一个细分场景,还有在线医生,在线律师,在线金融咨询,等等,也包括去开拓以前不敢想或没想到的业务场景。这是看得见的即将发生的生态形态的大变革,或重新洗牌,提供的是高效专家建议(expert-in-loop services)。

说到坐台,国内电商大厂都曾经打造过有相当规模的客服坐台,那是在用户需求和满意度无法用全自动方案满足,更无法用全人工应对的压力下出台的。现在有了LLM,继承这种形态推广到所有在线服务领域的条件已经成熟。这件事所能带来的生产率大爆发,超出想象。

“Human as judge”的设计理念在近几年的低代码平台(例如RPA平台、parser-enabed信息抽取平台等)已经验证了其有效性和有效率性。我的最新几个专利就专门讲的这个过程(human as judge to replace human as coder),但这是说的低代码快速开发环境,这个human虽然不必要手工写代码,但还是要熟悉软件开发的流程,例如单元测试、回归测试和debug等等,不是仅仅就做个judge。这里说的是全新的形态,human只需要做judge即可完成服务。现在完全有可能打造针对各种细分赛道或场景的在线信息服务“坐台”。具体说,专家的作用只是在最终go or no-go 的当口,以他的知识和经验做出判定。做裁判比做运动员,效率要高太多了。

值得强调的是,这次【【微信】】横空出世带来的新鲜事儿是,【【微信】】既是后台也坐前台。这就好比找对象娶媳妇,通常都是漂亮的见识短,能干的不漂亮。突然来了一位既“万能”又漂亮的,这无法不激发无数追求者的想象极限。我们信息产业的创业者就是【【微信】】的追求者。上得厅堂下得厨房,说的就是【【微信】】,这是因为chat只是【【微信】】的表,本质是人机接口,而能够完成NLP各种任务才是它的里子。有表有里,就可以围绕它建立下游生态的产品或服务。英特尔时代,电脑产品的品牌广告记得是Intel inside,今后的新生态应该叫chat in&out,指的就是LLM赋能的新生态,不仅赋能人机交互的表面,同等重要的,或者更重要的(看具体落地服务的性质了),是也赋能产品服务的内涵,只是要让专家最后把个关。在这种形态下,专家也还是隐身在台后的。就是说,活交给它做,出面交付也还是它,只是后面安插一个专家督导和裁决而已。再打个比方,LLM既是服务员也是大厨,只是出餐前需要一个经理过一下目,为服务质量把关,也承担责任(例如在线医生、在线律师、在线咨询师等)。

在这样的生态下,今后5年会是在线服务的大爆发时期。赶巧的是,三年疫情也极大推动了在线服务的草根意识(awarenss),帮助养成了用户的在线习惯,培育了市场。例如我个人疫情前从来不用外卖的apps,也不用在线医生,可是现在二者都用了,比以前自己到餐馆点外卖,为个伤风感冒自己去预约诊所,不知道方便了多少,再也不想回到以前的低效率线下服务了。天时地利,借着这个东风,新生态不可能没有机会。

怎样建造坐台?既然已经LLM in&out了,听上去好像这个坐台谁都可以建,每个坐台配上专家,明天就可以在线开业服务了,那还有创业者什么事儿?当然不是这么简单。这是因为【【微信】】这样的LLM作为工作引擎(work horse),显示出各种专业知识的潜力,但这种潜力却是漏洞百出、有内伤的。这些内伤前面论过,按照现在的路线是不可根治的。就是说,表面光,里子并不扎实,结果不可靠,甚至会要人命的。坐台的建设就是要试图解决这个问题:如何加强内功,使得其在线服务,仅仅需要expert的流程化介入,而不是专家的生产性投入(例如RPA)。要的是坐台部署以后output一端的结果审核(go/no-go及校订post-editing),这都是在线的介入,而不是离线的调教(fine tune)。离线调教是坐台建设者的任务,这就开始有点渐入新生态的深水区了,其中有些路线图是蛮清晰的,有些是可以预见不久会解决的,还有较少的一些点,目前不够清晰,还需要探索和进一步验证。

细看一下这里的主要问题在哪里,有哪些可能的突破点和解决方案呢?首先,论专业知识的广度,LLM很厉害。没办法,人家记忆力强,肚子大,消化的材料多,这些都超出了专家,你可以用一个领域的专有术语去试试就知道了,LLM对任何一个很偏很狭窄的主题都会有自己的消化总结,成套成套的,可能细处有错漏,但在面面俱到方面碾压专家。为什么这一点也很重要,因为LLM弥补了人类包括专家的缺陷,用软件的话说,人类precision(精度)有余,recall(召回)不足;而LLM正相反,precision不足,recall有余。LLM可以把可能遗漏的东西,从大数据的黑洞翻上来,随时提到人类认知的雷达上。因此,坐台建设的重中之重就是要克服LLM的precision瓶颈。

我们并不企图彻底解决这个问题:话说回来,如果彻底解决了,就没有人类什么事儿了,前景很诡异,不论。我们是要把精度提高到这样的程度,其结果不至于严重影响坐台的在线专家的工作效率。LLM如果用一堆垃圾轰炸专家肯定是不行的。只要LLM输出的结果有1/4可以达到手工专家自己调研所能达到的水平,这个坐台的效率就得到了保障,这个在线服务就可能站得住。因为专家不过就是4个go/no-go的裁决而已,由于这4个结果的最优解的出场是随机的,对于专家的实际工作体验,大约也就是每看两个结果,就可以放行一个,GO!这不是负担,也不会降低在线服务的效率和竞争性。1/4是一个容错性很大的预期,现在的求精方案达到这个门槛,总体是具有可行性的。正因为有了这个总体具有可行性的基本判断,才可以结论说:LLM新生态下的创业大门的确是打开了。

「一起向未来」AIGC系列第三场

举报/反馈


315打假事件都有什么 315打假的具体事件

315打假事件案例,315打假事件作文,315打假事件新闻,315打假事件论文

\ | /

每年的3・15国际消费者权益日,都会有一批侵犯消费者权益的商家被曝光。

打假,不仅要打商品的假,新闻的假同样也要打。尤其是自媒体领域。

近日,中央网信办组织召开会议,部署开展“清朗・从严整治‘自媒体’乱象”专项行动。无中生有制造谣言;集纳旧闻旧事冷饭热炒,使用异地新闻嫁接拼凑,移花接木制造虚假消息等行为,都在整治之列。

涉甲流假新闻

1

新冠抗原试剂能测出甲流病毒?

近期,国内部分省份出现了甲型流行性感冒高发的现象。核酸检测能鉴别流感的消息在网上传开后,一部分网友质疑“核酸检测是用来测新冠的、还能测流感吗?”,另一部分网友则认为“家里的新冠抗原试剂也能测甲流”。

真相:

中国医科大学附属第一医院主治医师刘胜称,感染甲流可以通过做核酸检测发现,但此核酸非彼核酸。每个病原体都有核酸,热搜中提到的核酸检测用的是针对甲流病原体的核酸检测试剂。除此之外,在医院通过专业的试纸也可以检测出是否感染甲流。

2

奥司他韦是治疗感冒、流感的

“万能神药”?

用于甲流和乙流的治疗药物奥司他韦近日受到广泛关注。一周内奥司他韦在网络搜索上涨1150%,被称为流感“神药”的奥司他韦断货的词条也多次冲上热搜。

真相:

上述说法言过其实。流行性感冒(流感)多为甲型流感病毒引起,普通感冒多为鼻病毒等引起,奥司他韦等神经氨酸酶抑制剂是甲流的预防和治疗药物,但其对普通感冒无效。且奥司他韦这类抗病毒药物属于处方药,使用时须遵医嘱,不宜自行服用;具有一定的耐药性,也不宜长期服用。

3

怀孕后不能打流感疫苗?

“孕妇接种流感疫苗安全吗?”“孕早期接种流感疫苗对胎儿有影响吗?”“孕妇能打哪种流感疫苗?”……网上针对孕妇打流感疫苗的说法五花八门。

真相:

首都医科大学附属北京朝阳医院呼吸内科主任医师郭兮恒表示:“怀孕是可以打流感疫苗的。对于孕妇而言,孕期可以接种灭活的流感疫苗,一般不会对胎儿产生不良影响。”

涉新冠假新闻?

1

新冠消失了?

春节后为什么没有出现第二波感染高峰?新冠疫情还会再来一波吗?新冠病毒有没有“消失”?近日,关于“新冠病毒去哪儿了”的问题引起广泛讨论。

真相:

根据中国疾控中心近期最新发布的《全国新型冠状病毒疫情情况》,新冠感染者虽然已大幅降低,但是新冠感染人数仍然存在。

2

第二波新冠疫情又要来了?

2023年2月19日,杭州一所小学出现10名新冠阳性,学校停课的消息,随即登上了各大平台的热搜。

真相:

杭州市疫情防控指挥部相关负责人介绍,杭州个别学校班级出现的数名学生感染新冠病毒均为首次感染,属于正常现象,并不代表新一波流行的开始?。

近期其他假新闻?

1

“杭州文旅局局长高清写真”疯传?

3月13日,打开社交平台,一则名为“杭州文旅局局长高清写真”的视频登上热门,辣眼的画风吸引了一批吃瓜群众。

真相:

杭州市文化广电旅游局工作人员回应:假的!平台不审核过怎么能随便发?请博主和平台赶紧删视频,我们也会采取相应措施。

2

刘文正去世?

*歌手、华语乐坛一代巨星刘文正,在两天时间里经历了一场“死而复生”的闹剧。其“去世”消息于2023年2月15日由其前经纪人夏玉顺在接受*媒体采访时透露。

真相:

据媒体报道,仅仅时隔一天,夏玉顺就改口表示,“刘文正其实是为了不想再被打扰,才会希望他放出死讯”。

3

杭州机动车取消限行?

2023年2月16日,一则杭州市政府将于3月1日取消机动车依尾号限行的“新闻稿”在网上流传。

真相:

据浙江之声报道,16日下午,杭州某小区业主群讨论【【微信】】,一位业主开玩笑说尝试用它写篇杭州取消限行的新闻稿,随后在群里直播了使用【【微信】】的写作过程,还把文章发在群里。其他业主不明就里,截图转发,导致错误信息传播。

4

男生进女寝被抓大喊“我爸是干部”

网传广东广州华商职业学院一男生因进女生宿舍被发现,被抓时还大喊“我爸是干部”,消息引发网友热议。

真相:

2023年2月27日,针对网传消息。广州华商职业学院发布情况说明,该生父亲是省内工人,并非“国家领导干部”。该生是在值班老师陪同下于当天12时许进入事发宿舍楼,并无“在女生宿舍留宿”情况。

5

【【微信】】体验几次后要收费?

在【【微信】】大火时,各种“蹭热度”的行为也层出不穷:有的推出“山寨版”【【微信】】服务,免费体验几次后高额收费。

真相:

据广州日报报道,广东省消委会提醒,这些产品大多只是借用【【微信】】热度赚钱牟利,而非真正的【【微信】】,其聊天能力和【【微信】】相差甚远,有些回复是统一的应答话术,甚至答非所问,对话质量低下。而且一些以短期牟利为目的的程序,收取用户会员费或套餐费用后,可能随时关闭跑路,用户售后服务无保障。广大消费者要谨防不良商家蹭热度非法牟利。

6

云南文旅局通知游客延期前往云南?

近日,有不法分子冒充“云南文旅局”的名义,通过微信、小红书等网络平台散布谣言,通知游客延期前往云南。

真相:

云南省文化和旅游厅表示,不存在“云南文旅局”这样的机构或单位,凡是以此名义发布的各类信息均为虚假信息。

7

鸭子给鱼当饲养员?

动物园内,一只鸭子化身“鸭妈妈”,多次给水池中的锦鲤喂食。3月11日,一段拍摄于北京海洋馆的视频引发争议。

真相:

3月12日,北京海洋馆工作人员回应,实际上是鸭子吃了一口食物后去池子里喝水,锦鲤凑过去吃它嘴边掉下的食物残渣,并非喂食。

三招让假新闻退退退!

面对如今互联网上纷繁复杂的各类信息和假新闻,这三招能够帮助我们普通大众鉴别真假!

1、信息要有可靠的出处

在乱云飞渡、情况不明之时,特别要注意报道是否引用了权威信源。对于缺乏权威信源甚至没有信源的模糊信息,要擦亮双眼,保持警惕。

2、消息要完整。

完整的新闻要有六要素,即5W1h,简单说就是“某时某地某人出于某原因而做了某事导致了某结果”。若新闻做不到六要素俱全,真实性就会打折。

3、兼听则明,偏听则暗。

单一信源主张的新闻,哪怕被转载一亿次,也不可信。所谓孤证不立。

看到一个对我们有影响的消息,别急,再找找其他权威媒体的报道,核实一下。