庆云古诗词

庆云古诗词

南财合规周报(第89期):生成式人工智能服务管理办法公开征求意见;广东拟将数据生产要素纳入国民经济核算体系

互联资讯 0

2023年11月20日 每日一猜答案: 答案:ABC
每日一猜答案分析:

合规工作周报,财务部合规报告,财务合规标语,合规风采

  南方财经全媒体记者李润泽子实习生麦子浩广州报道

  本周(0410-0415),合规领域大事不断,尤其人工智能领域,重磅动态频出。

  在人工智能数据安全方面,为促进生成式人工智能健康发展和规范应用,国家互联网信息办公室本周就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见;为有效应对风险、保护客户隐私、维护数据安全,中国支付清算协会倡议支付行业从业人员谨慎使用“ChatGPT”等工具;阿里云及知乎发布人工智能大模型。

  在其他数字经济领域方面,广东省政务服务数据管理局局长杨鹏飞在“2023数字经济峰会”发言透露,《广东省数据条例》即将出台,广东正研究推动将数据生产要素纳入国民经济核算体系;香港国际创科展12日正式揭幕,全球3000家展商捕捉创科发展商机。

  知识产权保护方面,周杰伦起诉网易不正当竞争,并未围绕此前备受关注的著作权纠纷,或与后者旗下游戏擅自赠送其演唱会门票有关;浙江省开展知识产权纠纷快速处理等攻坚行动,在保护市场主体合法权益、完善知识产权保护体系、优化法律服务供给等方面取得了阶段性成果。

  目光转向海外,人工智能领域动态同样不少。美国政府已开始研究是否需要对“ChatGPT”等人工智能工具进行审查,就AI相关监管问题向社会各界征集意见;微软开源“Deep Speed Chat”,可帮助用户通过“傻瓜式”操作以最短的时间、最高效的成本训练类“ChatGPT”大语言模型;日本政府或引入“ChatGPT”,减轻公务员工作负担;环球音乐集团敦促Spotify和苹果等流媒体平台打击AI生成音乐,防止人工智能服务从其受版权保护的歌曲中抓取旋律和歌词。

  数字经济发展

  1、广东拟将数据要素纳入GDP核算,数据交易额今年有望破50亿

  4月13日,广东省政务服务数据管理局局长杨鹏飞在“2023数字经济峰会”的主题发言中透露,《广东省数据条例》即将出台,广东正研究推动将数据生产要素纳入国民经济核算体系。据悉,自2022年广州数据交易所和深圳数据交易所相继挂牌成立后,当年累计交易额超过17亿元。今年,广东数据交易额将突破50亿元。

  南财点评:2022年,广东数字政府改革建设进入2.0阶段――推动政务服务从“快办”向“好办”提升,政府运行从信息化向智能化提升,省域治理由数字化向智慧化提升。这一阶段,与数据要素市场体系建设深度融合成为显著特征。数据作为最重要的创新要素,在有效市场和有为政府之间发挥了穿针引线的重要作用,成为价值创造的重要源泉和驱动数字政府高质量发展的核心动力。

  数字政府与数据要素市场化深度融合,创造更直接的效益和更大的价值,以此为动力驱动数字政府与数字经济、数字社会的结合,驱动数字政府自身进一步的流程再造,实现数字政府和数据赋能相互促进的可持续发展,这就是当前广东省数字政府2.0改革的探索实践。

  2、香港国际创科展12日正式揭幕,全球3000家展商捕捉创科发展商机

  4月12日至15日,由香港特别行政区政府、香港贸易发展局联合举办的首届“香港国际创科展(InnoEX)”将在香港会议展览中心举行,香港贸发局的“香港春季电子产品展”和“香港国际春季灯饰展”也将同期举办。三项科技主题展以“智慧生活联系世界”为共同主题。

  人工智能与数据安全

  1、国家互联网信息办公室就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见

  4月11日,为促进生成式人工智能健康发展和规范应用,国家互联网信息办公室就《生成式人工智能服务管理办法(征求意见稿)》公开征求意见。其中提到,尊重知识产权、商业道德,不得利用算法、数据、平台等优势实施不公平竞争;尊重他人合法利益,防止伤害他人身心健康,损害肖像权、名誉权和个人隐私,侵犯知识产权;禁止非法获取、披露、利用个人信息和隐私、商业秘密。提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责。用于生成式人工智能产品的预训练、优化训练数据,应满足相关规定。

  南财点评:生成式人工智能技术在带来深刻的生产力变革时,也为监管治理提出新挑战。面对新兴的革命性技术,一方面要划定底线,保障国家安全和公共安全;另一方面,也应创造宽松的监管环境,促进新兴技术和产业的发展,为国内产业加强国际竞争力创造良好条件。

  2、中国支付清算协会倡议支付行业从业人员谨慎使用“ChatGPT”等工具

  4月10日,为有效应对风险、保护客户隐私、维护数据安全,提升支付清算行业的数据安全管理水平,根据《中华人民共和国网络安全法》等法律规定,中国支付清算协会向行业发出如下倡议:一是提高思想认识,依法依规使用,支付行业从业人员要遵守所在地区的网络使用规定。二是不上传关键敏感信息。不上传国家及金融行业涉密文件及数据、本公司非公开的材料及数据、客户资料、支付清算基础设施或系统的核心代码等。三是会员单位加强内部管理和引导,会员单位要进一步健全信息安全内控管理制度,开展有针对性的数据风险防控工作。

  3、阿里云峰发布大模型“通义千问”

  4月11日,2023年阿里云峰会在北京国家会议中心举办。会上,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造。他认为,面向AI时代,所有产品都值得用大模型重新升级。阿里云智能CTO周靖人则介绍,未来每一个企业在阿里云上既可以调用“通义千问”的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。

  4、知乎“知海图AI”中文大模型开启内测

  4月13日,在“2023知乎发现大会”上,知乎创始人、董事长兼CEO周源和知乎合伙人、CTO李大海在大会上共同宣布了知乎在AI大模型上的最新合作与应用,正式发布“知海图AI”中文大模型,邀请AI加入知乎“讨论场”。目前,知乎和面壁智能合作开发的“知海图AI”中文大模型,已经运用到知乎热榜中,知乎首个大模型功能“热榜摘要”上线并开启内测。

  知识产权保护

  1、周杰伦起诉网易不正当竞争

  4月10日,公开信息显示,广州网易计算机系统有限公司、网易(杭州)网络有限公司、杭州网易雷火科技有限公司新增一则开庭公告,案由为不正当竞争纠纷,原告为周杰伦及杰威尔音乐有限公司,该案将于4月17日在浙江省杭州市滨江区人民法院开庭审理。

  南财点评:值得注意的是,双方的矛盾并未围绕此前备受关注的著作权纠纷。上海申伦律师事务所夏海龙律师接受南方财经全媒体采访时表示,涉及到不正当竞争纠纷,可能不是擅自使用了周杰伦的歌曲,更大概率是使用了一些周杰伦相关的元素。

  2、浙江省开展知识产权纠纷快速处理等攻坚行动

  4月13日,浙江省召开“一号改革工程”法治环境专项小组季度例会暨分析点评会,会上指出,各责任单位在保护市场主体合法权益、完善知识产权保护体系、优化法律服务供给等方面取得了阶段性成果。2023年以来,浙江省全省专利侵权纠纷行政裁决案件结案率达到96.15%、诉前羁押必要性审查率达99.2%、受理涉外商事纠纷案件92件,为企业挽回损失2621万元,分别同比增长15%、164%、跨部门“综合查一次”实施率超年度目标1倍多,达54.42%,实现了全省法治化营商环境建设工作良好开局。

  海外合规风云

  1、美国拟制定AI问责机制

  4月11日,美国商务部下辖咨询机构国家电信与信息管理局(NTIA)公布的一份文件显示,NTIA已经开始就AI相关监管问题向社会各界征集意见,将据此起草AI问责政策相关报告。该文件涵盖了34条关于“AI问责机制”的开放性问题,从“AI问责机制”期望达到的成果、现有的机制及可借鉴的政策、问责的主体及认定、需要承担哪些责任、目前实现“AI问责”的阻碍、政府政策在“AI问责”生态中的角色六个方面向社会各界征求意见。

  南财点评:事实上,近期已有多国监管部门表示密切关注 ChatGPT 的引发的数据安全问题。在监管层面,可以灵活运用算法风险分级、算法影响评估、算法审计、算法认证等治理方法和监管沙箱等制度工具,在产品落地阶段,则可以考虑灰度测试和A/B test,通过小范围、渐进的测试逐渐优化产品的数据安全保护机制。未来,也可以考虑将以Open AI为代表的人工智能公司纳入治理体系,同监管机关合作开发与技术发展和市场竞争相适应的监管框架。

  2、微软开源“Deep Speed Chat”

  4月12日,微软宣布开源了“Deep Speed Chat”,帮助用户轻松训练类“ChatGPT”等大语言模型。据悉,“Deep Speed Chat”是基于微软“Deep Speed”深度学习优化库开发而成,具备训练、强化推理等功能,还使用了RLHF(人工反馈机制的强化学习)技术,可将训练速度提升15倍以上,成本却大幅度降低。简单来说,用户通过“Deep Speed Chat”提供的“傻瓜式”操作,能以最短的时间、最高效的成本训练类“ChatGPT”大语言模型,这标志着一个人手一个“ChatGPT”的时代要来了。

  3、日本政府或引入“ChatGPT”

  4月11日,日本政府考虑在行政领域将OpenAI的“ChatGPT”加以利用,期待其能在文件制作等业务中发挥作用以减轻职员的负担。经济产业相西村康稔指出,为减轻国家公务员的业务负担,将谋求运用的可能性。但同时他表示,确保著作权及网络安全也是重要课题,由于机器生成错误等问题,很难很快在政府工作中引入“ChatGPT”。日本政府对该软件收集数据不妥当等存在强烈警惕,引进的前提是必须消除这种担忧。

  4、环球音乐集团敦促 Spotify 和苹果等流媒体平台打击 AI 生成音乐

  4月13日,环球音乐集团已告知包括 Spotify 和苹果在内的流媒体平台,应防止人工智能服务从其受版权保护的歌曲中抓取旋律和歌词。环球音乐集团控制着全球音乐市场的三分之一,该集团越来越担心人工智能机器人利用它们的歌曲来自我训练,以制造出听起来像流行歌手的音乐。需要注意的是,当前已经存在“PluggingAI”、“MusicLM”等可通过 AI 生成音乐的大数据模型,其可以从文本描述中生成任何类型的高保真音乐。

(文章来源:21世纪经济报道)


华为阿里版ChatGPT横空出世,谁的成效更好呢?

华为 阿里,华为17 阿里p8,阿里vmate,华为阿里云

“你训练的大模型涌现了吗?”“还没有。好难受。”一时间成为了最近AI赛道玩家的一个爆热梗。

不管承不承认,相信每个玩家都不愿意输掉这场激烈的竞争。自百度成为国内“第一个吃螃蟹的人”后,又有两大中国科技巨头做好了准备――华为和阿里巴巴各自新研发的“大模型”、“ChatGPT”,也都即将于近日问世。

首先是华为的盘古大模型新版本即将亮相的消息!据称,4月8日,华为云人工智能首席科学家田奇,将在杭州人工智能大模型技术高峰论坛上,通过一场技术分享介绍“盘古大模型的进展及其应用”。

与此同时,一封来自阿里的会议邀请函也给业内带来了很有分量的消息:在4月11日的阿里云峰会上,将正式推出阿里最新自研的大模型,模型内测目前已在进行中,且接下来还会有各类行业应用类模型问世。就在今天中午,通义大模型已经官宣开始企业邀测! 如果说之前巨头们从“大炼模型”到“炼大模型”是在秀肌肉、打地基,那么这次发布模型的意义,则更多的在于入局类ChatGPT产品赛道!

事实上,华为自2020年便启动了AI大模型布局。据相关资料显示,盘古NLP大模型采用深度学习和自然语言处理技术,采用了大量中文语料库进行训练,基于“预训练+下游微调”的工业化AI开发模式,拥有超千亿参数,并支持多种自然语言处理任务,包括文本生成、文本分类、系统问答等。

1.华为版ChatGPT:接近GPT3.5水平,注重中文优化 根据华为云官方显示,华为即将上线的“盘古系列AI大模型”分别为NLP大模型(对标ChatGPT)、CV大模型、多模态大模型与科学计算大模型。据介绍,其中NLP大模型在预训练阶段学习了超40TB中文文本数据;CV大模型首次实现兼顾图像判别与生成能力;而科学计算大模型则可应用于气象、生物医药等领域。 与ChatGPT相比,盘古NLP大模型在数据方面更接近GPT3.5的水平,但其更加注重中文语言优化,在中文语法语义理解上有着更大优势,并且其拥有泛化能力强、小样本学习和模型高精度三大特性,可适用大量复杂的行业场景,即使少量样本也能达到高精度。

根据华为官方介绍,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录,总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平 (85.61)的预训练模型之一。

2.华为的三个独特优势 在大模型研发方面,华为相比于其他国内企业有着一项较为独特的优势――拥有完整的产业链和较强的算力匹配能力。据介绍,盘古系列大模型都是基于华为Model Arts所构建的,并由在2022年蝉联全球人工智能算力第一的鹏城云脑二期提供算力底座。在训练盘古大模型时,华为团队调用了超过2000块N腾910芯片,进行了超过2个月的训练。

产业生态层面,华为则延续了自己重B端的企业基因,大模型产业化的初衷正是在于开辟更多B端业务场景,正如华为云人工智能首席科学家田奇所言,“将工业化的一面放置在更高的优先级上”。此外,盘古大模型还融入了华为在5G、云计算、物联网等领域的技术优势,可应用于智能客服、机器翻译、语音识别等多个领域,为企业提供智能化服务。

据中信建投研究报告显示,目前盘古预训练大模型能力已在包括能源、零售、金融、工业等领域得到验证。同时盘古NLP大模型通过迁移学习实现少样本学习目标,并采用了分布式计算技术,可以实现模型的在线训练和增量学习,随着数据量的增加不断优化模型,提高模型的准确度和质量,使其更加适合复杂的商用场景,在部分应用中的表现已超过GPT-3.5。

再来看阿里这边,无独有偶,阿里的中文大模型研发之路也始于2020年左右。2021年,阿里先后发布国内首个超百亿参数的多模态大模型“通义-M6”以及号称“中文版GPT-3”的语言模型PLUG。虽然参数量仅为270亿,但PLUG与GPT-3一样拥有强大的文本生成能力。

1.通义大模型融合升级 据报道显示,即将发布的阿里达摩院版ChatGPT,正是基于通义大模型体系融合升级而成。通义大模型底座基于统一学习范式OFA等底层技术打造,在不引入新增结构的情况下即可同时处理文生文、文生图、图片描述、内容摘要等多项单模态和多模态任务。经历升级后,更是可以处理超过包括语音和动作在内的多种跨模态任务。

其中“通义-M6”主要解决文本图像生成构建的相关任务,包括图文理解、图文生成、语音理解、语音生成,且阿里2021年发布的模型版本已达千亿参数;而通义-AliceMind则为NLP预训练模型,应用场景包括文生文、文本理解、问答对话等;通义-视觉应用场景则涵盖视频表征、图像检测、视频编辑等。

2.阿里内部爆料 在此前一份有关阿里大模型的采访中,阿里内部人员表示:阿里在大模型方面可以提供的方案主要有两种,一是阿里内部推出的模型效果相对较好,可以与集团内部广泛的C端产品进行结合,例如天猫、淘宝和高德地图的搜索业务,这将为搜索引擎带来全新的商业模式,也将为阿里本就蓬勃的C端业务注入更多活力,而C端的数据积累,也将很好地反哺阿里大模型及相关应用的研发。此外,阿里还可以输出自己的API,并向合作伙伴或渠道商收费。对于API,可能会在特定领域上对合作伙伴有所帮助,例如电商、搜索推荐等。

而在算力方面,阿里云在云上至少有上万片A100,整体至少能够达到10万片,集团的话应该会是阿里云5倍的量级。达摩院、天猫、淘宝的算力资源都是集团内资源使用。由于大模型及衍生应用研发等需求,阿里云今年增速会达到30-50%,个别客户会有复现GPT的需求,提出大规模AI算力需求,阿里将以云的方式进行支持。

除此之外,还有爆料显示,阿里即将推出的类ChatGPT对话机器人产品还可能将与钉钉生产力工具进行结合,后续也得到阿里巴巴方面确认。

3.B站博主测评:结果喜人 更值得注意的是,就在近几天,有B站博主测试了阿里的天猫精灵,发现其已经上线了阿里版ChatGPT的语音助手。对此阿里也进行了回应,表示目前天猫精灵所整合的是大模型技术Demo,“天猫精灵和达摩院一直在紧密合作,其中包括推进大语言模型、声学模型、语音AI等综合应用”。 在B站博主所发布的测评视频中,博主与集成Demo版大模型的天猫精灵进行了超过3分钟的15轮问答对话,其中10问题的回复都明显优于国内已公布的同类型产品。且在了解到用户订餐需求后,天猫精灵同意了用户请求并表示已帮助用户完成了订餐。虽然由于并为集成相应接口,Demo版天猫精灵并没有如它所言完成任务,但相信在正式版发布后,诸如订餐、打车、购票等功能均可能得到实现。

那么,业内专家对于阿里和华为即将发布的大模型又有哪些评价和看法呢?为此,51CTO采访到了人工智能技术专家、前智源研究院政务创新中心技术负责人刘占亮老师。

据刘占亮分析,华为在该方面的最主要优势是:华为在toB领域的长期积累使其拥有着非常扎实的产业生态,而华为在人工智能方面的全栈布局将有助于企业在各领域、各不同业务中的长期发展。但从短期角度来看,华为大模型的商业化进展将有可能会受到底层基础设施成熟度的影响。

对于阿里而言,其拥有着覆盖多个行业的生态体系,大量C端以及B端的数据积累将为阿里大模型研发提供非常重要的动力,而在算力方面,阿里相比于大部分科技企业而言也有着巨大的优势。在数据和算力优势的加持之下,阿里在大模型研发及生产应用方面的效率应该能够达到较高水平。

虽然从应用领域与目标用户的角度来看,华为和阿里两家企业可能会有所不同。但归根结底,两家公司都有潜力推动中国人工智能领域发展。

但在此之前,刘占亮还指出,摆在这两位巨头眼前的还有三大主要挑战,其一是需要应对国内外激烈的市场竞争;其二是需要对潜在的政治风险做到0失误的精准控制;其三则是老生常谈的技术挑战,无论华为还是阿里,在自身业务层面都有着非常丰富的经验积累,那么其所研发的大模型及一系列衍生产品能否在实际生产中发挥更高的效率,这考验的便是企业对于特定领域技术的应用与理解。

近期以来,ChatGPT陷入了一些列纷争之中,由于非法收集用户数据的原因,意大利已进行了对ChatGPT的全面禁封,德国也出于对数据保护的考虑,正在计划在全国范围内禁止ChatGPT的使用。而在不久前,ChatGPT也针对亚洲地区进行了一次悄无声息的大规模封号。就以上事件看来,依靠ChatGPT,微软与OpenAI已经成为事实上的头号玩家,而这对于国内企业类似产品的发展而言,不管是封禁还是封号,都并不是一个良好的势头。

诚然,由于中文天然的复杂性,实现中文版ChatGPT的难度将会变得更大,但国内科技企业能够在这一时期,利用自身优势研发针对不同业务场景的同类型模型及应用,无论是出于对自身利益的考量还是出于对更高理想的追求,这本身都是一件值得鼓励的事情。人工智能的发展在带来科技革命的同时,也注定会带来同一赛道上的百家争鸣,不管是企业层面,还是全球层面,都避无可避。

如今,ChatGPT成为下一代操作系统的“叙事”刚刚开始,其所带来的强大的生产力提升必将赋能千行百业,并带来巨大的商业机会。在这样的情况下,自主可控与合理监管才是每个国家、每家科技企业甚至每位技术从业者应该关注与思考的问题。

虽然就目前而言,无论百度、华为、阿里还是其他正在深耕该领域的科技企业,都暂时无法推出能与GPT-4一较高下的AI大模型。但有时后发未必一定是坏事,让我们给予它们一些信心与时间,相信在这些企业与技术从业者的不断努力下,国内AIGC生态建设自主化的步伐将能够越走越快。