庆云古诗词

庆云古诗词

open ai接入产品 openai落地应用

互联资讯 0

淘宝搜:【红包到手500】领超级红包,京东搜:【红包到手500】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】


  人工智能领域应用生态日趋丰富。近日通用型人工智能巨头OpenAI连放大招,在美国地区推出了聊天机器人ChatGPT的iPhone应用,迅速问鼎免费APP排行榜,正式扣响移动互联网应用端AI产品的“发令枪”。OpenAI也进一步推出了网络浏览和70多个第三方插件,业内人士预计,此举将加速GPT大模型在垂直行业应用。

  另一方面,人工智能应用急速推广引发隐私安全等担忧,相关监管需要随之升级,网络信息安全企业也在探索安全使用AI的大模型。

  移动端争霸赛正式打响

  在美国当地时间5月18日,人工智能研究公司OpenAI宣布在美国推出ChatGPT的手机客户端(iOS版),ChatGPT APP作为“OpenAI的官方应用程序”,可提供即时答案、量身定制的建议、创意灵感、专业信息等,帮助用户提高工作和学习效率。

  最新排行显示,ChatGPT APP已经在5月19日跃升美国地区iOS APP Store(应用程序商店)排行榜首位,超过海外版拼多多Temu。数据显示,OpenAI网站的月度用户访问次数约18亿次。

  “ChatGPT是第一件可持续的AIGC(人工智能生成内容)产品”,清华大学新闻学院元宇宙文化实验室主任沈阳今年2月接受证券时报记者采访时表示,今年人工智能市场格局将迎来巨变。对比全球用户最多的Facebook用户积累时长,ChatGPT用户积累速度之快令人震惊,已经成为史上用户增长速度最快的消费级应用程序。

  谷歌也不愿落后,继续反击ChatGPT。在谷歌2023年I/O大会上发布PaLM 2大模型,渗透谷歌全线产品,与微软人工智能辅助工具Copilot全面竞争。

  国内厂商已经相继发布各自大模型产品,但在应用程序端尚待跟进。作为国内首家宣布发布类ChatGPT产品的百度,4月就推出了内测专用版的文心一言App,可使用语音回答用户的问题以及查看历史对话;阿里推出了国内第二款类ChatGPT产品“通义千问”,但模型的API(应用程序编程接口)尚未公开;网易、商汤、科大讯飞等都已经发布自己的大模型产品,尚未有APP方面的进展。

  AI大模型迈向场景落地

  作为本轮通用型人工智能技术“领头羊”,OpenAI除了率先发布移动端应用程序,最近还向ChatGPT Plus付费用户开放Web Browsing(网页浏览)和Plugins(插件系统)功能。分析人士指出,此举将快速开启GPT大模型在垂直领域的应用,加速行业应用。

  今年3月,OpenAI表示,在ChatGPT中实现了对插件的初步支持,包括2个官方插件和11个第三方插件,涵盖在线购物、旅行服务、语言学习、自动化等多个领域。目前ChatGPT插件更新至70多个,新增网页生成、菜谱生成、流程图生成等插件,ChatGPT应用生态将持续扩大。

  根据OpenAI官方说明,ChatGPT引入新功能将会分阶段进行,从Alpha阶段向小部分用户收集反馈,到Beta阶段面向ChatGPT Plus订阅者评估新功能性能、稳定性、用户体验,最后到通用阶段,满足质量标准之后将会向所有用户开放。而ChatGPT插件是专门设计用于扩展ChatGPT功能的互联网连接工具。插件功能相当于给ChatGPT配备了一套工具箱,将更大范围地扩展其理解力、集成性和实用性。

  对于OpenAI扩大插件等功能应用,广发证券刘雪峰团队最新研究指出,OpenAI向ChatGPT Plus付费用户开放网页浏览和插件系统功能,使得GPT大模型在各垂直场景的应用更加深入。此次两大功能的推出使得GPT-4交互信息实时性和安全性得到有效增强,并通过第三方知识库加速其在各垂直领域的渗透,最终将使得GPT-4成为超级入口的可能性大大增加。

  国内厂商也在聚焦人工智能大模型的场景落地。

  不久前,科大讯飞召开星火认知大模型成果发布会,展示了教育、办公、汽车、数字员工四大行业应用成果,以及向医疗、城市、政法、工业等更多行业赋能情况。目前讯飞开放平台已经开放了560项AI能力,并聚集了超过500万生态合作伙伴。

  科大讯飞董事长刘庆峰表示,通用人工智能不仅带来了内容的生产和分发方式的全新变化,人机交互的根本性变革,也会给科研、办公、工业、互联网带来全新的机遇。他预测,传统的靠堆时长和人力的商业模式,在未来两三年之内将被彻底改变。

  腾讯CEO马化腾日前也在股东大会上表示,人工智能是几百年不遇的、类似发明电的工业革命一样的机遇;互联网企业在AI 领域都有很多积累,腾讯也一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示;关键还是要把底层的算法、算力和数据扎扎实实做好,而且更关键的是场景落地。

  人工智能监管升级

  随着通用型人工智能向用户端和行业加速渗透,相关隐私保护担忧和安全监管等议题逐步升温。

  由于ChatGPT本身在使用训练数据的来源以及隐私泄露等问题一直备受争议,不少大型企业都出台相关政策要求员工不要使用ChatGPT。苹果已经连续数月禁止员工使用ChatGPT和Copilot,此前亚马逊摩根大通等也限制员工使用ChatGPT,中国支付清算协会倡议支付行业人员谨慎使用ChatGPT等工具。

  全球监管持续行动。3月,意大利数据保护局宣布禁止ChatGPT,加拿大已经调查OpenAI,称该公司涉嫌“未经同意收集、使用和披露个人信息”。去年,国家互联网信息办公室等三部门发布《互联网信息服务深度合成管理规定》;今年4月,国家互联网信息办公室起草了《生成式人工智能服务管理办法(征求意见稿)》,对人工智能生成内容、主体责任、训练数据和数据处理等方面作出进一步规定,保障生成式人工智能技术的合规性和安全性。

  OpenAI首席执行官Sam Altman在5月16日出席美国国会听证会时表示,面对日益强大的AI模型,政府监管机构的干预对于控制相关风险来说至关重要。纽约大学心理学和神经科学名誉教授Gary Marcus甚至提议,应该像对待原子弹一样,成立一个类似国际原子能机构的国际组织,以应对人工智能的风险。

  在此背景下,网络安全企业在持续探索人工智能大模型的赋能与风险管理。

  5月18日,深信服发布自研安全大模型(Security GPT),由“大模型算法+威胁情报+安全知识”训练而成,助力安全运营提质增效。

  另外,网络安全头部企业安恒信息董事长范渊日前接受媒体采访时表示,ChatGPT的发展带来了两个挑战,一方面现在自动化生产工具、工控平台等很容易被病毒攻击,如何快速发现,快速地智能化防护很重要;另一方面,ChatGPT本身会伴随大量的数据,容易出现安全漏洞。

  范渊表示,在数字时代,最缺的是“信任”。可控的、可信的数字安全,是构建数字经济的重要数据基础设施。

(文章来源:证券时报)



OpenAI开放ChatGPT联网插件,App上架iOS;谷歌发布Bard API和ColabAI|Daily Summary

openai开放插件,OpenAI开放ChatGPT模型API,OpenAI开放ChatGPT商用API,openai开放api

OpenAI正式推出ChatGPT的iOS版本App

OpenAI 推出了适用于 iOS 的 ChatGPT 应用程序。ChatGPT 应用程序可免费使用并跨设备同步你的历史记录,它还集成了OpenAI 的开源语音识别系统Whisper ,支持语音输入。ChatGPT Plus 订阅者可以独家访问GPT-4 的功能、提前访问功能和更快的响应时间,所有这些都在 iOS 上。

谷歌推出Colab AI

使用Codey,一系列构建在PaLM 2上的代码模型,Colab将很快添加AI编码功能,例如代码补全、自然语言生成代码和代码辅助聊天机器人。此外,用于驱动Colab的Codey版本还特别定制了Python和Colab特定的用途。

谷歌宣布 AI 药物发现工具

谷歌云介绍了增强了 AI 功能的新医疗研究产品。主要提供包括医疗自然语言API,用于从非结构化文本中提取医学信息,以及面向医疗保健的自动化机器学习实体提取。这些工具将简化从复杂医疗数据中获取洞见的过程,有可能实现更精确和及时的患者护理。

谷歌 AI 广告

谷歌已批准几个与广告相关的 AI 项目,以帮助广告商和YouTube创作者,内部文件显示。

亚马逊推出新的 AI 设备

亚马逊推出了更新的Echo设备系列,并承诺将ChatGPT式的 AI 引入基于Alexa的设备。

Stability AI发布StableStudio

Stability AI宣布推出StableStudio,这是其DreamStudio AI文本到图像网络应用程序的新开源变体。

移动端 AI 竞赛打响

虽然许多科技公司都在努力将 AI 添加到他们的移动设备中,但高昂的计算成本仍然是一个重要的障碍。这篇文章探讨了这个问题,并提出了一些解决方案来应对这个挑战。

Zoom将投资Anthropic

Zoom将投资Anthropic,并在一些内部和外部的AI产品中使用Claude。具体的交易细节没有公开。

Sam Altman在国会作证

OpenAI CEO Sam Altman在参议院听证会上的发言,他敦促立法者在 AI 领域进行监管,并将当前 AI 的繁荣期描述为一种潜在的“印刷机时刻”,但需要安全保障。

OpenAI 的壁垒比想象的更强

尽管谷歌最近的一份内部备忘录表明,谷歌和 OpenAI 都无法围绕大规模 AI 模型建立可持续的商业模式,但也有相反的观点。像 GPT-4 这样的高质量 AI 模型虽然看起来容易创建,但实际上是复杂而难以构建的,而 OpenAI 的独特方法,包括通过人类反馈进行强化学习和数据过滤,提供了显著的优势。此外,OpenAI 通过 ChatGPT 和 【【微信】】 的“最后一公里”交付以及强大的品牌,使公司的产品更难被击败。这些因素,再加上 OpenAI 在 B2B 和 B2C 领域快速实现产品市场适应,表明该公司在 AI 市场上的地位比备忘录所示的更具有防御性。

OpenAI准备推出新的开源AI模型

OpenAI即将推出一个新的开源语言模型。该公司不太可能发布一个与其自己的GPT竞争的模型。生成式AI的增长潜力引起了硅谷投资者的关注。微软今年早些时候对OpenAI进行了数十亿美元的投资,为与谷歌更多的竞争做好了准备。

亚马逊正在构建一种基于 AI 的“交互式对话式搜索体验”

亚马逊最近发布了一份招聘启事,描述了它如何通过新的交互式对话式体验重新构想亚马逊搜索。新的搜索将具有产品比较和个性化建议等功能。对话式购物功能的详细信息尚未正式公布。聊天机器人的发布日期尚未确定,但可能很快就会发布。

谷歌计划打击 DeepFakes

Arstechnica 报道称,谷歌正在准备对抗越来越普遍的 AI 生成虚假内容。随着深度伪造和其他形式的操纵内容变得越来越复杂,这家科技巨头正在开发新工具来识别和标记这些内容。它计划在其各个平台上实施这些措施,以确保内容的真实性,并保护用户免受错误信息的影响。谷歌的方法将涉及技术,如 AI 算法,以及用户教育。

Poe正式向所有开发人员推出 API

Poe API 允许任何人在 LLM 之上构建基于聊天的服务,轻松吸引世界各地的大量受众,而无需构建自己的用户界面。

谷歌CEO谈论搜索, AI 和与微软共舞

本文包含对Sundar的采访记录,他在采访中讨论了搜索,谷歌和【【淘密令】】 团队的重组,他对谷歌未来的愿景以及推动其增长的因素等等。

微软刚刚推出了对GitHub Copilot Chat的早期测试版访问

该Twitter帖子包含Copilot Chat的机密规则。

微软希望Firefox将Bing作为默认搜索引擎

Firefox与谷歌的合同即将到期,微软希望浏览器将Bing作为默认搜索引擎。苹果与谷歌的默认浏览器合同将于明年到期,这为微软提供了一个机会,让Bing成为Safari的默认浏览器。微软看到了这种合作伙伴关系的潜力,可以提高Bing的使用量。这些交易可能无法保证必应的使用量增加。

OpenAI 本周向ChatGPT Plus用户推出网页浏览和插件功能

OpenAI将在本周内向所有ChatGPT Plus用户推出网页浏览和插件!从alpha版本转为beta版本后,ChatGPT可以访问互联网,并使用70多个第三方插件。

Stability AI 发布 Stable Animation SDK

Stability SDK发布,允许用户使用稳定的扩散模型创建动画。您可以无条件地生成这些动画、在图像中调节或以视频为条件。结果很可爱,计算成本很高,并且具有非常独特的风格。

HuggingFace Chat 开源

HuggingFace已经开源了为HuggingChat应用程序提供支持的代码库,HuggingChat应用程序是ChatGPT的竞争对手。

Claude模型扩展至 100k Token

Anthropic的Claude模型现在可以在更长的背景下运行。这意味着您的组织可以将完整的文档放入模型中,语言模型将对其进行操作。他们举了一个例子,将 240 页的编码文档输入到 Claude 中,并让它回答编码问题。

Meta 宣布为广告商提供生成式 AI

Meta 宣布为广告商提供 AI 沙盒,帮助他们创建替代副本、通过文本提示生成背景以及为 Facebook 或 Instagram 广告裁剪图像。

PaLM 2的训练

谷歌的新大型语言模型PaLM 2使用了几乎比其2022年的前身多五倍的训练数据,使其能够执行更高级的编码、数学和创意写作任务。

ggml中的StarCoder

一个名为"React hook to run LLM in the browser"的GitHub仓库。随着WebGPU的出现,现在可以在浏览器中运行硬件加速的工作流程。这个仓库提供了一个React钩子,可以从HuggingFace CDN下载模型,编译为WASM,并运行推理。

Smol-Developer

GGML是在CPU上运行4位量化模型的框架。这意味着你可以在本地计算机上运行非常大的模型。StarCoder是最好的开源程序合成模型之一。在具有挑战性的OpenAI人工评估基准测试中表现非常出色。此拉取请求将该模型添加到GGML框架中,这意味着你可以在普通硬件上运行StarCoder。

LLM开发人员应知的数字

LLM开发人员应知的一组数字,对于粗略计算非常有用。

DarkBERT:利用专门的AI揭示暗网

DarkBERT是一种新的 AI ,专门针对暗网中使用的独特语言进行训练,该语言与常规互联网上的语言有所不同。通过与其他 AI 进行比较并研究各种应用案例,我们发现DarkBERT更擅长理解和处理暗网文本,使其成为未来在该领域进行研究的有用工具。

符号调整:通过符号标签增强AI学习

符号调整是一种新的训练 AI 的方法,其中我们用随机符号(如“foo”或“bar”)替代常规语言标签(如“正面”或“负面”),迫使 AI 从输入和标签之间的联系中学习。这种方法可以提高 AI 在新任务上的性能,帮助其更好地理解指令,并使其在逻辑推理任务上更加熟练,在不同的基准测试中都有明显的改进。

无边DAS:了解大型 AI 模型的奥秘

无边DAS是我们开发的一种新方法,通过寻找其行为中可理解的模式,更好地理解大型 AI 模型(如Alpaca)的工作原理。我们发现,无论输入或指令是什么,Alpaca都通过使用两个可理解的变量以一致的方式解决了一个简单的数字问题,这是理解这些复杂 AI 模型工作原理的重要一步。

一个Transformer块可以生成故事

文章讲述了一个有趣的研究,即使用一个Transformer块可以生成连贯、新颖且语法正确的故事。通过限制词汇表和精心构建训练数据集,这种小型模型可以达到比较好的性能。虽然目前大型模型的性能更好,但这个研究表明即使使用小型模型也可以生成高质量的文本。

提高动作识别能力:探索多模态泛化

介绍了一项新概念――多模态泛化,它关注的是系统如何在某些数据源受限或缺失的情况下进行适应。为了研究这一概念,研究人员创建了一个名为MMG-Ego4D的新数据集,并开发了新的方法来提高系统的泛化能力,这可能指导未来在这一领域的研究。

SuperICL:通过小型模型使大型AI模型更好地工作

新技术SuperICL可以通过与小型本地模型合作来帮助大型AI模型更好地学习。这种方法不仅可以提高这些大型AI模型在任务上的性能,还可以提高它们的稳定性和小型模型的能力,例如理解不同的语言和解释其决策。

?在浏览器中运行LLM的React钩子

一个名为"React hook to run LLM in the browser"的GitHub仓库。随着WebGPU的出现,现在可以在浏览器中运行硬件加速的工作流程。这个仓库提供了一个React钩子,可以从HuggingFace CDN下载模型,编译为WASM,并运行推理。

Guidance (GitHub Repo)

Guidance是一个GitHub仓库,能够比传统的提示或链接更有效地控制现代语言模型。在这个仓库中,你可以找到用于快速设置和运行Guidance的示例和文档,并可以使用它来创建更好的预测和生成更优质的文本。

Transformers库上的第一个RNN

RWKV模型,这是一个具有内置循环的线性注意模型,是一个快速运行的强大语言模型,可以理论上具有长上下文窗口。这个模型是基于Transformers库的第一个RNN模型。该模型的开发团队有一个活跃的discord社区,现在在HuggingFace平台上更加可见。

认识OpenAI的“红队”

OpenAI 利用一个多样化的人员组合,称为“红队”,对 GPT-4 进行“对抗性测试”。

Megabyte百万字节序列

Transformer 并非真正的端到端模型。分词器有单独的训练过程,这很奇怪,通常会导致一般性能不佳。然而,如果我们尝试在字节上进行简单的训练,由于序列长度的增加,很快就会耗尽上下文长度。此外,对于真正的多模态问题,直接在字节上进行训练会移除复杂的补丁和标记化方案。这项工作允许模型直接在字节上进行训练,并支持长度达到一百万字节的序列。也许这甚至会对稀有单词的核心采样有所帮助!

通过添加激活向量来控制 GPT-2-X?

?AI 安全的一个目标是可扩展的监督,希望发现在不需要昂贵的人类干预的情况下引导语言模型生成的方法。本文中的所有想法并不新颖,回顾了软提示的概念,但是这是一个有趣的扩展。他们发现,通过为简单的想法添加激活向量,可以将生成引导到这些想法。

?视频问答

视觉问答在过去几个月中得到了广泛的采用和快速的发展。这在很大程度上得益于预训练模型,如 Blip 和 clip。应用这些模型到视频中具有挑战性,因为计算要求大大增加。这项工作介绍了一系列不同的模型,通过在不同的时间尺度上运行,显著提高了这些系统的鲁棒性。他们使用 Blip2,并获得了强大的性能表现。

从激光数据中增强 3D 场景重建和真实性

NFL 是一种利用 LiDAR 数据(一种使用激光测量距离的方法)并从新视点创建逼真的 3D 场景的新方法。这种技术比其他方法更好,可以帮助改善诸如地图制作和理解我们周围环境等任务。

EfficientViT: 级联分组注意力的内存高效视觉 Transformer

EfficientViT,它将快速处理与改进的准确性相结合。通过重新设计 Transformer 模型的某些部分,他们能够显著减少与数据重塑和执行逐元素函数相关的计算成本。实验表明,EfficientViT 胜过其他高效的模型,在保持卓越的处理速度的同时实现更高的准确性,甚至超过了 MobileNetV3。

Meta的 ImageBind深入分析

这篇 Medium 文章提供了对 Meta 的 AI 模型 ImageBind 的深入分析。ImageBind 是一个多模态 AI 模型,可以从文本描述中生成图像,反之亦然。它是在各种各样的互联网文本和图像上进行训练的。虽然 ImageBind 的准确性和多功能性受到称赞,但文章也承认该模型偶尔会产生无关或不准确的结果。

未经审查的模型

Eric Hartford 的博客文章探讨了未经审查的 AI 模型的影响,并认为 AI 审查可能会让我们走上一条危险的道路。他主张开发更好的系统来管理输出,而不是压制它们。他提到需要更多的研究和对 AI 使用伦理问题的对话,并提出了一个多利益相关者治理模型的想法。

Salesforce的InstructBLIP

通用视觉语言模型Blip是由Salesforce开发的一个模型,可用于视觉和语言任务。按照语言模型中调整它们以遵循指令的工作线,我们还可以调整这些视觉语言模型以遵循指令。这极大地提高了性能,在这种情况下,它甚至超过了 GPT-4 的已发布数量。

谷歌推出Codey

本文讨论了谷歌引入一种新的生成式AI模型Codey,旨在帮助程序员编写代码。Codey 是一种代码生成模型,可以为用户提供建议、识别错误,甚至完成整个代码块。它旨在通过帮助用户快速有效地找到解决方案来简化编码过程并提高开发人员的工作效率。

?AI 扩展的第一原则

缩放定律表明,随着更多数据和计算能力的增加,大型语言模型(LLM)在预测单词方面将变得更好。但是,虽然增加数据集大小可能是可行的,但要使它们比当前状态大 10 倍以上,则存在潜在的障碍,例如成本。使用现有技术将LLM扩展到最大潜力的成本将远远高于地球的GDP。可能存在计算限制。由于用于拟合模型的数据和计算量很少,当前的缩放定律可能不准确。

关于解释Prompt injection的资料

全面介绍快速注入,这是 AI 领域使用的一个术语,用于描述故意将特定输入插入 AI 模型以获得所需输出的做法,包括为什么这是一个重要问题以及为什么许多提出的解决方案不会有效。

利用先验知识提高图像质量

已经创建了一种新技术,该技术使用预设的文本到图像模型来提高模糊图像的质量。该方法巧妙地使用了专用编码器,无需更改现有的图像制作模型,节省了训练时间。此外,用户可以通过简单的调整来控制图像质量。该策略还比以前的方法更好地处理较大的图像。人工和真实世界图像的测试证明它比当前的解决方案更有效。

通过推理进行检测

检测场景中的对象时,通常从一组预定义的类中提取。此外,询问有关场景的问题也具有挑战性。在这种情况下,我们可以使用强大的语言模型(Vicuna)和指令调谐的检测器来推理查询并因此检测对象。

使用 Jax 分片映射轻松并行

现代 ML 需要跨许多硬件加速器(如 GPU)进行计算。在代码中做到这一点是很棘手的。Jax在许多实验性功能方面一直处于领先地位。Shmap是一系列创新中的另一项。它功能强大,可以轻松实施现代算法和可扩展的训练。

语言链中的新检索框架

语言模型使用检索来获取最新信息或不适合上下文的信息。这种前瞻性检索使用谷歌搜索API和来自【【微信】】的大型语言模型来构建强大的检索问答系统。

Cohere LLM 大学

Cohere是一家初创公司,提供类似于其他大玩家的语言模型API,它们具有一组可用于构建应用程序的强大模型。这所语言模型大学旨在让您快速了解现代语言模型,并展示如何使用 Cohere 的工具构建它们。

使用 AI 和草图创建更好的视频内容

本文介绍了一种基于草图和文本使用 AI ?(AI) 制作视频内容的新方法。该方法结合了两种称为文本到视频零点和ControlNet的技术,可以创建高质量,一致的视频,与用户的意图非常匹配,正如各种实验所证明的那样。

基于扩散的单张图像的3D面部重建

本文介绍了一种使用扩散模型的方法,该方法已成功创建图像,仅从一张图像重建3D面部特征。该过程涉及使用面部纹理数据集,模拟各种照明条件,然后使用扩散模型填充纹理的缺失部分和未知的反射属性,从而产生更准确和一致的3D面部。

深入了解文本到3D:生成AI的新前沿

本文是对新兴的文本转3D领域的全面调查,该领域是将书面描述转换为3D模型的生成AI的一部分。它介绍了不同类型的3D数据,基础技术,以及它们在最近的作品中的组合方式,以及如何在各种应用程序中使用文本到3D,例如创建头像和生成场景。

【【微信】】:更好地理解视频的新系统

【【微信】】,这是一个通过结合 AI 技术来理解视频和语言来理解视频的系统。研究人员还创建了大量带有详细描述和对话的视频,以帮助训练系统更好地理解视频中的事件顺序和因果关系。

Flowise

拖放UI以使用LangchainJS构建自定义的LLM流。

Dexa

提出问题、搜索主题,并即时获得你最喜爱的播客的答案。

Vimcal

你的超强日历刚刚发布。

Alpha

由GPT-4驱动的新型投资副驾驶。

AdAgency

用于打造有影响力的广告活动的自助工具。

Metaphor Systems

Metaphor Systems是目前唯一一个由语言模型完全驱动的互联网规模神经搜索引擎。这个集成允许你使用该系统作为Langchain模型的检索后端,从而提高模型的搜索效率和精度。

Nexus