本周内容概述
Bard 2023 年七月更新
Claude 2 正式推出
LangChain 的问题
马斯克成立人工智能公司 xAI 以「理解宇宙」
与美联社合作的同时,OpenAI 被 FTC 开启关于不实信息的调查
WAIC 与 生成式人工智能服务管理办法
“一刀切的人工智能监管方法没有任何意义”
01
Bard 2023年七月更新
上周大事之一,就是 Bard 23.07.13 的这一轮更新,终于支持了中文对话,也增加了不少能力。除了对话记录、语言支持、对话分享等 UX 方面的更新以外,有不少用户发现 Bard 甚至能够识别 UI 效果图并返回代码。
这在更新说明里用短短一句“基于 Google Lens 实现了图像识别”,却是所有对话机器人服务中最早实现这个能力的。做出过类似承诺的 OpenAI 还刚修补好中断了一整天的代码解释器服务,识别图片写代码这事估计还得等一会儿。
具体更新内容如下:
支持超过 40 种语言,包括阿拉伯语、中文
开放访问至所有 27 个欧盟国家以及巴西
基于 Google Lens 的图像识别(仅支持英文 prompt,会过滤人像
支持使用 40 余种语言朗读生成的文本(中文只有女声
页面左侧增加对话记录,支持置顶、重命名(终于!
支持分享单段对话或整个对话(点开看看g.co
支持 5 种方式重新生成文本,更长/短、更简单/休闲/专业(很方便
将生成的 Python 代码导出至 Replit
02
Claude 2 正式推出
上周第二件大事,Anthropic 正式推出 Claude 2 模型,并同时开启了 claude.ai 网页版对话服务,很大程度上改善了 Claude 模型叫好不叫座的局面,同时大家也发现 Claude 这个常规 100k 最大支持到 200k 的上下文对话长度实在是太强了。
大量用户反馈 Claude 在文档对话方面好于多数基于 GPT 模型的文档对话服务,同时在文本风格上也相对 ChatGPT 更优秀一些,最重要的是,Claude 2 训练数据更新时间是 23 年 2月,相比停留在两年前的 GPT 会显得更贴近动态。
具体更新内容如下:
提高了编码、数学和推理方面的性能
能够生成更长的回应
新增网页版(英美地区可用,100k 上下文,支持上传文本附件)
更少的有害信息,更难以被提示注入越狱
API 价格与 Claude 1.3 相同
03
LangChain 的问题
上周一场从 Reddit 到 Hacker News 的讨论让人们重新审视关于 LangChain 的问题,多数开发者表达了对 LangChain 的负面看法,比如引入了不必要的抽象和复杂性,许多代码不如直接使用 Python 或是调用 API,并且也存在开发文档质量低、调试困难等问题。
有的开发人员表示自己已经不再使用 LangChain 而是另外重新实现所有调用,这对于将大语言模型融入已有项目中更有优势。
也有另一些开发者认为 LangChain 是学习了解基于 LLM 应用开发的良好途径,帮助许多人完成了大语言模型的调用,构建出可用的应用。
我认为后一种观点更中肯一些。当前来看,LangChain 是那个不算太好,但也很难忽略的框架。更熟悉 LLM 应用开发的人或许站在更远(或者更高)一些的位置回看会有别的见解,但你很难说这对完全不熟悉 LLM 的人进行相关研发工作是个差的选择。
🗞️ 其他资讯
马斯克成立人工智能公司 xAI 以「理解宇宙」
马斯克在接收采访时表示,xAI 将寻求建立一个「好的 AGI」。在此之前,马斯克指责 OpenAI 和谷歌等公司在发展人工智能技术时并未考虑人类所面临的风险。看上去当你认为其他人没有做好某件事情的时候,自己动手是最符合逻辑的做法。官网,新闻,推
美联社与 OpenAI 合作
在一份两年的协议中,OpenAI 将获得美联社文本资料以训练其人工智能算法,美联社将获得OpenAI 的技术和产品专业知识,这是自生成式人工智能技术掀起热潮以来人工智能公司与主要媒体公司达成的首个合作。新闻
FTC 开始调查 OpenAI
美国联邦贸易委员会正在调查 OpenAI 可能违反消费者保护法的行为,包括了从如何获取用于训练大语言模型的数据,到 ChatGPT“生成关于真实个人的虚假、误导或贬低陈述的能力”。OpenAI CEO Sam Altman 对此表示「非常失望」,但也确认将配合 FTC 的调查。新闻,推
WAIC 与 生成式人工智能服务管理办法
上上个周末结束的世界人工智能大会 WAIC 上,包括阿里通义、百度文心,华为盘古、讯飞星火、商汤日日新、京东言犀等多款自研大模型亮相,平台化、政企化 和 toB 服务是大多数模型带来的共性。即将于8月15日施行《生成式人工智能服务管理办法》相对 4 月份的《征求意见稿》更鼓励企业和应用开发者探索业务场景,国内厂商在模型商业化方面选择「弱化」to C 市场的场景可能有所变化。WAIC,**管理暂行办法全文**
商业公司正在提高人工智能支出预算
toB 确实是已经验证的业务与市场。根据 CNBC 与 Omdia 的调查,63% 的科技高管表示将在未来一年内提高人工智能方面的支持,同时有 42% 的受调查企业已经设定了至少100万美元的人工智能预算。一个值得注意的事情是,亚洲地区企业对于人工智能投入的积极性相对欧洲和美国更高,这也可能与区域监管的传统和趋势相关。新闻,CNBC,Omdia
“一刀切的人工智能监管方法没有任何意义”
Mike Masnick 在他的一篇文章中提到,欧盟正在商议中的 AI 法案,中所提出的监管要求是「官僚式解决方案」,听起来好像在说什么,但实际上什么也没说。而在美国,OpenAI 这样的企业正在游说国会以建立监管护城河,这些都可能对 AI 行业创新产生损害。文章
距离我们看到 AI 演员的演出还有多远?
SAG-AFTRA(电影演员工会-美国电视和广播艺术家联合会)的首席谈判代表邓肯·克拉布特里-爱尔兰透露了好莱坞电影公司的一项提议:电影公司希望扫描演员的影像并拥有能够在之后其它项目上无需经过同意、给予补偿地使用这些形象及生成影像的权利。但 AMPTP(电影电视制作人联盟)的发言人斯科特·罗反对了此说法,表示这些使用是有限制的,并需要与演员协商并支付费用。这段像是黑镜剧本的争论代表了一种人们对于被人工智能所取代的担忧。新闻
Replit 发布《人工智能发展现状》
Replit 对平台上 AI 项目做的概述。平台已有约 30 万个 AI 项目,一半以上在 23 年第二季度创建,环比增长约 80%,同比增长 34 倍。其中超过 80% 的项目使用了 OpenAI 的 GPT 模型。此外,也有大量项目应用了 LangChain。Blog
🛠️ 产品与工具
Meta 宣布新模型 CM3leon,支持使用给定图像和文本提示进行图片编辑。
漫画图片翻译器,支持日语,汉语、英文和韩语的漫画图片文本翻译项目
Stability AI 推出了能够基于草图生成图像的画图服务 Stable Doodle
Giotto,一个可以根据输入文本生成和修改图片的画图服务
Perplexity AI 发布 Chrome 搜索地址栏插件,用户能够从地址栏直接获得
Relume sitemap,Relume 推出了一个文本提示生成站点地图的工具
beehiiv AI,通讯服务 beehiiv 推出包含写作助手、文本与图像生成和翻译服务的 AI 套件
Knit,可协作的 Prompt 调试工具,支持调试带函数调用的提示
🎓 课程,讲座与论文
Large Language Models: Application through Production,databrikcs 与 edX 合作课程,使用流行框架构建以 LLM 为中心的应用程序,内容包含Embeddings,矢量数据库,多阶段推理、微调与评估等内容。
DIALGEN:人机循环半自动对话生成框架,基于 ChatGPT 并遵循架构和样式规范来生成流畅的对话文本,并通过迭代子对话来生成复杂对话,以及借助人类反馈去纠正差异。(摘要)
Zero-1-to-3:使用单张RGB图像即可生成支持改变物体视角的框架,具备很强的零样本能力,可以支持不同的数据集或图像来支持生成 3D 重建。(摘要)
☝🏼 指南与最佳实践
Function Calling support to Claude 2.0, 使用 Claude 调用函数/构建代理。 链接
聊聊 AI 工具产品实践背后的故事。链接
《压缩即泛化,泛化即智能》讨论了为什么GPT可以看作是对训练数据的无损压缩算法,并因此实现了对数据集之外数据的最佳泛化,体现出更高的智能水平。链接
上周非常火的 Stable Diffusion+ ControlNet文字融合图像生成教程。链接
B站零基础学会 Stable Diffusion 系列教程。链接
NLP with PyTorch: A Comprehensive Guide。链接
💡 Mist.
多模态模型的一种误解。
有人效仿 Paypal Mafia 整了一份“The OpenAI Mafia”名单,能够看到包括 xAI、Anthropic、Adept、Covariant 等不同领域和方向的人工智能公司中,都有不少从 OpenAI 出走的核心人员,许多人认为,关注这些人和公司,能够观察人工智能生态将如何重塑与发展。
🎨 Gallery
crystal diamond rise from the sand, half in the air, wind blowing around it, dust and sand storm whirling. --v 5.2 --ar 8:5
(完)