4月动态|78个AI新产品
四月下半月的 78 个 AI 新产品,都在这里了!| 全球 AI 动向周报 008
原创 f.chen 赛博禅心 2023-05-07 09:00 发表于北京
Hey,欢迎大家打开全球 AI 动向周报第八期!本期我们为大家整理了以下内容:
- **- 15 个初创企业的新产品 - **15 个来自初创公司的新产品,这次我们从「开源」和「闭源」的角度对这些产品进行了划分,其中开源产品有 8 个,闭源有 7 个 —— 很开心看到越来越多有实力的选手加入开源战斗,may the source be with you ❤️
- **- 39 个有用的和 10 个好玩的新产品 - **不要被数量吓到咯!
- **在「有用的」部分,**我们从「通用场景」及「垂直场景」对产品进行了划分,也额外单列了诸如「模型训练」、「AI 安全」、「代码学习」和「AI 代理」等关注度较高的类别;
- **而「好玩的」部分,**本次推荐的产品可谓各有特色,例如 Andrej Karpathy 本人开发的电影搜索工具,再比如梦境生成与存储器,还有迎着最近在大洋彼岸闹得沸沸扬扬的「真假 Drake 案」而上的虚拟音乐电台……
- - 14 个大公司的新产品 - 除了微软、谷歌、英伟达等熟悉的老面孔,还有苹果、Palantir 这样鲜少出现的朋友,更有来自俄罗斯的新晋玩家 Sberbank。
另外,在本次推送的次条,我们也为大家翻译整理了**「35 个真实世界中人类的 AI 使用实例」,the AI world is enormous fun ✨ **
Enjoy!
初创企业** | From Starups**
开源 | Open Source
🫅 Satbility AI 🫅Stability AI 真的是不断给予人们惊喜的初创公司—— 他们在图像生成领域已经声名鹊起,现在又在用语言模型稳固自己在 Gen AI 领域的领先地位。✍️ StableLMStableLM 是** Stability AI 自己的语言模型**,他们正在将其开源给开发人员和商业用户,他们的口号是:「透明(Transparent),可访问(Accessible),支持(Supportive)」。目前,StableLM 有 3B 到 7B 个参数,未来计划发布的模型将拥有高达 650 亿个参数,并使用 1.5 万亿个 token 进行训练 —— 如果我没搞错的话,这将是目前最大的开源语言模型,对吗?
🔗 https://github.com/stability-AI/stableLM/
🤖️ StableVicunaStableLM 发布后,Stability AI 又开源了一个名为 StableVicuna 的****聊天机器人,并称这是第一个大规模的开源 RLHF LLM 聊天机器人(AI World's First Large-scale Open Source RLHF LLM Chatbot),可以在 Hugging Face 体验。
🔗 https://huggingface.co/spaces/CarperAI/StableVicuna
🎨 DeepFloyd IFDeepFloyd IF 的发布是我们一直在等待的时刻 —— 在生成图像中渲染文本(虽然还是没有关于手指生成进步的消息)!
🔗 https://huggingface.co/spaces/DeepFloyd/IF
**🤗 Hugging Face 🤗✨ StarCoder「May the source be with you!」**如果我们呼吁开源发展,那么 Hugging Face 应该是另一个引领者 ——他们是当之无愧的社区积极推动者!在星战日(May the force be with you),HF 与 ServiceNow 合作发布了 StarCoder,完全开源的代码生成模型。

对于程序员来说,这真的非常令人兴奋,HuggingFace 甚至声称它的性能超过了用于训练 OpenAI 的 GitHub Copilot 的模型。从数据道德的角度来看,StarCoder 是在一个名为 The Stack 的开放数据集上进行训练的,该数据集具有 1900 万个完全开放的代码库和 6TB 代码 —— 但最好的一点是它可以与 VSCode 集成。
🔗 https://twitter.com/BigCodeProject/status/1654174951006404610
🦾 HuggingChatHugging Face 也没忍住加入了 Chatbot 的开发行列。**他们发布了名为 HuggingChat 的开源聊天机器人,拥有 Web 界面和 API **—— 虽然还没有达到大厂的水平,但毕竟它是免费的。来看看 HuggingChat + StarCoder 的表现 😫

🔗 https://huggingface.co/chat/
🔴 RedPajama by Together当前,开源社区与科技巨头一决高下的决心真的令人振奋,RedPajama 是 Together 最新的倡议,他们设定了大胆的目标来推动开源模型的进步,旨在通过完全开源、可重现的领先语言模型与大公司竞争,这个目标整体分为三步:
(1) 制作数据集
(2) 训练一套基础模型
(3) 实现指令调整他们宣布已经完成了第一阶段与第二阶段的一部分 —— 制作了一个用于训练类似 LLaMA 的模型的 1.2 万亿词语数据集,发布了 RedPajama 3B 与 7B 模型,并在 OpenChatKit 上实现指令调整 —— 我感觉某个大事件正在酝酿之中!
🔗 项目 - https://www.together.xyz/blog/redpajama
🔗 模型 - https://www.together.xyz/blog/redpajama-models-v1
🐙 WebLLM by OctoML & CMU类似 Chatbots 和 AI Agents 这样的东西无疑是大趋势,但也都只是我们在 AI 道路上前行的一小步,我们可以期待更多的「一小步」 —— 在我看来,让 AI 模型在本地和浏览器中运行也是其中的一步。由华人学者陈天奇领衔开发的 WebLLM 便是其中的一个优秀尝试,它让我们可以在没有服务器支持的情况下在浏览器中运行 LLM,目前选用的模型是 vicuna-7b-delta-v0。

著名开发者 Simon Willison 在自 己的博客中详细记录了自己在 M2 MacBook Pro 上使用 Chrome Canary 对 WebLLM 进行测试的全过程,对其表现称赞有加,文章较长,总结如下:
-
- Web LLM 的运行速度非常快,每秒可处理约 15 个 token,性能优于此前 Simon 在个人设备上运行过的其他模型;
-
- Simon 还通过一系列问题测试了模型的问答能力,包括事实查询、列表生成、文本摘要、生成双关语以及编写代码等,虽然有些回答存在错误,但整体表现很好;
-
尽管模型整体还存在缺陷,但 Simon 认为它已经达到了他的预期,并且可以作为各种实用工具构建模块。
🔗 Simon Willison's Blog - https://simonwillison.net/2023/Apr/16/web-llm/
🔥 Phoneix by Arize AIArize AI 推出了 Phoenix,**一个用于监控 LLM 幻觉的开源库,**也是第一个旨在帮助数据科学家将 LLMs 决策过程可视化,监视其生成内容并在出现类似虚假或误导性结果时提出修复措施的软件。Phoenix 可轻松处理非结构化文本和图像,并使用嵌入和潜在结构分析作为其基础。
闭源 | Closed Source
🟢 Pi by Inflection一个强大的聊天机器人****新选手!!!—— 没错,又是聊天机器人,但这个聊天机器人真的非常特别,从 UI 到表达方式(还可以同步以四种不同的声音输出语音),让人眼前一亮!持续和机器人扯闲篇儿一小时的是我本人没错了👇

除此之外,Pi 还有以下特点值得我们关注:
- **- 创始团队 - **包括 DeepMind 联创 Mustafa Suleyman,LinkedIn 的联合创始人、OpenAI 董事会成员 Reid Hoffman、科学家 Karén Simonyan 等;
- **- 长时记忆带来的个性化潜力 - **Pi 旨在成为一个私人聊天机器人,同时随着时间的推移,可以成长为个性化的虚拟陪伴。据 Forbes 报道,Pi 可以扮演积极的倾听者,通过不断对话,与用户一起讨论或解决问题,同时它会记住这些对话,逐渐了解用户;
- **- 跨平台互动与记忆 -**但真正酷的功能是,用户可以在各种平台上与自己的机器人交谈,它会记住与用户的互动!
**- 未来发展 - **Inflection 说这甚至不是他们最强大的模型......
🧑🏫 Khanmigo by Khan Academy在 5 月 2 日的 TED 演讲中,Khan Academy 的创始人 Sal Khan 演示了他们最新的 AI 工具 **Khanmigo,一位既面向学生的导师又面向老师的教学助手。**从演示中看,这是一款态度正向且具有变个性的教育产品,可以帮助学生找错误,引导他们用更好的解题思路与学习方法,通过角色扮演教授历史知识,甚至还可以成为强有力的辩论对手,能力很是全面,是一款符合我的个人预期的教育产品 —— 还记得 Greg Brockman 在 TED 2023 中提到的为 ChatGPT 在教育领域的能力提出问题又慷慨地提供垂直训练帮助的 Sal 吗?

🔗 https://www.khanacademy.org/khan-labs
🔊 Brand Voice & Memory by JasperJasper 推出了新功能 Jasper Brand Voice,用户可以向 AI 提供公司事实性信息、产品目录、受众/客户、品牌基调及风格等数据,以**确保生成的内容始终符合品牌调性。**Jasper 也可以直接访问用户的网站以直接了解品牌并匹配符合品牌调性的不同风格。此外,Jasper Brand Voice 还会保留用户上传的上述信息的历史记录(Memory),以确保 AI 可以始终准确撰写关于企业的具有一致性的内容。

🔗 https://www.jasper.ai/products/brand-voice
💬 Multilingual v1 by Eleven Labs上周末,一段克隆 David Attenborough 声音的,表达自然的英德双语小视频在 Reddit 和 Twitter 获得了大量关注,视频背后的功臣正是 Eleven Labs 新的**多语种模型 Multilingual v1。**该模型拥有强大的文本理解能力与丰富的情感表现力,目前支持八种语言:英语、法语、德语、印地语、意大利语、波兰语、葡萄牙语和西班牙语。此外,模型还具有识别多语言文本并转换为语音的能力,用户可以使用单条提示词生成多语种语音,同时 保持每个发音者的独特声音特征。

新模型已经在 ElevenLabs Beta 平台上提供,用户可以通过语音合成界面中的下拉菜单选择使用。
🔗 https://beta.elevenlabs.io/blog/eleven-multilingual-v1/
🦜 Parrot by Play.ht无独有偶,Play.ht 也推出了他们支持多语言合成和跨语言语音克隆的模型 Parrot。与 Multilingual v1 相同,Parrot 也允许用户跨越不同语言克隆语音,同时保留原始口音和语言的细微差别。例如,用户可以使用 Play.ht 的语音克隆服务上传 30 分钟的西班牙语音频,模型随后克隆语音和语言,使这位说西班牙语的用户能够用 Play.ht 的 TTS 软件说英语,软件会以初始音频的声音(只是换成英语)朗读文本,并保留西班牙语口音和说话习惯 —— 但与 Multilingual v1 不同的是,Parrot 支持 130 多种语言的相互转换却不支持多语言混合文本的语音转换。此外,Parrot 是此前 Play.ht 于 2022 年 9 月发布的语音模型 Peregrine 的升级版本,相比 Peregrine,Parrot 具有更相似的音高、节奏控制以及零样本克隆能力,能够捕捉并模仿原始音频语言的语调和细微差别,并将其应用到克隆语言中,从而实现无缝的跨语言克隆。
🔗 https://play.ht/blog/play-ht-launches-multilingual-synthesis-and-cross-language-voice-cloning/
🏃 iOS App by RunwayMLRunwayML 发布了 同名 iOS 应用程序,这可以被视为 RunwayML 商业化的基础,用户可以基于 Gen-1 模型生成视频并进行编辑 —— 目前只能在已有视频的基础上创建一些时髦但也有点诡异的视频,之后文本转视频功能也将会上线。但有个问题:免费积分有限,过后价格不菲。
🔗 https://apps.apple.com/us/app/runwayml/id1665024375
🎞 Twelve Labs由李飞飞和 Scale AI 创始人 Alexandr Wang 参与投资的视频搜索工具,通过描述,在数小时的视频里寻找最想要的那一瞬间!

有用的 | For Money
综合场景工具 | General tools
🪡 Klu自 ChatGPT Plugin 发布后,让工具成为「决策中心」成为了开发者们的探索热点方向之一,这里介绍 Klu,用于连接各种常用的应用程序,例如 Gmail、Dropbox、Notion、Slack 等等,以问答形式实现无缝、统一的企业内信息搜索。

💰 openpm.ai说完了「决策中心」,我们再来看看 ChatGPT Plugin 的另一个非官方定义「应用商店」—— Reflect Notes 的创始人 Alex 搭建了 openpm.ai,目标是防止 AI 领域出现类似 Apple Store 的垄断。openpm 是一个面向 OpenAPI 文件的开源包管理器,AI 可以像 ChatGPT Plugin 一样使用 openpm 中的包,换句话说就是自动发现和使用 API 与世界互动。为 OpenAPI 文件创建一个完全开源的包管理器 —— 这意味着任何具有 API 的应用/网站(AI 工具)都可以从该平台获取并即时使用,这基本上可以算作 Plugin 协议的免费版本 —— 让我们拭目以待 OpenAI 的反应。
**🚧 CodeDesign AI****CodeDesign 是一款 AI 驱动的网站构建工具,**可以使用 AI 生成的 UI 元素在几秒钟内创建网站,在完全个性化定制的同时还可以全程获得来自 AI 的智能化建议。目前,产品提供云托管、SEO 和数据库功能,并允许发布到自己的域或导出到代码。除此之外,还有一个生成营销文案的边缘功能。

除了 CodeDesign,还有两个相对功能简单的建站工具:
**✅ Levi by Style **AI
在 60 秒内构建完全可定制、SEO 优化和准备启动的网站。
**✅ Landing **AI