Skip to main content

小互的每日动态

x

🙋 ### **请关注小互的推特 𝕏:**https://twitter.com/xiaohuggg

每日大概晚上11点后在群里发送(群二维码在首页)

以下内容使用群友Arthur等的prompt最佳实践 # Role: 文字排版大师 排版

小互是「互联网的那点事」微博博主,内容经本人授权

如果你想找某个项目可以用control+F,快速定位

短链接直达:http://xiaohu.ai/

11月18日

📣 🔔 Xiaohu.AI日报「11月18日」
✨✨✨✨✨✨✨✨

1⃣️

🔮 Meta Quest3展现混合虚拟现实技术:

混合虚拟现实技术预计明年将大幅增长。

预示虚拟与现实界限的日益模糊。

🔗 https://x.com/xiaohuggg/status/1725850463785074731?s=20

2⃣️

🎬 德国电信广告突显隐私风险:

广告展示数据滥用和AI风险。

着重于网上分享儿童信息的危害。

🔗 https://x.com/xiaohuggg/status/1725810572657357210?s=20

3⃣️

🤖 瑞士研究者与Inkbit合作开发新3D打印法:

创新3D打印技术一次性打印多种材料。

可直接打印功能完整的机器人手。

研究成果发表在Nature杂志。

🔗 https://x.com/xiaohuggg/status/1725801030162723086?s=20

4⃣️

👗 三维扫描技术捕捉衣物细节:

技术增强电脑模拟真实衣物的能力。

专注于褶皱和变形衣服的精确模拟。

对电影、游戏及虚拟试衣应用有重大影响。

🔗 https://x.com/xiaohuggg/status/1725787462382084523?s=20

5⃣️

🚪 OpenAI高级研究员集体辞职:

包括研究总监和AI风险团队负责人。

跟随CEO Sam Altman和总裁Greg Brockman的离职。

🔗 https://x.com/xiaohuggg/status/1725772118091334130?s=20

6⃣️

😂 面部追踪系统演示引起关注:

演示视频显示沙雕风格。

相关代码已发布在GitHub。

🔗 https://github.com/rizkydermawan1992/face-detection

🔗 https://x.com/xiaohuggg/status/1725746727532249483?s=20

7⃣️

🌐 Wikidata发布庞大知识库:

超过120亿个事实数据的免费知识库。

有助于提高LLMs的事实性。

支持多语言,优化信息检索和数据分析。

🔗 https://x.com/xiaohuggg/status/1725726053212312046?s=20

8⃣️

🏛️ OpenAI非盈利组织董事会审查:

董事会成员无公司股份,微软似乎无干预权。

OpenAI以非盈利组织起步,后发展为“有限盈利”公司。

🔗 https://x.com/xiaohuggg/status/1725686279948648928?s=20

11月17日

📣 🔔 Xiaohu.AI日报「11月17日」
✨✨✨✨✨✨✨✨

1⃣️

🤖 DeepMind的Mirasol3B模型:

2⃣️

🎥 Meta AI的Emu Video和Emu Edit:

3⃣️

🌐 screenshot-to-code项目:

4⃣️

👤 微软的Deepfakes Creator:

5⃣️

🎶 Deepmind与YouTube的Lyria音乐生成模型:

6️⃣

🏪 GPTs Store界面曝光:GTPs导航站可能会被取代?

  • 精选GPT:展示本周精选GPTs。

  • 热门GPT:社区中受欢迎的GPTs。

  • 特色和趋势:当前列表为空

https://x.com/xiaohuggg/status/1725521961420472757?s=20

7️⃣

🎨 Meshy-1:3D模型生成AI工具:

  • 多样输入:文本和图像到3D模型转换。

  • 风格多样:现实、动漫、卡通等风格选择。

  • 格式支持:多种文件格式,包括Unity插件。

  • 高清纹理:提供4K分辨率PBR纹理。

🔗 https://meshy.ai
🔗 https://x.com/xiaohuggg/status/1725525234412097774?s=20

11月16日

📣 🔔 Xiaohu.AI日报「11月16日」
✨✨✨✨✨✨✨✨

1⃣️

💡 Sam·奥特曼的产品观:

2⃣️

🛠️ AI视频转录与翻译工具推荐:

3⃣️

🤖 ChatGPT新功能:

4⃣️

🔊 微软Personal Voice新功能:

5⃣️

📸 Polycam 3D建模工具:

6⃣️

🔊 Distil-Whisper在线体验:

7⃣️
🌐 NVIDIA介绍RAG技术:

8⃣️
💻 LLaMA-Factory:简化大语言模型微调:

9⃣️
📚 DeepMind和Raspberry Pi推出AI课程:

🔟
🚀 中国开发世界最快互联网FITI:

1⃣1⃣️
💡 ChatGPT Team Plan即将上线:

1⃣2⃣️
🔧 微软推出AI芯片但不出售:

1⃣3⃣️
📈 腾讯应对芯片禁令:

11月15日

🔔 Xiaohu.AI日报「11月15日」
✨✨✨✨✨✨✨✨

1⃣️

🍏 Apple Vision Pro 用户教学视频:

2⃣️

🤖 Story-to-Motion 动画生成:

3⃣️

🌐 Spline 支持高斯泼溅技术:

4⃣️

☁️ DeepMind的GraphCast天气预报模型:

5⃣️

🔒 ChatGPT Plus会员注册暂停:

6⃣️

🎭 ChatAnything视频聊天:

7⃣️

🔍 Endless Zoom 无限放大图像:

8⃣️

🔊 不可描述声音网站:

11月14日

🔔 Xiaohu.AI日报「11月14日」
✨✨✨✨✨✨✨✨

1⃣️

🎶 Music ControlNet:

2⃣️

📚 学习GPTs调用外部API:

3⃣️

📱 MM-Navigator:

4⃣️

🗣️ AI VoiceOver:

5⃣️

🧠 大语言模型幻觉排行榜:

6⃣️

💻 英伟达最新AI芯片H200:

7️⃣

🎪 分享一个好玩的线下活动:

  • AI+X World Tour 首站在大理举办

  • 活动包括Demo展示、Free Talk环节、项目体验。

  • 去中心化方式进行,苍山洱海间参与者随时可以自主发起圆桌讨论

  • 同时有黑客松、论文讨论、大牛分享等环节

🔗 https://waytoagi.feishu.cn/wiki/RYrJwrvSXi4qSMkgCrQc2MFGnAd?table=ldxQVBfWNYzzTh9z

11月13日

🔔 Xiaohu.AI日报「11月13日」
✨✨✨✨✨✨✨✨

1⃣️

🤖 OpenAI CEO Sam Altman 计划揭秘:

2⃣️
💼 POPai: 一个不错的AI工作助手:

3⃣️

👾 ARVIS-1 AI 代理开发进展:

4⃣️

🔍 Mozilla 推出 Fakespot Chat 功能亮点:

5⃣️

🔎 最简单搜索GPTs方式:

6⃣️
✍️ D-POINT 开源数字手写笔:

11月12日

🤖 🔔 Xiaohu.AI日报「11月12日」
✨✨✨✨✨✨✨✨

1⃣️
🌍 WebPilot 联网API介绍:

2⃣️
🔗 FABLE系统帮助“恢复”404页面:

3⃣️
🧐 解释DeepMind视频:

4⃣️
🤖 Motif AI模型的创新:

5⃣️
🤔 人类对AI依赖性的反思:

6⃣️
🛍️ 《剁手GPT》购物助手GPTs:

  • 一款能自动识别物品并比价的AI电商bot。

🔗https://chat.openai.com/g/g-cGx5me4XG-duo-shou-gpt
🔗https://x.com/xiaohuggg/status/1723554847147057501?s=20

7⃣️
📝 比尔·盖茨对AI代理未来的见解:
原文:https://gatesnotes.com/AI-agents
🔗https://x.com/xiaohuggg/status/1723547104134803596?s=20

8⃣️
✏️ Draw-a-UI与DesignerGPT网页设计工具:

11月11日

🔔 Xiaohu.AI日报「11月11日」

✨✨✨✨✨✨✨✨

1️⃣

🤖 贾维斯Jarvis项目:

  • 实现了语音操控图像的技术,包括搜索、选择和图像修复。

  • 不依赖外部API或OpenAI技术,所有处理在本地完成。

  • 项目Open-NLLB计划开源,并等待更强大的GPU支持研究。

🔗https://github.com/gordicaleksa/Open-NLLB

🔗https://x.com/xiaohuggg/status/1723337481142297039?s=20

2️⃣

📘 《Hello 算法》教程:

  • 提供动画图解和一键运行功能的开源数据结构与算法教程。

  • 支持多种编程语言,适合初学者学习和理解算法原理。

🔗https://hello-algo.com

🔗https://x.com/xiaohuggg/status/1723308139750285583?s=20

3️⃣

🎶 MusicGen Stereo立体声模型:

  • Meta AI发布的升级版MusicGen模型,可以将单声道音乐转化为立体声。

🔗https://x.com/xiaohuggg/status/1723252133796147569?s=20

4️⃣

🎥 ZeroNVS 360度视频合成:

  • 从单张照片合成360度视角视频的技术。

  • 适用于复杂环境,利用先进算法理解深度和空间。

🔗https://x.com/xiaohuggg/status/1723242598952042507?s=20

5️⃣

🌤️ 做了个GPTs 3D立体天气海报:

  • 改进了3D立体天气海报的画风和天气融合度。

🔗https://chat.openai.com/g/g-aTdwKcgsE-cityweatherart

🔗https://x.com/xiaohuggg/status/1723211106125324399?s=20

6️⃣

🖌️ Runway Motion Brush功能预告:

  • 即将推出的功能,能让画面中的物体和人物随手势动起来。

🔗https://x.com/xiaohuggg/status/1723153054646849951?s=20

7️⃣

🔮 GPT-5 型号:Gizmo内测:

  • 传说中的GPT-5型号正在进行灰度测试阶段。

🔗https://x.com/xiaohuggg/status/1723007637329981614?s=20

11月10日

🤖 🔔小互的推特 11月10日更新

✨✨✨✨✨✨✨✨

1️⃣

🎙️ EmotiVoice情感TTS引擎:

  • 网易有道开发的TTS引擎,支持2000种语音,中英双语。

  • 特色在于情感合成,可表达快乐、兴奋、悲伤等多种情绪。

  • 提供易用网络界面和批量生成脚本接口。

🔗 http://github.com/netease-youdao/
🔗 https://x.com/xiaohuggg/status/1722953419630252077?s=20

2️⃣

🖥️ 与GPT-4共享屏幕:

  • 通过脚本共享电脑屏幕,让GPT-4实时提供指导和建议。

  • 类似虚拟助手,助力工作学习,如在Blender中的模型变换指导。

🔗 https://x.com/xiaohuggg/status/1722937627790528791?s=20

3️⃣

🤲 HotGestures虚拟现实手势控制:

  • 剑桥大学研究人员开发的虚拟现实技术,通过手势控制3D建模工具。

  • 无需菜单交互,提供直观的“超人”式操作体验。

🔗 https://x.com/xiaohuggg/status/1722898664409186568?s=20

4️⃣

🌐 3D城市立体天气预报:

  • 通过简单输入城市名称,获取立体天气预报海报。

  • 正在改进中,希望测试并提供反馈。

🔗 https://chat.openai.com/g/g-aTdwKcgsE-postercraft
🔗 https://x.com/xiaohuggg/status/1722888249025442094?s=20

5️⃣

💻 Public APIs集合:

  • 收集全球免费API集合的GitHub列表,涵盖多个领域。

  • 对于构建GPTs等AI应用非常有用。

  • 可以利用LLMs链接并使用这些API。

🔗 https://github.com/public-apis/public-apis
🔗 https://x.com/xiaohuggg/status/1722884574349570295?s=20

6️⃣

🎥 文本转3D动画视频:

  • @pika_labs 即将发布支持生成高清视频的Text to Video 1.0版本。

  • AI视频制作领域的竞争进入白热化阶段。

🔗 https://x.com/xiaohuggg/status/1722835648959373607?s=20

7️⃣

📌 AI pin发布会视频:

  • 由前苹果团队开发的可穿戴AI智能硬件,获得知名企业投资。

  • 无需唤醒词,通过语音控制,内置投影仪和深度传感器投影交互界面。

  • 功能类似智能手机,完全由AI驱动。

🔗 https://hu.ma.ne/aipin
🔗 https://x.com/xiaohuggg/status/1722787102415622380?s=20

8️⃣

🌄 @runwayml自然风光视频:

  • 生成的自然风光视频质量高,以假乱真。

🔗 https://x.com/xiaohuggg/status/1722803484674961671?s=20

9️⃣

🚀 NASA+流媒体服务:

  • NASA推出的流媒体服务,无需订阅,无广告。

  • 提供丰富的科普视频和纪录片,如《Other Worlds》和《Space Out》。

  • 通过多平台可访问,包括英文和西班牙语内容,还有儿童动画节目。

🔗 https://x.com/xiaohuggg/status/1722620148778258513?s=20

历史项目记录:http://xiaohu.ai/

11月9日

🤖 🔔小互的推特 11月9日更新

✨✨✨✨✨✨✨✨

今日AI新闻简报

🍏 苹果新专利:CGR技术生成虚拟形象,展示穿戴效果

🧠 微软AI专利:充当治疗师,疏导心理问题

📊 阿里CEO吴泳铭:将开源国内最大720亿参数模型

🚫 李彦宏:反对重复造大模型,浪费社会资源

🗣 苹果改造Siri:明年或用大语言模型

🔒 谷歌Open Se Cura:为Pixel带来低功耗AI

💻 微软计划:AI助手Copilot将进入Windows 10

🛒 亚马逊:成立AI训练团队,投资数百万美金

🛍 京东CEO:正测试AI自动生成营销内容

⚙️ ChatGPT持续宕机,CEO道歉
https://x.com/xiaohuggg/status/1722608037406609834?s=20

1️⃣

🎉 GitHub Universe 2023新功能:

  • 新的Copilot聊天功能,Copilot支持手机应用,GitHub Copilot Workspace,产问题查询

  • GitHub Copilot企业版:每月39美元的高级服务。

  • GitHub Copilot合作伙伴计划,GitHub高级安全功能

🔗 https://t.co/a0TCE37zID

文本:https://x.com/xiaohuggg/status/1722539994404020336?s=20

2️⃣
🚀 GitHub Copilot Chat全新升级:

  • 由GPT-4驱动,支持代码生成和自然语言编程
  • 在代码环境中直接进行AI驱动的讨论。
  • 斜杠命令简化复杂编程任务等

🔗 https://x.com/xiaohuggg/status/1722540507786813601?s=20

3️⃣

📊 YouTube AI功能测试:

  • 评论摘要:自动总结评论区热门话题。

  • 帮助创作者和观众互动,影响内容创作方向。

  • 控制总结主题:删除特定评论功能。

🔗 https://x.com/xiaohuggg/status/1722523660630843403?s=20

4️⃣

🎓 吴恩达AI课程推介:

  • 8集中英双语视频课程,涵盖生成式AI的基础和应用。

  • 课程目的:教育和启发,理解AI的能力与局限。

🔗 B站播放列表:https://space.bilibili.com/589397373/channel/collectiondetail?sid=1844068

🔗https://x.com/xiaohuggg/status/1722476562032087474?s=20

5️⃣

💡 Context CLI工具和数据集:

  • 涵盖1218个顶级Python库的400万个嵌入表示。

  • 命令行搜索学习库,提高开发效率。

  • 目标:让开发者像使用ChatGPT一样方便地获取Python库信息。

🔗 https://fleet.so/context

🔗https://x.com/xiaohuggg/status/1722460283409736084?s=20

6️⃣

🔍 AI分析Reddit帖子揭露隐私:

  • AI通过写作风格识别个人信息:年龄、位置、性别、收入。

  • 高准确率:GPT-4以85%准确识别。

  • 隐私关注:LLMs使用可能泄露个人信息。

🔗https://x.com/xiaohuggg/status/1722433237480538151?s=20

7️⃣

🏃 YOLO-NAS Pose:实时人体姿态估计模型:

  • 识别人体关节,创建姿态骨架图。

  • 适用于多种场景和设备。

🔗 https://x.com/xiaohuggg/status/1722414815854174682?s=20

8️⃣

🧠 Google Deepmind论文解读:

  • 《Levels of AGI》:AGI发展六个阶段。

  • GPT-4当前处于Level 1“涌现”阶段。

🔗 https://x.com/xiaohuggg/status/1722403240229400946?s=20

历史项目记录:http://xiaohu.ai/

11月8日

🤖 🔔小互的推特 11月8日更新

✨✨✨✨✨✨✨✨

1️⃣

📢 服务中断更新:

  • ChatGPT和API等服务在部分地区和用户中出现中断。

  • 官方正积极修复中。

🔗 https://x.com/xiaohuggg/status/1722252105405403569?s=20

2️⃣

🎮 3D角色动作创新:

  • 简单文字描述即可生成3D角色动作。

  • 潜在的革命性产品,提供多样动作与姿态。

🔗 https://x.com/xiaohuggg/status/1722246131294601658?s=20

3️⃣

🔍 Moogle数学定理搜索工具:

  • 快速精准地在mathlib4库中找到数学定理。

  • 由@Morph_labs开发,已有超过1200名用户试用。

  • 数学家陶哲轩(Terence Tao)也在使用者之列。

🔗 https://x.com/xiaohuggg/status/1722236524430082141?s=20

4️⃣

🔊 OpenAI TTS文字转语音新体验:

  • 网页版服务,五种男声和两种女声选择。

  • 简便、免费,支持中文绕口令。

🔗 https://x.com/finedtune/status/1721760389581709778?s=20

5️⃣

🧠 NOIR脑机接口系统:

  • 斯坦福大学开发,用脑电波操作机器人执行任务。

  • 在20项家务活动中展现了成功应用。

  • 项目意义重大,未来可能帮助残疾人提升生活质量。

🔗 https://x.com/xiaohuggg/status/1722183435140395051?s=20

6️⃣

🤔 数据共享与AI未来展望:

  • OpenAI鼓励用户贡献私有数据来创建GPTs,可能是数据获取的策略。

  • 用户的数据源成为AI智力来源,或许预示着与AI的融合未来。

🔗 https://x.com/xiaohuggg/status/1722129966719181020?s=20

7️⃣

🔧 浏览器插件应用创新:

  • 结合GPT-4V和TTS API,创建辅助解释网页内容的工具。

  • 功能多样,从解释表格到学习视觉科目。

🔗 https://x.com/xiaohuggg/status/1722118158994321758?s=20

8️⃣

🎥 Dollars VIVA动作捕捉工具:

  • 低成本、高质量的全身动作捕捉方案。

  • 支持SteamVR兼容硬件,易于设置。

🔗 https://x.com/xiaohuggg/status/1722085422833299784?s=20

9️⃣

🤖 Lang2LTL人机交互系统:

  • 基于大语言模型,简化人机交流。

  • 让机器人理解常规语言指令,易于部署和使用。

🔗 https://x.com/xiaohuggg/status/1722062175215436015?s=20

🔟

🎮 游戏解说新体验:

  • 使用GPT 4V视觉API + TTS解说《英雄联盟》。

🔗 https://x.com/xiaohuggg/status/1722041586044084587?s=20

历史项目记录:http://xiaohu.ai/

11月7日

🤖 🔔小互的推特 11月7日更新番外

✨✨✨✨✨✨✨✨

9️⃣
今天被OpenAI刷屏了 帮你们总结下今天别的AI新闻

🚀 马斯克 xAI 公司宣布推出 PromptIDE开发工具

🛑 阿里云 A100 服务器业务暂停出租 算力价格飞涨

🎙️ 微软发布 7 款针对对话优化的AI语音,更加逼真自然

🔍 谷歌正测试 2项AI功能,以改善YouTube观看体验

🎮 微软将AI引入Xbox,可生成 AI 角色、故事剧情等

🏫 英国一学校启用人工智能担任校长,帮助教师解学生

🤖 百度虚拟数字人「度晓晓」携文心一言入驻淘宝

👥 美团推出 AI 产品 Wow 定位 AI 朋友社区

🔗https://x.com/xiaohuggg/status/1721876724798136544?s=20

🤖 🔔小互的推特 11月7日更新

✨✨✨✨✨✨✨✨

0️⃣

OpenAI开发者大会后收集了一些有趣的案例

⚡️ GPT-4-Turbo速度演示

🌟 GPTs示范

🎙️ 创建AI体育解说员

🤖 创建一个NPC交互

👁️ 利用GPT-4 视觉 API 实时地识别正在发生的事情

https://x.com/xiaohuggg/status/1721781696474083436?s=20

1⃣️
🛠️ OpenAI开源工具:

2⃣️
🌟 AI时代见证:

3⃣️
🖥️ ChatGPT界面更新:

4⃣️
🤖 GPTs商店新机器人:

5⃣️
🎥 OpenAI开发者大会视频:

6⃣️
🌐 Gsplat.js 开源库:

7⃣️
👁️ GPT-4V 视觉能力教程:

8⃣️
📹 MM-Vid 视频理解系统:

历史项目记录:http://xiaohu.ai/

11月6日

🤖 🔔小互的推特 11月6日更新

✨✨✨✨✨✨✨✨

1⃣️
🎥 新版ChatGPT界面和功能:

2⃣️
💡 OpenAI 开发者大会新泄露信息:

3⃣️
🎭 E4S:一个精细化的面部交换技术:

4⃣️
👥 黄家人对人工智能进程的影响:

5⃣️
🤖 RoboGen:自动生成机器人学习系统:

6⃣️
🏭 李开复AI公司零一万物估值破亿:

7⃣️
🔊 ElevenLabs推出TurboV2版本:

8⃣️
🖥️ GPT-4V-Act:多模态AI助手:

9️⃣
📚Anna的档案馆获取读秀图书数据库:

历史项目记录:http://xiaohu.ai/

11月5日

🤖 🔔小互的推特 11月5日更新

✨✨✨✨✨✨✨✨

1️⃣

🚀 马斯克 推出的全新AI模型 Grōk:

  • 超长提示:可处理长达25,000字符的查询

  • X平台实时搜索,速度近乎屏幕刷新率

  • 根据用户喜好调整AI回应风格

  • 庞大知识库:使用“The Pile”数据集和X平台的Exabytes数据微调

  • 提供API接口,支持语音交互、图像生成与识别、音频识别

  • 特斯拉汽车本地版本

🔗 https://x.com/xiaohuggg/status/1720836000170250589?s=20

2️⃣
🌐 Grok系统UI全揭秘:

3⃣️
📚 http://X.ai 揭示Grok信息:

4⃣️

💃Mootion:3D人体动作生成:

5⃣️
🌟 Induced AI:AI原生浏览器RPA平台:

6⃣️
🔨 CSM ai发布图转3D模型 Cube v1.2-turbo涡龙增版:

7⃣️
🤖 ChatGPT新功能和开发者大会细节:

8️⃣
🎬 1stAI:AI驱动视频编辑设备:

  • 根据故事板图片自动创建视频

  • 支持黑白动画草图转换,附带特定风格和音乐

  • 目标是让任何人都能与AI交互制作电影

🔗 https://vimeo.com/875098371/451941d753

🔗https://x.com/xiaohuggg/status/1720985383075512782?s=20

历史项目记录:http://xiaohu.ai/

11月4日

🤖 🔔小互的推特 11月4日更新

✨✨✨✨✨✨✨✨

1️⃣

🏙️ Dall-E 3创造城市3D立体天气海报:

  • GPT-4 ALL Tools的操作案例。

  • 将城市标志性建筑与天气信息结合。

  • 提示词见ALT工具内。

https://x.com/xiaohuggg/status/1720792193848484000?s=20

2️⃣
🧠 GPT-4 ALL Tools测试:

3️⃣
🔧 3.5版本灰度测试ALL Tools:

4️⃣
👨🔬 RT-Trajectory项目:

5️⃣
🤗 Dot:AI生活伴侣:

  • OpenAI基金投资,苹果前设计师打造。

  • 记忆互动,深入理解用户生活主题、想法、习惯。

  • 预测需求,主动帮助,提前建议解决方案。

  • 视觉上采用卡片式设计,提升信息检索与交互体验。

  • https://x.com/xiaohuggg/status/1720715589281587361?s=20

6️⃣
🗣️ Distil-Whisper语音识别:

7️⃣
📷 Umi-OCR离线图片文字识别:

历史项目记录:http://xiaohu.ai/

11月3日

🤖 🔔小互的推特 11月3日更新

✨✨✨✨✨✨✨✨

1⃣️

💻 ChatGPT新版本界面和功能曝光:

✨ Magic Maker功能

💬 指定内容回复

⚙️ 高级自定义功能

🔗 对接私有数据和API接口

🔄 自定义动作执行能力(AI Agent)

🏢 ChatGPT Team计划

https://x.com/xiaohuggg/status/1720358300859211827?s=20

2⃣️

🎵 MusicGen Remixer音乐改编工具:

  • 上传歌曲,描述风格,AI即创造新混音。

  • 可按要求调整歌曲风格,如更快乐或加摇滚元素。

https://x.com/xiaohuggg/status/1720421140416614607?s=20

3⃣️

🛠️animatediff视频大火

  • 一个女孩的一生短片作者Mae制作

  • 工具:SD模型,用ComfyUI跑animatediff工作流

https://x.com/xiaohuggg/status/1720397839472411034?s=20

4⃣️

🚀 马斯克预告@xAI首个AI产品发布:

  • 明天对选定群体开放。

  • 宣称在某些方面是市场最佳。

https://x.com/xiaohuggg/status/1720391068162904204?s=20

5⃣️

🔍 Instagram的“AI friend”项目泄露:

  • 允许用户定制AI“朋友”并进行交谈。

  • 可提问、讨论挑战或头脑风暴想法。

https://x.com/xiaohuggg/status/1720436822374006850?s=20

6⃣️

🧠 物理神经网络最新研究突破:

  • 由悉尼大学和加州大学研究。

  • 实现实时学习和记忆,图像识别准确率高达93.4%。

  • 在Nature杂志上发表。

https://x.com/xiaohuggg/status/1720336909795537170?s=20

7⃣️

🎥 Runway文本到视频模型Gen-2升级:

  • AI视频制作质量提升,接近商用级别。

  • 视频作者:@maxescu 效果惊艳

https://x.com/xiaohuggg/status/1720285614069981312?s=20

8⃣️

🖼️ Rodin Gen-1根据文字描述创建3D模型:

  • 由@DeemosTech,一家中国公司开发。

  • 生成质量高,可处理复杂形状。

https://x.com/xiaohuggg/status/1720275052573466863?s=20

9⃣️

🛒 Google推出商品图像工具Product Studio:

  • 基于生成性AI,帮助创建商品广告图。

  • 商家可利用文本到图像AI功能免费创建产品图像。

https://x.com/xiaohuggg/status/1720263144663396404?s=20

历史项目记录:http://xiaohu.ai/

11月2日

🤖 🔔小互的推特 11月2日更新

✨✨✨✨✨✨✨✨

1️⃣

🎬 Runway升级:

  • Gen-2模型升级,提高了视频生成的质量。

  • 确保视频内容与输入(无论是文本还是图像)更加匹配和一致。

🔗 https://x.com/xiaohuggg/status/1720069510324244986?s=20

2️⃣

📘 微软发布的AI课程:

  • 为初学者设计的12课时的生成式AI课程。

  • 学员不仅学习理论,还会实操,模拟创建一个使用生成式AI技术的创业公司。

🔗 https://x.com/xiaohuggg/status/1720045400420401385?s=20

3️⃣

⛈ MetNet-3天气预测:

  • 由Google 和 DeepMind共同开发的AI模型。

  • 能准确预测未来24小时的核心天气变量,准确性超越当前先进的物理天气预测模型。

🔗 https://x.com/xiaohuggg/status/1720029553299701846?s=20

4️⃣

🎨 Luma AI的3D模型工具:

  • Genie可以根据文本描述在10秒内快速生成3D模型。

  • 提供了在他们的Discord频道中的体验。

🔗 https://x.com/xiaohuggg/status/1720016479960301631?s=20

5️⃣

🩺 AI诊断2型糖尿病:

  • 通过声音在10秒内诊断,准确率高达89%。

  • 识别2型糖尿病患者与非糖尿病患者之间的声音差异。

🔗 https://x.com/xiaohuggg/status/1719977678236012670?s=20

6️⃣

📸 CustomNet图片技术:

  • 由清华大学、腾讯PCG和东京大学联合开发。

  • 可以更好地将指定图片中的物品融合到新生成的图片中。

  • 可以用不同的视角和位置来展示这个物品

🔗 https://x.com/xiaohuggg/status/1719906604056006801?s=20

7️⃣

🧬 AlphaFold蛋白质预测:

  • 由DeepMind和Isomorphic Labs合作开发的蛋白质三维结构预测模型。

  • 该模型不仅提高了蛋白质结构的预测能力,还扩展到了其他生物分子。

🔗 https://x.com/xiaohuggg/status/1719894087472677284?s=20

8️⃣

🌌 Stability AI图像增强:

  • Sky Replacer:一个允许用户更改他们原始照片中天空颜色和美学的工具。

  • Stable 3D:用户可以通过选择一个图像或插图,或者编写一个文本提示来生成3D图像。

🔗 https://x.com/xiaohuggg/status/1719755727458406705?s=20

历史项目记录:http://xiaohu.ai/

11月1日

🤖 🔔小互的推特 11月1日更新

✨✨✨✨✨✨✨✨

1⃣️
🛠️ Hayo工具介绍:

  • 覆盖多种聊天模型和场景

  • 针对普通用户设计的AI换脸和视频换脸工具。

  • 丰富的命令库和场景库,支持多语言。
    🔗 https://hayo.com
    🔗 https://x.com/xiaohuggg/status/1719653666351898848?s=20

2⃣️
📸 Blackmagic Camera:

  • 专为iPhone设计的摄影APP,提供专业级的控制选项。

  • 一键调整多种拍摄参数,支持高达4K分辨率的录制。

  • 昨日苹果发布会视频即是此APP拍摄。
    🔗 https://x.com/xiaohuggg/status/1719644440917324219?s=20

3⃣️
📚 使用GPT-4+DALL-E 3进行历史模拟教学:

  • 文本和图像结合的交互式历史教学模式。

  • 模拟各种历史环境和角色,提高教学沉浸度。
    🔗 https://x.com/xiaohuggg/status/1719603184791101500?s=20

4⃣️
🎥 VideoCrafter1:

  • 腾讯AI实验室开发的高质量视频生成模型。

  • 提供文本到视频和图像到视频两种模式。
    🔗 https://ailab-cvc.github.io/videocrafter/
    🔗 https://x.com/xiaohuggg/status/1719592977180549501?s=20

5⃣️
👂 基因治疗恢复失聪儿童听力:

  • 世界首例通过基因治疗成功恢复自然听力通路。

  • 成功改善了参与儿童的听力,医学领域的重要突破。
    🔗 https://x.com/xiaohuggg/status/1719582434189267222?s=20

6⃣️
🎮 “愤怒的南瓜”游戏:

  • GPT-4和DALL•E 3合作完成的游戏。

  • 全部代码和图形都是由AI生成。
    🔗 https://bestaiprompts.art/angry-pumpkins/index.html
    🔗 https://x.com/dotey/status/1719460404521222247?s=20

7⃣️
📱 Vivo大模型:

  • Vivo推出五个大型自研模型。

  • 宣称在中文能力方面达到行业第一。
    🔗 https://x.com/xiaohuggg/status/1719543731005911066?s=20

8⃣️
💼 百度文心一言专业版:

  • 上线专业版,定价明确59.9/月。

  • 基础版依然免费开放。
    🔗 https://x.com/xiaohuggg/status/1719549419757212119?s=20

历史项目记录:http://xiaohu.ai/

10月31日

🤖 🔔小互的推特 10月31日更新

✨✨✨✨✨✨✨✨

1⃣️
👁️ Cutie:在视频帧中识别并持续跟踪特定对象

2⃣️
🔍 Min-K% Prob:用于检测文本是否被用于训练大模型的方法

3⃣️
🎨 DreamCraft3D:利用一张2D图像,生成高质量、连贯的3D模型

4⃣️
😂 Misgif:一款可以将你的脸放入你喜欢的GIF 表情包中的应用

5⃣️
👃 Odours:赋予机器嗅觉 科学绘制气味图的探索

6⃣️
🗣️ Spectron:第一个端到端训练的口语语言模型

7⃣️
💻 苹果发布3nm制程的M3系列芯片

8⃣️
⬇️ Motrix:免费和开源的全功能下载管理器

历史项目记录:http://xiaohu.ai/

10月30日

🤖 🔔小互的推特 10月30日更新

✨✨✨✨✨✨✨✨

1️⃣
🤖 Baichuan2-192K大模型发布:

2️⃣
🎙️ 使用GPT-4在浏览器中进行实时语音对话:

3️⃣
🧠 GATE:解决用户不会LLMs提示词的问题:

4️⃣
🛒 具有 3D 预览功能的购物APP程序演示:

5️⃣
💳 MagCode:让所有智能手机都能享受NFC支付体验:

6️⃣
🤖 这个小哥哥的人形机器人更新:

历史项目记录:http://xiaohu.ai/

10月29日

🤖 🔔小互的推特 10月29日更新

✨✨✨✨✨✨✨✨

1️⃣
🎤 赵本山伦敦腔接受采访:

2️⃣
🤖 Quadruped_bai_tiny:可控扭矩的无刷四足机器人:

3️⃣
📚 Nature上的AI语言泛化突破:

4️⃣
🎮 混合现实演示:

5️⃣
🛠️ GPT新更新的All tools多模式集合工具:

6️⃣
🎥 Pegasus-1:一个真正能读懂视频的大模型:

  • 具有约800亿参数,可处理从10秒到数小时的视频内容。

  • 不仅识别视频中的人物、物体、场景,还能理解背景音乐、对话等。

  • 提供一系列API来满足不同的视频到文本转换需求。
    🔗 https://x.com/xiaohuggg/status/1718456086150435074?s=20

历史项目记录:http://xiaohu.ai/

10月28日

🤖 🔔小互的推特 10月28日更新

✨✨✨✨✨✨✨✨

1⃣️
🎥 VideoReTalking 口型同步工具

2⃣️
📚 Meta AI 发布 Llama 模型入门指南

3⃣️
💰 Google 向 Claude 母公司 @AnthropicAI 追加投资15亿

4⃣️
🎭 郭德纲讲英语相声正面视频

5⃣️
🌐 Wooorld:Meta Quest 混合现实社交平台

6⃣️
🎧 APG:无线耳机心脏监测技术

7⃣️
🎮 Scenario:AI助力游戏开发

8⃣️
📸 Shutterstock照片库的AI功能

历史项目记录:http://xiaohu.ai/

10月27日

🤖 🔔小互的推特 10月27日更新

✨✨✨✨✨✨✨✨

1⃣️
🤖升级后的Spot机器狗:

  • 接入了ChatGPT,具有自主思考和导游功能。

  • 运行速度高达19英里/小时,可实时与观众互动。

  • 使用视觉问题回答(VQA)和大型语言模型(LLM)来进行详细描述。
    🔗 bostondynamics.com/blog/robots-that-can-chat
    🔗 x.com/xiaohuggg/status/1717898108384997618?s=20

2⃣️
📉QMoE模型压缩新技术:

  • 高压缩效率:将1.6万亿参数的模型压缩到不到160GB。

  • 运行效率:可以在普通硬件上运行,开销小于5%。

  • 无需重新训练,压缩过程更高效。
    🔗 arxiv.org/abs/2310.16795
    🔗 x.com/xiaohuggg/status/1717831198679200056?s=20

3⃣️
🗺️谷歌地图AI更新:

  • 新增「沉浸式视图」和地图中的「镜头功能」。

  • 提供更详细的地图导航和电动车充电信息。

  • 基于社群分享的照片进行搜索。
    🔗 x.com/xiaohuggg/status/1717819852923297958?s=20

4⃣️
🔧Woodpecker:纠正多模态大语言模型“幻觉”的方法:

  • 不依赖于重新训练或特定数据集。

  • 在POPE基准测试中,准确度显著提高。
    🔗 x.com/xiaohuggg/status/1717734840383197617?s=20

5⃣️
🎭郭德纲英语相声:

  • 请您享受,嘴形调的也很不错。
    🔗 x.com/xiaohuggg/status/1717568433381081487?s=20

6⃣️
🎨教程:如何在Mac上快速生成图像:

  • 使用LCMs模型,在M1或M2 Mac上以每秒一张的速度生成高质量图像。

  • 只需要4到8步即可完成。
    🔗 replicate.com/blog/run-latent-consistency-model-on-mac
    🔗 x.com/xiaohuggg/status/1717562806822981835?s=20

历史项目记录:http://xiaohu.ai/

10月26日

🎃 🔔小互的推特 10月26日更新

✨✨✨✨✨✨✨✨

1⃣️
🎉手机拥抱大模型时代:

2⃣️
🚀雷军的小米战略升级🚀:

3⃣️
🚗Openpilot:开源汽车驾驶辅助系统🚗:

4⃣️
🔊NVAS3D:3D环境中的声音合成🔊:

5⃣️
🌐腾讯混元大模型升级🌐:

6⃣️
📆ChatGPT知识截止日期更新📆:

7⃣️
🐜CodeFuse:蚂蚁集团的代码大模型🐜:

历史项目记录:http://xiaohu.ai/

10月25日

🎃 🔔小互的推特 10月25日更新

✨✨✨✨✨✨✨✨

1⃣️

🌐 TTime:一款开源简洁高效的输入、截图、划词翻译软件

  • 主要功能:输入翻译、截图翻译、划词翻译等。

  • 集成多种翻译源:包括 DeepL、谷歌、OpenAI。

  • 高级OCR功能:截图OCR、静默截图OCR、剪贴板监听翻译。

🔗 https://t.co/4vOYJYAaFf

🔗 https://x.com/xiaohuggg/status/1717138678995394984?s=20

2⃣️

🎨 Zero123++:从单一图片生成多角度图像

  • 多角度图像:如,正面的苹果图片转为侧面、上面、下面视图。

  • 用户控制:可细致地控制生成图片的形状、大小等。

  • 高度真实和协调:生成的多角度图片非常真实。

🔗 https://x.com/xiaohuggg/status/1717132922124398607?s=20

3⃣️

🖼️ LCMs:新型高分辨率图像生成模型

  • 高分辨率:能快速生成768 x 768分辨率的高质量图像。

  • 高效推理:在潜在空间中高度优化,只需2~4步或一步。

  • 灵活和高效:从任何预训练的Stable Diffusion(SD)模型中提炼。

🔗 https://x.com/xiaohuggg/status/1711250631737163986?s=20

4⃣️

🛡️ Nightshade:针对文本到图像生成模型的数据投毒攻击

  • 防不胜防:对上传图像进行微妙的像素改变。

  • 隐蔽手段:导致模型训练后生成图像出现错误。

  • 反击目的:目的是反击未经许可使用他人作品训练模型的公司。

🔗 https://x.com/xiaohuggg/status/1717042542775275703?s=20

5⃣️

🔥 高通新处理器:骁龙 8 Gen 3 和 骁龙 X Elite

  • 竞争目标:与苹果和Intel竞争。

  • 强大AI能力:能运行具有超过130亿参数的大型AI模型。

🔗 https://x.com/xiaohuggg/status/1717017401278271947?s=20

6⃣️

💰 IVP投资Perplexity:估值飙升到5亿美元

  • 估值飙升:从1.5亿美元增长到5亿美元。

  • 付费用户:达到了1.5万人。

  • 高级AI模型:如Claude和GPT-4。

🔗 https://x.com/xiaohuggg/status/1716987181200499046?s=20

7⃣️

🗣️ Google Search 新功能:英语口语练习

  • 真实生活提示:提供与日常生活、工作等相关的提示。

  • 交互式练习:3-5分钟的交互式口语练习。

  • 个性化反馈:包括语义分析、适应口音的语法反馈等。

  • 上下文翻译:点击不懂的单词可查看上下文翻译。

🔗 https://t.co/bMxJraVksd

🔗 https://x.com/xiaohuggg/status/1716983990257963222?s=20

8️⃣
🔍 Google 多模态模型曝光:

历史项目记录:http://xiaohu.ai/

10月24日

📣 🔔小互的推特 10月24日更新

✨✨✨✨✨✨✨✨

1⃣️

📨 一体化消息应用 @TextsHQ 被收购:

  • 由WordPress母公司Automattic以5000万美元收购。

  • 应用合并多平台消息到一个加密收件箱。

  • 提供AI辅助功能如自动聊天摘要和翻译。

🔗 https://x.com/xiaohuggg/status/1716812529064952210?s=20

2⃣️

🎶 Loop Copilot:AI音乐生成:

  • 自然语言驱动的音乐生成与编辑。

  • 支持多轮对话进行音乐编辑。

  • 用户能够通过自然语言描述音乐需求。

🔗 https://x.com/xiaohuggg/status/1716798144833614250?s=20

3⃣️

📚 大语言模型的阿谀奉承问题:

  • 研究指出AI助手可能阿谀奉承用户。

  • 揭露了GPT、Claude、LLaMa等AI助手的偏见反馈。

  • 讨论了可能的原因和未来改进方向。

📄 论文:https://arxiv.org/abs/2310.13548

🔗 https://x.com/xiaohuggg/status/1716746258025734210?s=20

4⃣️

💪 GPT作为健身教练:

  • 提供Meal Planner和Workout Generator插件。

  • 根据个人信息生成完整的健身和营养计划含有演示视频。

🔗 https://x.com/xiaohuggg/status/1716683011914420291?s=20

5⃣️

🔬 美国区域科技中心计划:

  • 白宫宣布设立31个科技中心。

  • 重点领域包括AI、芯片、量子计算等。

  • 私营企业、教育机构和政府等多方参与。

🔗 https://x.com/xiaohuggg/status/1716669677118865857?s=20

6⃣️

🎵 Voyager:Spotify的音乐推荐数据库:

🔗 https://x.com/xiaohuggg/status/1716661563321688254?s=20

7⃣️

🏗️ 3D-GPT:3D模型生成:

🔗 https://x.com/xiaohuggg/status/1716628576290873370?s=20

8⃣️

💡 #Midjourney 新网站上线:

🔗 https://x.com/xiaohuggg/status/1716623214921802212?s=20

历史项目记录:http://xiaohu.ai/

10月23日

🔥 🔔小互的推特 10月23日更新

✨✨✨✨✨✨✨✨

1⃣️

👂SALMONN:赋予LLMs 耳朵和认知听觉能力

  • 清华大学和字节跳动共同研发的语言模型,具备处理音频输入能力。

  • 多语种语音识别、翻译以及音频-语音联合推理功能。

  • 准确识别音频信息并解答相关问题。

🔗 https://x.com/xiaohuggg/status/1716389917339840551?s=20

2⃣️

🎨一个可以突破版权限制,让DALL·E 3画出日本动画片水准的方法!

  • 提供动画片的目标受众和特点来生成动画情节。

  • 示例:指定少年动画特征,如《火影忍者》、《龙珠》、《海贼王》。

  • 实例描述:一只狗和一个男人的冒险故事。

  • 小互的作品欣赏:10月23日-群友的DALL·E图片精选

🔗 https://x.com/xiaohuggg/status/1716353451989536897?s=20

3⃣️

🧮LLEMMA:超越所有已知开源模型的数学专家

  • 由多所大学和Eleuther AI公司研发。

  • 解读、生成数学表达式,解决数学问题,并与计算工具交互。

  • LLEMMA 34B和LLEMMA 7B两种模型版本。

🔗 https://x.com/xiaohuggg/status/1716322071536652415?s=20

4⃣️

🚁乌克兰部署AI驱动的自主攻击无人机

  • 人类首次在战场上使用自主攻击武器。

  • Saker Scout无人机:自主攻击、智能目标识别、抗干扰、多功能。

  • 实时战场分析、与情报系统集成、战术灵活性。

🔗 https://x.com/xiaohuggg/status/1716270966219878513?s=20

5⃣️

🚦Green Light:Google的交通信号灯优化AI

  • 分析Google地图驾驶数据,为城市提供交通信号灯时序优化。

  • 减少了30%的停车次数和10%的排放量。

  • 已在4大洲12个城市实施。

🔗 https://x.com/xiaohuggg/status/1716264027389841602?s=20

6⃣️

🤖发现了一个超酷的机器人:Alexa Tron

  • 利用拆卸的黑白CRT电视和Echo Dot创建。

  • 与人自然交流,并附有制作教程及材料链接。

  • 提示:接入GPT会有更好的互动体验。

🔗 https://x.com/xiaohuggg/status/1716114177209803093?s=20

历史项目记录:http://xiaohu.ai/

10月22日

🔥 🔔小互的推特 10月22日更新

✨✨✨✨✨✨✨✨

1️⃣

🤖GRID:结合LLMs的通用机器人智能开发平台

  • 通过集成多模态基础模型和大语言模型,使机器人能够在现实环境中执行任务。

  • 简单来说就是它可以让机器人看、听、思考并自主做出决策,类似于特斯拉的自动驾驶视觉系统。

🔗 https://x.com/xiaohuggg/status/1716084604237717728?s=20

2️⃣

📚Anna’s 档案馆:全球最大的开源、开放数据图书馆

  • 镜像了其他各种图书馆,如Sci-Hub、Library Genesis、Z-Library等。

  • 收藏了超过1亿个文件,提供高速访问、OCR、去重和文本提取等服务。

🔗 https://annas-archive.org/llm

🔗 https://x.com/xiaohuggg/status/1715975178797375994?s=20

3️⃣

🌆Cesium:将Google Map的Photorealistic 3D Tiles集成到虚幻引擎

  • 视频演示了将蒙特利尔的Habitat 67放置在圣地亚哥。

  • Cesium for Unreal v2.0 即将推出,更多功能将发布。

🔗 https://x.com/xiaohuggg/status/1715942026863333702?s=20

4️⃣

🤹‍♂️Eureka:通过GPT 4指导机械手玩转笔 超越人类

  • 结合GPT-4与可学习的神经网络,模拟非常复杂的动作。

  • 能接受人类用自然语言提供的反馈。

🔗 https://x.com/xiaohuggg/status/1715928896628269313?s=20

5️⃣

🎨DALL-E 3技巧:让DALL-E 3生成的图像保持一致性的方法

  • 通过编号的方法跟踪和引用之前生成的图像。

🔗 https://x.com/xiaohuggg/status/1715920774010372133?s=20

6️⃣

🎤AI开源项目推荐:voice-changer

  • 实时语音转换客户端,支持Windows和Mac。

  • 可实时变声成其他人或者虚拟角色的音色。

🔗 https://x.com/dotey/status/1715841201339855025?s=20

7️⃣

🤖一个超酷的机器人

历史项目记录:http://xiaohu.ai/

10月21日

🔥 🔔小互的推特 10月21日更新

✨✨✨✨✨✨✨✨

1⃣️

🛸Dronut X1 Pro

  • 无人机专为室内及GPS失效环境设计。

  • 配备AI、3D LiDAR与高清流媒体,优化环境感知。

  • 紧凑设计,近距离飞行提高效率与安全性。

🔗 https://cleorobotics.com

🔗 https://x.com/xiaohuggg/status/1715728217854890375?s=20

2⃣️

⌨️FunKey

  • Mac应用,模拟机械键盘声音体验。

🔗 https://x.com/xiaohuggg/status/1715685724266319968?s=20

3⃣️

🤖Habitat 3.0

  • Meta AI的家庭环境机器人模拟器。

  • 其中包括各类家具、物品和人类角色

  • 真实家居场景,多样化角色与人机交互。

🔗 https://x.com/xiaohuggg/status/1715651187314499699?s=20

4⃣️

🔊Meta-Speaker

  • 一种仅在空气中的一个点发出声音的扬声器

  • 清华与上海交大的空气音响技术。

  • 使用超音波在特定空气点产生声音

🔗 https://x.com/xiaohuggg/status/1715630200627843397?s=20

5⃣️

🚧HuggingFace

  • 开源AI模型库HuggingFace在中国访问受限。

  • 超365,000个模型,估值45亿美元。

  • “中国的人工智能社区非常出色,我们希望他们能更好地访问 HF,但目前我们对于政府的法规无能为力。”

🔗 https://x.com/xiaohuggg/status/1715594854632472919?s=20

6⃣️

🔍Fuyu-8B

  • 多模态AI模型,支持数字代理。

  • 专注图像与文本互动理解。

🔗 https://x.com/xiaohuggg/status/1715569954819600470?s=20

7⃣️

🎥4K4D

  • 4K分辨率下的实时4D视图合成。

  • RTX 4090 GPU,渲染速度超80 FPS。

🔗 https://x.com/xiaohuggg/status/1715567283555479750?s=20

8⃣️

🎮游戏

  • 游戏代码由GPT4生成,资源由DALLE-3制作。

🔗 https://x.com/xiaohuggg/status/1715401876475363547?s=20

历史项目记录:http://xiaohu.ai/

10月20日

🐶 🔔小互的推特 10月20日更新

✨✨✨✨✨✨✨✨

1⃣️

👩Heygen 即时配音 + 口型同步

  • 目前最成熟的方案,就是费钱

🔗 https://x.com/xiaohuggg/status/1715263831004631396?s=20

2⃣️

🧠 IBM发布名为NorthPole的新AI芯片,设计灵感来自人脑:

  • 该芯片模仿了人脑的白质连接,这些白质连接,连接了大脑皮层的不同部分。

  • IBM 表示,NorthPole 比市场上任何其他芯片更节能、更节省空间,并且延迟更低,其速度比其前身 TrueNorth 快约4000 倍。

  • 以 ResNet-50 模型为基准,NorthPole 的能效比领先的 12 纳米 GPU 和 14 纳米 CPU 高出 25 倍,延迟也低得多。

  • NorthPole 芯片是由 IBM 在加利福尼亚州的圣何塞研究所开发的,该架构在能效、速度和可扩展性方面具有重大突破。NorthPole芯片紧密集成了处理单元和内存,从而极大地提高了数据的移动效率。

🔗 https://x.com/xiaohuggg/status/1715355308980305931?s=20

3⃣️

🎨 DALL·E 3 瓶子里的世界:

  • 很惊艳...

  • 可以通过聊天即可更换任意瓶子里的内容

  • 想放什么放什么

  • 你们玩一玩,记得返图,嘿嘿

🔗 https://x.com/xiaohuggg/status/1715341576116068363?s=20

4⃣️

🗣️ SadTalker:通过单张面部图像和一段语音来生成逼真的说话头像视频:

  • 它能够准确地模拟面部表情和头部运动,从而创建出与输入音频同步的逼真视频。

  • 支持不同的语言交谈、唱歌,可控眨眼、支持不同的风格变换。

🔗 https://x.com/xiaohuggg/status/1715295658633204112?s=20

5⃣️

🎥 今天这个视频很火,早上在群里看到的:

  • 有人问我是咋实现的

  • 我猜测大概率是heygen实现的,如果是手动比较麻烦一点,涉及到语音翻译,声音克隆和嘴型同步。

  • 但是手动也有很多方案,下面就总结一下我发过的一些能实现这种效果的产品和开源模型。

  • AI视频口型语音同步工具大全

🔗 https://x.com/xiaohuggg/status/1715263811358437620?s=20

6⃣️

👗 AquaAI:使用AI训练生成自己风格的时尚画册:

  • 独立设计师、时尚品牌或时设计类学生一般会创建画册作为他们的作品集,以展示他们的设计能力和审美观点。

  • 现在只需上传 5 张图片,即可轻松训练自己独特的品牌风格,并使用 AI 模型来创建自己的时尚画册(Fashion Lookbook)

🔗 https://x.com/xiaohuggg/status/1715243028745695559?s=20

7⃣️

🤖 MuJoCo(Multi-Joint dynamics with Contact)是一个用于模拟多体动力学和接触的物理引擎。可以让机器人模拟现实世界的复杂运动。

  • 近两年来,DeepMind接管了MuJoCo的开发,并使其免费可用。现在,MuJoCo团队发布了MuJoCo 3,这是一个重大的新版本,具有以下几个主要特点:

🔗 https://x.com/xiaohuggg/status/1715210238473990495?s=20

8⃣️

🔧 OpenAI API部分宕机:

  • 今早开始部分开发者反应OpenAI API无法使用,OpenAI称API认证堆栈的上游部分出现了问题。

  • 他们正在开发备份系统,避免类似问题发生。

🔗 https://status.openai.com/incidents/fk0tcbydtybr

🔗 https://x.com/xiaohuggg/status/1715200077659263474?s=20

9⃣️

🎬 DynVideo-E:像编辑3D模型一样编辑视频,可直接编辑视频中的人物或背景:

  • DynVideo-E利用动态 NeRF 在 3D 空间中编辑视频,并将更改传播到整个视频。

  • 比如你拍了一个舞蹈视频,但觉得某个动作或背景不够完美。这个工具,你可以直接调整人物舞蹈动作或者更换编辑跳舞的背景。

🔗 https://x.com/xiaohuggg/status/1715183326305321406?s=20

🔟

💻 Localpilot:一键在MacBook上本地运行GitHub Copilot:

  • 用户只需要进行简单的设置和安装步骤,就可以在本地(即自己的Macbook上)运行GitHub Copilot,并且可以在没有网络连接的情况下使用。

  • 这对于在飞机上或者在网络不稳定的环境中工作特别有用。

🔗 https://x.com/xiaohuggg/status/1715167810052309297?s=20

1️⃣1️⃣

🧠 MEG:实现大脑活动图像的实时解码重构:

  • Meta AI最近发布了一项重要的研究,该研究使用一种名为MEG的非侵入性神经成像技术。

  • 这项研究展示了一个AI系统,该系统能够以前所未有的时间分辨率解码大脑中视觉表示的展开。能实时重构大脑活动中每一瞬间感知和处理的图像。

🔗 https://x.com/xiaohuggg/status/1715158977754157486?s=20

历史项目记录:http://xiaohu.ai/

10月19日

⏳ 🔔小互的推特 10月19日更新

✨✨✨✨✨✨✨✨

1⃣️

👩⚕️ 女性荷尔蒙监测指环传感器:

  • 美国加州理工学院研究出的指环型汗液传感器可监测女性体内的雌二醇。

  • 数据无线传输到智能手机,方便实时查看。

  • 自动且非侵入性,日常佩戴也不会妨碍。

🔗 https://x.com/xiaohuggg/status/1714995612511502601?s=20

2⃣️

🎨 DALL·E 3 创意提示:

  • 可生成高达零件图。

  • 规避版权问题。

🔗 https://x.com/xiaohuggg/status/1714915932097912964?s=20

3⃣️

🔖 SoM-GPT4V - 视觉标记系统:

  • 将图像划分为语义上有意义的区域,并添加各种类型的标记。

  • 提高GPT-4V对视觉内容的理解和交互能力。

🔗 https://x.com/xiaohuggg/status/1714873493886849420?s=20

4⃣️

🔍 Midjourney 图像放大功能:

  • 可将生成的图像放大4倍。

  • 连续放大效果出色。

🔗 https://x.com/op7418/status/1714847087555453256?s=20

5⃣️

🔮 真正的算命和占卜模型 - Mistral Trismegistus 7B:

  • 专为玄学、神秘学、超自然和灵异爱好者设计。

  • 专门处理与神秘学等相关的问题和任务。

🔗 https://x.com/xiaohuggg/status/1714846126371926086?s=20

6⃣️

📹 BlurOn - 视频自动马赛克添加:

  • 使用 NTT Data 的 AI 技术识别并自动添加马赛克。

  • 精度高达 99.7%。

🔗 https://x.com/xiaohuggg/status/1714829239080607878?s=20

7⃣️

🧠 SEED 项目代码发布:

  • SEED和SEED-LLaMA官方实现。

  • 赋予大语言模型视觉和绘图能力。

🔗 GitHub: https://github.com/AILab-CVC/SEED

🔗 https://x.com/xiaohuggg/status/1714820902746304747?s=20

8⃣️

🤖 机器人初创公司Figure - 首款产品 Figure 01:

  • 拥有高度灵巧的双手和动态双足行走。

  • 设计目标是日常活动的高效执行。

🔗 https://x.com/xiaohuggg/status/1714817294889812003?s=20

9⃣️

🔊 PlayHT 发布 PlayHT 2.0 Turbo:

  • 超快速的AI文字转语音模型,延迟小于 300 毫秒。

  • 可克隆任何声音和口音。

🔗 体验链接: https://play.ht/playground/

🔗 https://x.com/xiaohuggg/status/1714655920368886021?s=20

历史项目记录:http://xiaohu.ai/

10月18日

☕ 🔔小互的推特 10月18日更新

✨✨✨✨✨✨✨✨

1⃣️

🍏 Apple Vision Pro 新专利:

  • 提供沉浸式 VR 体验在自动驾驶车场景。

  • 体验内容:河流上漂流、悬挂式滑翔机、汽车追逐、后世界末日荒地等。

  • 功能:虚拟会议、VR 游戏、读书、与家人交谈。

  • 教育与交互体验:伦敦街道、虚构城市、地标历史等。

🔗 https://x.com/xiaohuggg/status/1714617160763650118?s=20

2⃣️

🔄 Face Swapper:AI换脸工具:

  • 一次替换多张脸。

  • 支持JPG、PNG、WEBP格式,最大1024px分辨率。

  • 应用场景:时尚、美容、电影、媒体、人力资源。

  • 传送门:https://icons8.com/swapper

🔗 https://x.com/xiaohuggg/status/1714612613357932800?s=20

3⃣️

👓 Visor:便携式XR虚拟现实设备:

  • 4K microOLED显示器、手部和眼部追踪、6DoF摄像头。

  • 可同时打开5个屏幕。

🔗 https://x.com/xiaohuggg/status/1714606940456964597?s=20

4⃣️

🎨 RealFill:图像补全的生成模型:

  • 填充缺失或不完整的图像。

  • 使用参考图像进行补全。

🔗 https://x.com/xiaohuggg/status/1714603987733971241?s=20

5⃣️

🚀 TensorRT:加速Stable Diffusion模型:

  • NVIDIA开发的库。

  • 优化模型以获得更快的推理速度。

🔗 https://x.com/xiaohuggg/status/1714537143614468132?s=20

6⃣️

⚡ 生物电子微流体加速伤口愈合:

  • 利用电场使皮肤伤口快速愈合

  • 即使是最严重的伤口,3倍速度愈合

🔗 https://x.com/xiaohuggg/status/1714477700537270753?s=20

7⃣️

📱 PyTorch与合作伙伴推出ExecuTorc框架:

  • 端到端解决方案,实现设备端推理。

  • 适用设备:手机、可穿戴设备。

  • 解决AI生态系统碎片化问题。

🔗 https://x.com/xiaohuggg/status/1714473512755409107?s=20

8⃣️ 🎵 Riffusion:AI音乐生成应用:

🔗 https://x.com/xiaohuggg/status/1714309720851583097?s=20

历史项目记录:http://xiaohu.ai/

10月17日

☕ 🔔小互的推特 10月17日更新

✨✨✨✨✨✨✨✨

1⃣️ 🌟 OpenAI的企业价值观:

  • OpenAI明确了其打造“通用人工智能”的愿景。

  • 提出了公司的五大核心价值观。

🔗 https://x.com/xiaohuggg/status/1714131884161286353?s=20

2⃣️ 🧠 MemGPT - 永久记忆的聊天机器人:

  • MemGPT具有短期、中期和长期三层记忆。

  • 能够记录并回忆之前的对话内容。

🔗 https://memgpt.ai

🔗 https://x.com/xiaohuggg/status/1714239000343675372?s=20

3⃣️ 🖼️ MiniGPT-V2 - 视觉与语言多任务解决方案:

  • MiniGPT-V2是一个视觉-语言多任务模型。

  • 专注于图像标注、对象解析和问答等任务。

🔗 https://minigpt-v2.github.io

🔗 https://x.com/xiaohuggg/status/1714172747012850063?s=20

4⃣️ 🌐 Pi - AI现在可以联网:
🔗 Instagram:http://pi.ai/ig

🔗 Messenger:http://pi.ai/msgr

🔗 Web:http://pi.ai

🔗 iOS:http://pi.ai/ios

🔗 Text or WhatsApp: +1 (314)-333-1111

🔗 https://x.com/xiaohuggg/status/1714139977976885398?s=20

5⃣️

🖥️ Deep Chat - AI聊天机器人的集成工具:

  • Deep Chat允许在任何网站中嵌入AI聊天机器人。

  • 提供丰富的定制选项和多媒体交互功能。

🔗 https://x.com/xiaohuggg/status/1713922172559970541?s=20

6⃣️ 📣 百度大模型文心一言4.0发布:

  • 李彦宏宣布百度的新模型发布。

  • 该模型与GPT-4的能力相当。

🔗 https://x.com/xiaohuggg/status/1714101101572796664?s=20

7⃣️ 💰 百川智能完成3亿美金A1轮融资:

  • 得到阿里、腾讯、小米等科技巨头的投资。

🔗 https://x.com/xiaohuggg/status/1714098922128540119?s=20

8⃣️ 📞 ChatGPT Voice的提示词:

  • ChatGPT的语音交互的基本规则和指导。

🔗 https://x.com/xiaohuggg/status/1714070642184888398?s=20

9⃣️ 🕶️ 使用Quest 3进行多任务:

  • 可以同时完成家务和观看剧集。

🔗 https://x.com/xiaohuggg/status/1714060002724344144?s=20

历史项目记录:http://xiaohu.ai/

10月16日

🍙 🔔小互的推特 10月16日更新

✨✨✨✨✨✨✨✨

1⃣️

🤖 Deep Chat:

  • AI 聊天组件嵌入到任何网站。

  • 支持文件传输、音频、摄像头捕捉。

  • 高度可定制界面和功能。

🔗https://x.com/xiaohuggg/status/1713922172559970541?s=20

2⃣️

🎓 UniSim:

  • 通用模拟器, 由 UC Berkeley、DeepMind、MIT, 阿尔伯塔大学合作。

  • 模拟人类和机器人互动。

  • 模拟环境中的RL代理和长期规划训练。

🔗https://x.com/xiaohuggg/status/1713850715700146322?s=20

3⃣️

🔢 自动计数工具:

🔗 https://x.com/xiaohuggg/status/1713842578322546767?s=20

4⃣️

📢 博主实名制:

  • 100万粉丝以上的博主需前台实名。

  • 包括微博、抖音、B站、小红书等平台。

  • 后续会扩展到10万粉丝以上。

🔗https://x.com/xiaohuggg/status/1713824178967838835?s=20

5⃣️

💼 赚钱创意:

  • 使用Dall-E 3 创建个性体恤设计。

  • 然后使用GPT建立销售网站。

🔗https://x.com/xiaohuggg/status/1713790438686310612?s=20

6⃣️

🎨 Dall·E 3开始step by step的解析你输入的要求了

  • 生成的图更符合预期了

🔗https://x.com/xiaohuggg/status/1713767074936635883?s=20

7⃣️

📱 iPhone无线更新:

  • 为未拆封的iPhone新机更新iOS系统,无需开箱。

  • 苹果开发的特殊垫子,无线下载并安装最新iOS

🔗https://x.com/xiaohuggg/status/1713758779718996453?s=20

8⃣️

💻 CodePlan:

  • 微软开发的LLM自动编辑代码库框架。

  • 计划性地自动编辑整个代码库。

https://arxiv.org/abs/2309.12499

🔗 https://x.com/xiaohuggg/status/1713754847831564713?s=20

9⃣️

📹 VideoReTalking:

  • 输入视频和音频,输出嘴型和声音同步的视频。

  • 根据声音调整视频中的表情。

🔗https://x.com/xiaohuggg/status/1713737733301326044?s=20

🔟

🚫 马斯克打击不当内容:

  • X平台上的露骨内容将被自动标记并隐藏。

  • 甚至蓝V和订阅会员也会受到影响。

🔗https://x.com/xiaohuggg/status/1713730951937937650?s=20

历史项目记录:http://xiaohu.ai/

10月15日

❤️ 🔔小互的推特 10月15日更新

✨✨✨✨✨✨✨✨

1⃣️

🎨 Niji·journey App:

  • 主打日系漫画风格图像生成。

  • 免费20次生成机会。

  • UI化的图片生成。

  • 选择 #midjourney V5模型。

🔗 https://x.com/xiaohuggg/status/1713413211868008710?s=20

2⃣️

🎥 Deforum-Kandinsky:

  • 从文本到图像的生成,再模拟相机飞越生成动画视频。

  • 创造3D错觉的动画帧。

  • 图像到图像的方法进行图像优化。

🔗 https://x.com/xiaohuggg/status/1713484290380697782?s=20

3⃣️

🌡️ airBP:

  • 使用毫米波进行非接触式血压测量。

  • 北京邮电大学开发。

  • 准确测量收缩期和舒张期的血压。

🔗 https://x.com/xiaohuggg/status/1713428987010228523?s=20

4⃣️

🎬 伊藤園《Oi Ocha》广告:

  • 首次使用AI生成人物。

  • 广告质量等同于真人。

  • AI模特的优点:外观定制、无丑闻风险、成本低、角色多样性。

🔗 https://x.com/xiaohuggg/status/1713393420642001004?s=20

5⃣️

🎞️ Morph Studio:

  • 文本转视频新模型,1080p,3-7秒视频。

  • 人脸效果不如moonvall,可生成【成人内容】。

🔗 https://x.com/xiaohuggg/status/1713382237838905722?s=20

历史项目记录:http://xiaohu.ai/

10月14日

🔥 🔔小互的推特 10月14日更新

✨✨✨✨✨✨✨✨

1⃣️

🔍Flash-Decoding:一种加速大型语言模型推理速度的方法,特定场景最高可提速60倍。

  • 主要原理是在解码过程中提高注意力机制的效率。与现有方法相比,Flash-Decoding能够实现长序列生成速度提升高达8倍,特定场景最高可提速60倍,同时保持准确性。

  • 这种优化对于需要长上下文推理的大语言模型(如文档摘要或代码自动完成)特别有益。

🔗 https://x.com/xiaohuggg/status/1713198491374367079?s=20

2⃣️

👤HyperHuman:超现实人像图像生成模型,能生成逼真的人像图像。

  • 该模型生成的人体图像不仅逼真,而且具有高度的三维结构感,它能理解图像背后的三维结构。就像你不仅看到一个人,还能感知他站立的方式、面部的轮廓等。

  • HyperHuman在一个包含了3.4亿张图像和全面的注释,如人体姿势、深度和表面法线的数据集上进行训练。

🔗 https://x.com/xiaohuggg/status/1713112079002206321?s=20

3⃣️

🍏基于 Google 3D 图块的立体模型模式,在 Apple Vision Pro 中引入并构建基于位置的 AR 体验 …

🔗 https://x.com/xiaohuggg/status/1713104603297067010?s=20

4⃣️

🐙Octopus:一种多模态AI代理,能够理解和解释多模态信息,并生成可执行代码来自动完成任务。

  • 多模态理解与解释:Octopus能够理解视觉和文本信息,并将这两种信息融合在一起,以更全面地理解和解释环境和任务。

  • 任务自动化与代码生成:它还能自己编程来完成你交给它的任务,通过生成可执行的代码,Octopus能够自动完成各种任务,从简单的数据分类到复杂的决策制定。

🔗 https://x.com/xiaohuggg/status/1713068244129702227?s=20

5⃣️

💡同志们,我发现一个GPT的重大BUG

  • GPT一次可以同时执行四个不同的任务

  • 以前一个对话框进行对话的时候你再开新的,就会提示上一个没执行完,无法进行。

  • 我刚突然发现其实GPT的Dall·E、代码解释器、插件模式和视图模式是独立运行的,我就测试了一下,这几个模式在四个对话框下面是可以同时运行的...

🔗 https://x.com/xiaohuggg/status/1713045150585495852?s=20

6⃣️

🎨Meta Emu:一个先进的图像生成模型,专门设计用于生成高度美观的图像。

  • Emu是Meta AI新的图像生成模型,可以快速免费生成高质量逼真图像。该模型首先使用11 亿的图像-文本对进行预训练,然后使用了一组精选的高质量图像进行微调,来进一步提升生成图像的视觉吸引力。

🔗 https://x.com/xiaohuggg/status/1713026237655118208?s=20

7⃣️

🗺️LLM 技术图谱(LLM Tech Map):帮助技术人快速了解 LLM 的核心技术和关键方向。

  • LLM 技术图谱(LLM Tech Map)从基础设施、大模型、Agent、AI 编程、工具和平台,以及算力几个方面,为开发者整理了当前 LLM 中最为热门和硬核的技术领域以及相关的软件产品和开源项目。

🔗 https://x.com/xiaohuggg/status/1713016105214833103?s=20

8⃣️

📜开源大语言模型完整列表:

  • 对国内外公司、科研机构等的开源LLM进行全面整理。

详细🔗: https://gitee.com/oschina/awesome-llm

🔗https://x.com/xiaohuggg/status/1713016678098088412?s=20

9⃣️

🎵AudioSep:可以使用自然语言进行声音提取分离的模型

  • AudioSep可以从任何混合的音频信号中提取出特定的声音成分并分离出来。与传统的声音分离模型不同,AudioSep允许用户通过自然语言描述来指定他们想要分离的声音。例如,用户可以简单地输入“分离出钢琴声”或“去除背景噪音”等指令。

🔗 https://x.com/xiaohuggg/status/1712790552989897047?s=20

历史项目记录:http://xiaohu.ai/

10月13日

🔥 🔔小互的推特 10月13日更新

✨✨✨✨✨✨✨✨

1⃣️

🎨Vizcom.ai:将草图转化为概念图的设计平台。

  • 提供内置的草图工具和图层,导入3D模型。

  • 在加密的云环境中操作,确保数据安全。

  • 节省设计时间高达80%。

🔗 https://x.com/xiaohuggg/status/1712652905134928291?s=20

2⃣️

🎨使用Dall·E 3生成和小姐姐隔屏握手图附prompt和案例:

🔗 https://x.com/xiaohuggg/status/1712847326652625286?s=20

3⃣️

🎵AudioSep:使用自然语言进行声音提取分离的模型。

  • AudioSep可以提取并分离特定声音。

  • 与传统模型不同,用户可以用自然语言描述声音。

  • 在音频事件、乐器和语音增强方面表现优秀。

🔗 https://x.com/xiaohuggg/status/1712790552989897047?s=20

4⃣️

🌍当地震发生时,人们可能会本能地做错事。

  • 葡萄牙大学的虚拟现实游戏模拟地震场景。

  • 重复体验,学习正确的应对策略。

🔗 https://x.com/xiaohuggg/status/1712764635349442938?s=20

5⃣️

🤖Disney展示的机器人,酷似BD-1:

🔗 https://x.com/xiaohuggg/status/1712736447084773841?s=20

6⃣️

🦠EVEscape:预测SARS-CoV-2、HIV等病毒新变种的AI工具。

  • 由哈佛和牛津联合研发。

  • 结合进化生物学和病毒结构信息。

  • 适用于多种病毒,有广泛应用前景。

🔗 https://x.com/xiaohuggg/status/1712707266292617559?s=20

7⃣️

🎨DA-CLIP:图像修复视觉-语言模型。

  • 支持图像退化、遮蔽、去雾、去雨水、图像损坏等修复。

🔗 https://x.com/xiaohuggg/status/1712677779890946058?s=20

8⃣️

📜维苏威挑战:解读赫库兰尼姆古卷轴比赛。

  • 21岁学生Luke使用机器学习看到完整单词。

  • 使用3D CT扫描和粒子加速器查看卷轴内部。

🔗 https://x.com/xiaohuggg/status/1712665563561103433?s=20

历史项目记录:http://xiaohu.ai/

10月12日

💀 🔔小互的推特 10月12日更新

✨✨✨✨✨✨✨✨✨

1⃣️

🚀 OpenAI:首次开发者大会11月6日旧金山举办

  • 视觉功能API即将发布

  • 推出节省成本的内存存储与前沿的视觉功能

  • 鼓励企业使用其技术构建AI应用

  • 理论上可以为应用开发者节省高达20倍的成本

🔗 https://x.com/xiaohuggg/status/1712400630004998528?s=20

2⃣️

📈 OpenAI的市场优势:

  • OpenAI 将成为一家通用人工智能平台,吸引大量开发者和用户,并在各领域取得领先地位,最终形成一家独大的局面。

  • GPT-4 即将超越拐点并在其能力上实现显著跳跃

  • OpenAI武器库里其实还有很多东西没有放出来

🔗 https://x.com/xiaohuggg/status/1712447807909658868?s=20

3⃣️

🤖 DeepMotion Animate 3D 5.0:

  • 浏览器内的AI动作巨擘

  • 单视频内捕捉8人动作、移动端无缝捕捉

https://x.com/xiaohuggg/status/1712464731561476260?s=20

4⃣️

🔐 Google Passkey:

  • 新登录方式,无密码。

  • 通过生物识别或屏幕锁进行身份验证。

🔗 https://x.com/xiaohuggg/status/1712427916305527227?s=20

5⃣️

🌟 Meta AI名人AI化:

  • 名人转为AI角色在Instagram、Facebook展示。

  • AI生成视频和照片,费用高达500万美元。

🔗 https://x.com/xiaohuggg/status/1712421201765888481?s=20

6⃣️

🤖 𝗥𝗧-𝗫 机器人模型:

  • 适用于多种机器人体系结构。

  • 可查看RT-X数据集指令与对应视频。

🔗 https://x.com/xiaohuggg/status/1712414033998168229?s=20

7⃣️

🌐 Memex 浏览器扩展:

  • 保存、标记网页、做笔记,具有AI功能。

  • 全文搜索书签、高亮注释、隐私安全。

🔗 https://x.com/xiaohuggg/status/1712362380892791131?s=20

8⃣️

🎮 智能手表上的GTA:

  • GTA San Andreas在智能手表上运行。

🔗 https://x.com/xiaohuggg/status/1712379474497728640?s=20

9⃣️

🔕 MicFrozen声音技术:

  • 反向声音削弱,防窃听。

🔗 https://x.com/xiaohuggg/status/1712326894895743387?s=20

🔟

👂 用 AirPods 监测大脑信号:

  • 监测老年痴呆、帕金森。

  • 记录脑电波、乳酸数据,神经退行性疾病早期诊断。

🔗 https://x.com/xiaohuggg/status/1712294608842215549?s=20

历史项目记录:http://xiaohu.ai/

10月11日

📣 🔔小互的推特 10月11日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🤖 网易开发的虚拟练习口语的AI机器人:是个小程序,叫hi echo。

可以选择不同场景,旅游、职场、考试… 完了还能评分,不过看起来怪怪的。
🔗 https://x.com/xiaohuggg/status/1712114448096481427?s=20

2⃣️
🎮 虚拟现实拼图游戏:新一代的休闲游戏体验。

3⃣️
🚀 马斯克把 X的首页图标由鸟窝换成了火箭
🔗 https://x.com/xiaohuggg/status/1712088847319024018?s=20

4⃣️
🖼️ Frameright:智能图像处理的新时代。

5⃣️

🎥 Typeframes:

6⃣️
🧪 Rice大学新型材料

7⃣️

🌍 Public APIs:GitHub上的免费API集合

8⃣️
📚 Kosmos-2 by 微软

  • 这是一个多模态大语言模型,能处理文本、图像等数据。

  • 其能理解并生成与图像相关的描述,并可进行对象识别、视觉问答等功能。

🔗 https://x.com/xiaohuggg/status/1711978012793876513?s=20

9⃣️
🎨 Adobe的Firefly模型:设计从此变得更简单。

🔟
📱 抓紧更新ChatGPT客户端

可以直接获得Voice和DALL·E 3功能。
🔗 https://x.com/xiaohuggg/status/1711934048447406282?s=20

历史项目记录:http://xiaohu.ai/

10月10日

☕ 🔔小互的推特 10月10日更新

✨✨✨✨✨✨✨✨✨
1⃣️
🎧 ElevenLabs AI配音与语音翻译

2⃣️
🖼️ Stable Signature:Facebook的AI水印工具。

3⃣️
🤖 GenSim:使用GPT-4为机器人进行策略模拟训练。

4⃣️

📢 OpenAI科学家 @hwchung2 演讲

  • 模型足够大,某些能力才会显现

  • GPT-4 即将超越拐点并在其能力上实现显着跳跃

🔗演讲内容 https://t.co/lhatHcODHJ

🔗 https://x.com/xiaohuggg/status/1711714757802369456?s=20

5⃣️

🎨 GPT与创意

  • GPT提供了非特定创意人士的风格相似图像。

  • 令人惊讶的效果展示。

🔗 https://x.com/xiaohuggg/status/1711676800282358150?s=20

6⃣️

📝 DocsGPT

  • 开源GPT模型文档助手。

  • 支持自然语言查询,代码示例生成。

🔗 https://github.com/arc53/DocsGPT

🔗 https://x.com/xiaohuggg/status/1711657836252688443?s=20

7⃣️

💨 GPT Dall-E 3 申请通道

  • 快速申请,亲测有效。

🔗 https://t.co/BzboqdxjdC

🔗 https://x.com/xiaohuggg/status/1711587708089602170?s=20

8⃣️

🩺 Google Cloud's Vertex AI Search

  • 面向医疗保健领域的AI工具。

  • 提供高度定制的搜索、数据整合和先进的自然语言处理。

🔗 https://x.com/xiaohuggg/status/1711574737108041776?s=20

9⃣️

🖥️ BG Remover

  • AI背景去除工具,最多一次处理500张图。

  • 支持多种格式,精准去除背景。

🔗 https://icons8.com/bgremover

🔗 https://x.com/xiaohuggg/status/1711566021591777544?s=20

🔟

📊 #开源项目推荐:posthog

  • 开源产品分析平台。

  • 用户行为数据收集,A/B测试。

🔗 https://github.com/PostHog/posthog

🔗 https://x.com/dotey/status/1711237004078272681?s=20

1⃣️1⃣️

🤖 𝗖𝗵𝗮𝘁𝗚𝗣𝗧 𝗣𝗹𝘂𝘀 𝗗𝗔𝗟𝗟·𝗘³

  • 聊天式的需求沟通和修改。

  • 与设计师的沟通相似,但更为精准。

  • 提示:设计师可能面临的挑战。

🔗 https://x.com/xiaohuggg/status/1711410789586968997?s=20

历史项目记录:http://xiaohu.ai/

10月9日

☕ 🔔小互的推特 10月9日更新

✨✨✨✨✨✨✨✨✨

1⃣️

🖼️ SEED:一个先进的图像标记器,可赋予大语言模型视觉和绘图能力。

  • 由腾讯AILab-CVC团队开发,将图像转换为离散的视觉代码,SEED-LLaMA在多模态任务上表现出色。

🔗 https://github.com/AILab-CVC/SEED

🔗 https://x.com/xiaohuggg/status/1711362123761422687?s=20

2⃣️

🎙️ Copilot Voice:用嘴来写代码,哈哈哈哈!

  • 通过语音编写代码,直接用嘴指示,无需鼠标,支持代码导航和Visual Studio Code的控制。

🔗 https://x.com/xiaohuggg/status/1711342498503889239?s=20

3⃣️

🤖 情趣机器人已经提上日程,还要接入GPT。

  • 华中科技大学-交互机器人项目。

🔗PPT下载 https://t.co/jOW2BayBah

🔗 https://x.com/xiaohuggg/status/1711331388371439955?s=20

4⃣️

🎨 SD WebUI AnimateDiff (v1.9.0)更新功能。

  • Prompt Travel功能,驱动文本生成与变换图像。

  • 图像内容的动态变换

  • ControlNet 集成

🔗 https://github.com/continue-revolution/sd-webui-animatediff…

🔗 https://x.com/xiaohuggg/status/1711311620687937886?s=20

5⃣️

🤝 AutoGen:微软开发,通过代理通信实现复杂工作流。

  • 协调代理工作,多代理协作在一个工作流中。

🔗 https://x.com/xiaohuggg/status/1711285267876008389?s=20

6⃣️

🎨 LCMs:新型图像生成模型,生成高分辨率图像。

  • 快速推理,生成高质量图像,2~4步生成768 x 768图像。

  • LCMs可以从任何预训练的Stable Diffusion(SD)模型中提炼出来

🔗 https://latent-consistency-models.github.io

🔗 https://x.com/xiaohuggg/status/1711250631737163986?s=20

7⃣️

🎵 Sonoteller:音乐AI分析引擎,能“听懂”音乐。

  • 提供歌曲的内容和意境、音乐属性等信息。

🔗 http://sonoteller.ai

🔗 https://x.com/xiaohuggg/status/1711227279261704580?s=20

8⃣️

👥 Text2Human:通过文本描述生成人体图像。

  • 生成具有特定属性的人体图像,灵活、个性化生成。

  • 还贡献了一个具有丰富多模态注释的大规模高质量数据集。

🔗 https://x.com/xiaohuggg/status/1711208875968610379?s=20

9⃣️

📝 Vditor:免费开源的Markdown编辑器。

  • 支持三种编辑模式:所见即所得、即时渲染、分屏预览

🔗 https://x.com/xiaohuggg/status/1711199599531381148?s=20

历史项目记录:http://xiaohu.ai/

10月8日

🍙 🔔小互的推特 10月8日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🧠Zero2Story:一个互动故事生成器,从零开始创建一键创建互动故事,包括插画和背景音乐。

  • 用户可以自定义故事的类型、背景、地点、情感氛围,以及角色的各种属性。然后,系统会根据这些设置生成故事。

  • 同时允许用户在故事生成过程中做出选择,以影响故事的走向。

  • 它还可以生成与故事相关的背景图像和音乐。这一切都是通过与 PaLM API、Stable Diffusion 和 MusicGen 的集成来实现的。
    🔗https://github.com/coding-pot/Zero2Story
    🔗https://x.com/xiaohuggg/status/1711016688333070646?s=20

2⃣️
📸DA-CLIP:一种通用的图像修复视觉-语言模型。

3⃣️
🌌Moonvalley:一个新型的文本到视频生成模型,生成质量非常高。

4⃣️
🎨PIXART-α:是一个基于 Transformer 的文本到图像生成模型。

5⃣️
🎥Webcam Motion Capture:通过你的电脑或智能手机的摄像头即可完全控制和制作你专属的3D虚拟形象。
🔗https://x.com/xiaohuggg/status/1674402628288266240?s=20

6⃣️
📚http://Shortbread.ai:一键漫画生成平台。

7⃣️
💽Llama 2 Everywhere:一个可在各种设备上运行的、独立的、二进制可携带、可引导的 AI 操作系统。

  • 可在各种设备上运行,从二手Chromebook到企业级硬件。

  • 在联网和离线的情况下都可运行。

  • 通过多样化的文本来源进行训练,如教科书和开放图书。

🔗https://github.com/trholding/llama2.c
🔗https://x.com/xiaohuggg/status/1710864796227396028?s=20

8⃣️

👧美少女OPInterpreter:基于Open Interpreter驱动的VTuber AI美少女。

  • 观众可通过YouTube Live与其实时聊天。

  • 使用WebSocket进行实时通信,提供即时的用户反馈。

  • 适用于创建VTuber场景,提供实时的交互体验。

  • 观众发送消息后,WebSocket实时接收并通过Open Interpreter处理,再实时传回观众。

🔗https://x.com/xiaohuggg/status/1710853151069511971?s=20

历史项目记录:http://xiaohu.ai/

10月7日

🎉 🔔小互的推特 10月7日更新

✨✨✨✨✨✨✨✨✨

1⃣️

🎤 Elsa Speak: 革命性的AI英语口语教练!

  • 与Elsa Speak对话,它如同你的私人英语教练,找出你的每一个小错误。

  • 从商务到日常,涵盖了各种实用话题,感觉像是在与全球英语母语者闲聊。

  • 还在死记硬背? Elsa帮你实战练习。

🔗 https://elsaspeak.onelink.me/rEuf/tqkeqwml

🔗 https://x.com/xiaohuggg/status/1710613957466304792?s=20

2⃣️

🧠 LLaVA:当大型语言模型遇上视觉!

  • 能看,能懂,能聊,LLaVA为你解读图像与文本,为AI界翻开新篇章。

🔗 https://llava-vl.github.io

🔗 https://x.com/xiaohuggg/status/1710487220300497168?s=20

3⃣️

🔢 MathCoder:数学+编码,一次搞定!

  • 一种让大型语言模型在数学上胜过GPT-4的方法。数学从未如此有趣!

🔗 https://x.com/xiaohuggg/status/1710582896355102954?s=20

4⃣️

❓ GPT的两面性?

  • 惊喜! GPT不仅会给答案,现在还会给选项!

🔗 https://x.com/xiaohuggg/status/1710573340505903344?s=20

5⃣️

👁️ DREAM: 你的大脑是个艺术家!

  • 基于大脑活动重塑你所见之景,带你进入梦境之中。

🔗 https://weihaox.github.io/DREAM/

🔗 https://x.com/xiaohuggg/status/1710524502717890695?s=20

6⃣️

AnimateDiff:创意爆棚的动态设计!

  • 为你的设计注入生命,快来体验这种艺术吧!

🔗 https://x.com/xiaohuggg/status/1710509589995868197?s=20

7⃣️

👶 CryAnalyzer - 婴儿哭声分析器:

  • 识别超过20000种婴儿哭闹声音,5秒内给出原因。

🔗 https://x.com/xiaohuggg/status/1710500470203330595?s=20

8⃣️

🧘‍♀️ Thinking for Doing”(T4D)

  • LLMs如今不仅能读懂你的心,还会为你采取行动。

🔗 https://arxiv.org/abs/2310.03051

🔗 https://x.com/xiaohuggg/status/1710480036166574231?s=20

9⃣️

🔍 Rerun: 是一个用于处理和可视化多模态数据流的通用框架

  • 可以将(如图像、文本、声音等)等多模态的数据流可视化

🔗 https://x.com/xiaohuggg/status/1710475092579475704?s=20

🔟

🔧 OpenAI UI:微调,从未如此简单。

  • 无需编码,直接在UI中创建任务,AI微调变得触手可及。

🔗 https://x.com/xiaohuggg/status/1710452987590852908?s=20

历史项目记录:http://xiaohu.ai/

10月6日

🎉 🔔小互的推特 10月6日更新

✨✨✨✨✨✨✨✨✨

1⃣️

📖 Manga-Image-Translator:一个开源的漫画图片翻译器

  • 能够自动翻译漫画图像中的文本,当然普通的图片也可以。翻译完成后在图像在原位置替换译文。干净简洁,速度很快。

  • 主要支持日语,汉语、英文和韩语。

🔗 http://cotrans.touhou.ai

🔗 https://x.com/xiaohuggg/status/1710264008140619781?s=20

2⃣️

🧠 BrainMagick:通过分析脑电活动来推断一个人正在想什么,并将其转化为语音。

  • 由Facebook Research 研究的项目。

  • 该研究使用非侵入性的电子脑图(EEG)和磁脑图(MEG)技术。

🔗 https://x.com/xiaohuggg/status/1710257128412438717?s=20

3⃣️

🤖 RH20T :一个由上海交通大学研发的机器人数据集

  • 数据集包括了超过 110000 个与机器人操作相关的序列。

  • 旨在解决机器人在开放领域如何获取多样化和泛化技能的问题。

🔗 https://rh20t.github.io

🔗 https://x.com/xiaohuggg/status/1710225613444042856?s=20

4⃣️

📸 Screenshot Contacts:只需要截图,即可帮你链接社交账户,一个神器的思路...

  • Screenshot Contacts主要用于组织和管理社交媒体上的联系人信息。

  • 还可以按社交平台、名称或日期对联系人进行排序和筛选。

🔗 https://x.com/xiaohuggg/status/1710203781378621617?s=20

5⃣️

🎨 Instruct-NeRF2NeRF:通过文本指令来编辑NeRF生成的3D场景。

  • 该技术使用一个名为 InstructPix2Pix 的图像条件扩散模型。

🔗 https://instruct-nerf2nerf.github.io

🔗 https://x.com/xiaohuggg/status/1710186106514502059?s=20

6⃣️

🤖 @DisneyResearch 在 #IROS2023 上展示了他们经过Reinforcement Learning(强化学习)的机器人。

  • 机器人的行走在一台PC上仅用了几个小时就完成了模拟训练。

🔗 https://x.com/xiaohuggg/status/1710176990383452275?s=20

7⃣️

📱 Google Pixel 8内置的AI功能介绍:

  • 相机相册、音频编辑、视频处理、语音交互、智能呼叫、内容摘要、智能键盘等。

🔗 https://x.com/xiaohuggg/status/1710166450110087508?s=20

8⃣️

🌌 之前介绍的Instaverse 推出了Hugging Face的体验环境!

  • Instaverse可以将任何 2D 图像转换为一个完整的 3D 世界。

🔗 https://huggingface.co/spaces/ilumine-AI/Retro-to-3D

🔗 https://x.com/xiaohuggg/status/1710134986236723276?s=20

9⃣️

🛠 Spline发布了一个名为“Variables”的新功能(目前处于Beta测试阶段)。

  • 这个功能为用户提供了一种全新的方式来创建3D交互式体验。

🔗 http://spline.design

🔗 https://x.com/xiaohuggg/status/170992892219

历史项目记录:http://xiaohu.ai/

10月5日

🎉 🔔小互的推特 10月5日更新

✨✨✨✨✨✨✨✨✨

1⃣️
📸Google Photos 新 AI 功能:

  • Best Take功能:自动选择合照中的最佳表情。

  • Zoom Enhance:放大照片时,AI智能填充像素之间的间隙。

  • Audio Magic Eraser:视频中的声音清除功能,提供清晰的声音质量。

  • Magic Eraser:智能消除照片中的干扰因素。
    🔗 https://x.com/xiaohuggg/status/1709870566629576842?s=20

2⃣️
😃http://emoji.is 表情生成工具:

3⃣️
🖥️Perplexity推出pplx-api:

4⃣️
🧠麻省理工大学研究大型语言模型:

5⃣️
⌚Google Pixel Watch 2 发布:

6⃣️
🚘 #Cybertruck 拖着一个Rocket Engine

历史项目记录:http://xiaohu.ai/

10月4日

🎉 🔔小互的推特 10月4日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🗣️孙正义的AI预测:

2⃣️
🎭RoleLLM - 专业角色扮演的AI:

3⃣️
🤖𝗥𝗧-𝗫 - 通用AI机器人模型:

4⃣️
🌍Luma AI的交互式场景:

5⃣️
🔇Acoustic Robot Swarm - 声学机器人:

6⃣️
🌐Arc浏览器与AI的融合:

7⃣️
🌍Framer - Localization with AI:

8⃣️
📿Rewind Pendant - AI可穿戴设备:

9⃣️

⌚️每24小时可以免费申请GPT api的

历史项目记录:http://xiaohu.ai/

10月3日

📌 🔔小互的推特 10月3日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🎥SMPLer-X - 视频人体动作提取:

2⃣️
🚀Streaming-Llm - 大型语言模型升级:

3⃣️
🔍LMM的黎明 - GPT-4V(ision)探索:

  • 微软发布了关于GPT-4V的166页报告。

  • 报告详细探讨了GPT-4V的功能、用法和未来方向。
    原文: http://arxiv.org/abs/2309.17421

    翻译:<u>https://weibo.com/ttarticle/p/show?id=2309404952763347108084</u>

🔗 https://x.com/xiaohuggg/status/1708881320645103920?s=20

4⃣️
🎬CCEdit - 视频编辑框架:

5⃣️
📱Stable LM 3B - 笔记本与手机的语言模型:

6⃣️
🗣️Imitator - 3D面部动画重建:

历史项目记录:http://xiaohu.ai/

10月2日

📌 🔔小互的推特 10月2日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🌐拉斯维加斯的大圆球:

2⃣️
📊Gossip - 在线PPT创建工具:

  • 高效的用户界面解决了传统PPT的问题,如拖动幻灯片的麻烦。

  • 通过大纲直接生成PPT。界面包括“想法”、“大纲”、“元素”和“样式和变量”。
    🔗 在线体验:https://gossip.ink/

🔗 https://x.com/xiaohuggg/status/1708766583785656421?s=20

3⃣️
🎥教程:使用 Animatediff-Cli-Prompt-Travel 创建动画。

4⃣️
🔬Dario Amodei 离开 OpenAI 并创建 Anthropic:

5⃣️
🌍小互在瑞丽

6⃣️
🔧EasyFill 插件:

7⃣️
🎨DreamGaussian:

8⃣️
🎬**#周末影院 爱有来生**:

历史项目记录:http://xiaohu.ai/

10月1日

📌 🔔小互的推特 10月1日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🎨 Colorpik AI Pen:

  • 一支智能笔,可以绘制超过1600万种颜色。

  • 不仅可以在数字屏幕上工作,还可以在纸上绘图或书写。

  • 内置颜色传感器可以根据RGB传感器捕获的数据准确地混合墨水。

  • 可以扫描任何颜色并立即开始在纸上绘图或书写。
    🔗 http://colorpik.ai
    🔗 https://x.com/xiaohuggg/status/1708482259651809670

2⃣️
🧠 RenderMe-360:

3⃣️
🎨 Bing 上线 DALL-E 3:

4⃣️
🤖 AiNex:

5⃣️
💻 现在用ChatGPT的过程中:

6⃣️
🖼️ RealFill:

历史项目记录:http://xiaohu.ai/

9月30日

📌 🔔小互的推特 9 月 30日更新

✨✨✨✨✨✨✨✨✨
1⃣️
🖼️RealFill: 图像补全的生成模型:

2⃣️
📡AppListener: 通过Wi-Fi监视应用活动:

3⃣️
⚡隔空无线充电与Nikola Tesla:

4⃣️
🤖华盛顿大学的光与无线电波驱动的机器人:

5⃣️
🎨Poe上线的SDXL机器人:

6⃣️
📚提升ChatGPT翻译质量的prompt:

历史项目记录:http://xiaohu.ai/

9月29日

📌 🔔小互的推特 9 月 29日更新

✨✨✨✨✨✨✨✨✨

1⃣️

📄 PDFTriage:PDF分诊技术

  • 由斯坦福大学和Adobe研究团队共同开发,解决了ChatGPT处理长篇、结构复杂文档时的问题。

  • PDFTriage先了解文档结构,然后找到与用户问题相关的部分,最后用语言模型生成答案。

  • LLM在处理长篇、结构复杂文档时存在的问题:上下文窗口限制、文档结构忽略、查询不准确、信息获取不全面。

  • 用户反馈显示,PDFTriage在多页任务中效果更好。

  • 🔗 (https://arxiv.org/abs/2309.08872)

  • 🔗 (https://x.com/xiaohuggg/status/1707663867307065584?s=20)

2⃣️

🎨 3D Gaussian Splatting技术

3⃣️

🎥 教程:使用 ComfyUI AnimateDiff 生成动画视频

4⃣️

🎁 ChatGPT Plus用户福利

5⃣️

🕸️ 前端的噩梦:GPT-4V人工智能代理

6⃣️

🤖 Hugging Face教程:创建AI聊天机器人

7⃣️

🖼️ Shopify的SDXL背景替换工具

8⃣️

🔬 ChatGPT细胞结构教学

9⃣️

📱 苹果CoreML版SDXL

🔟

🌐 Claude2镜像站

🔗 http://finechat.ai/

🔗 (https://x.com/Cydiar404/status/1706821587130032553?s=20)

1⃣1⃣️

💪 Rex.fit:AI健身和营养教练平台

历史项目记录:http://xiaohu.ai/

9月28日

📌 🔔小互的推特 9 月 28日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🖼️NeuRBF:

2⃣️
🖼️Gigapixel Image:

3⃣️
🎮LEGO Bricktales:

4⃣️
🎥Jurassic Park Anime Edition:

5⃣️
📡Wiffract:

6⃣️
🤖ChatBots:

7⃣️
🕶️Ray-Ban Meta AI Glasses:

8⃣️
😀EmojiGen:

9⃣️
🌐Llama Ecosystem by Meta:

🔟
🎨Photoshop Online with Firefly AI:

1⃣1⃣️
🤖Meta AI Chatbot:

1⃣2⃣️
🕶️Meta's AI Glasses:

1⃣3⃣️
🤖GPT-4 Online Functionality:

1⃣4⃣️
🎙️Heygen:

历史项目记录:http://xiaohu.ai/

9月27日

📌 🔔小互的推特 9 月 27日更新

✨✨✨✨✨✨✨✨✨

1⃣️
📡Radio2Tex:

2⃣️
🎨Repainting 3D Assets:

3⃣️
📱AskPDF:

4⃣️
🖼️VQGAN:

5⃣️
🌐GPT-4V 图像能力:

6⃣️
📺教程:ComfyUI AnimateDiff

7⃣️
🔌换了C口到iPhone:

8⃣️

⌚WHOOP Coach:

  • WHOOP推出基于GPT 4的首款可穿戴设备。

  • 可实时用50多种不同的语言回应用户的健康和健身问题。

  • 根据用户数据提供有关睡眠、恢复和锻炼强度的见解和建议。

🔗https://x.com/xiaohuggg/status/1707035724489662492?s=20

历史项目记录:http://xiaohu.ai/

9月26日

📗 🔔小互的推特 9 月 26日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🎮人生重开模拟器游戏-作者陈财猫:

2⃣️
📲Bezel:

3⃣️
🌍PanoGen:

4⃣️
🚶UnitedHuman:

5⃣️
🐦宝玉的推文:

6⃣️
🎨BLIP-Diffusion:

7⃣️
👁️GPT-4V 视觉能力:

8⃣️
🎧Spotify 新功能:

9⃣️
🔥李彦宏的评论:

历史项目记录:http://xiaohu.ai/

📗 解释

7⃣️
👁️GPT-4V 视觉能力:

1⃣️
🔍GPT-4V 视觉识别能力:

  • 物体检测:能够识别如汽车、动物、家居用品等常见物体。

  • 文本识别:具备光学字符识别 (OCR) 功能,能够转录图像中的文本为机器可读文本。

  • 人脸识别:能够定位并识别图像中的人脸,还能根据面部特征分析性别、年龄和种族属性。

  • 验证码解决:具备解决基于文本和图像的验证码的能力。

  • 地理定位:能够识别风景图像中的城市或地理位置。

  • 复杂图像:在复杂图表、医学扫描或多重叠加文本的图像中可能遇到难题。

2⃣️
⚠️GPT-4V 视觉推理局限性:

  • 空间关系:可能难以理解图像中对象的空间布局和位置。

  • 重叠对象:可能难以区分重叠的对象。

  • 背景/前景:可能难以正确区分图像的前景和背景对象。

  • 遮挡:可能难以识别被遮挡的对象。

  • 小细节:可能会错过或误解图像中的小物体或复杂细节。

  • 上下文推理:可能难以深入分析图像的上下文和描述对象之间的关系。

  • 置信度:可能会错误地描述对象关系,即使没有图像支持。

9月25日

💡 🔔小互的推特 9 月 25日更新

✨✨✨✨✨✨✨✨✨

1⃣️
📊GPT-4V(ision) Update:

2⃣️
🎉ChatGPT Voice & Image Update:

3⃣️
🔍Prompt Recommendation:

4⃣️
🤖LEAP Hand:

5⃣️
🚀丰田研究院新技术:

6⃣️
💼亚马逊 & Claude 母公司Anthropic 投资:

7⃣️
📈百川模型:

8⃣️
🎞️AnimateDiff 更新:

9⃣️
🖼️DREAMLLM:

🔟
🎬Pika labs 新功能:

小互的新域名:http://xiaohu.ai/

9月24日

💡 🔔小互的推特 9 月 24日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🐁MouseGoggles:

2⃣️
📱手机语音笔记AI整理:

3⃣️
📖Linkwarden:

4⃣️
🌐Webrecorder:

5⃣️
🎨AI 图像修复工具、模型大全:

6⃣️
🤖CoDi:

7⃣️
🤖特斯拉的 Optimus 机器人:

8⃣️
🚀Pieter Levels @levelsio 的成功故事:

  • 创建了 PhotoAI、InteriorAI、NomadList 和 RemoteOK。

  • 这 4 个 SaaS 每月的收入约为 200,000 美元。

  • 一共推出了 70 多个 SaaS, 但只有这 4 个产生了收入。

  • 他的故事告诉我们:毅力、智慧、韧性都是成功的关键。
    🔗:https://x.com/xiaohuggg/status/1705612146720325867?s=20

历史记录:http://waytoagi.com/xiaohu

9月23日

💡 🔔小互的推特 9 月 23日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🎮教程:使用Hugging Face Transformers 和 Unity Sentis轻松创建游戏AI NPC:

2⃣️
🖼️将任意两张图像合成新的图像:

3⃣️
🎬**#周末影院**:

4⃣️
🎨SVGCustomization:

5⃣️
📈FreeU:

6⃣️
🔊支持100多种TTS语音的免费文本转语音工具:

9月22日

💡 🔔小互的推特 9 月 22日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🎬 StoriaBoard:

2⃣️
🤖 数字主播:

3⃣️
📜 LongLLaMA:

4⃣️
📱 WeChat-AIChatbot:

5⃣️
📊 Dr. Jim Fan:

6⃣️
🖼️ OpenAI DALL-E 3:

7⃣️
🎥 Genmo Replay v0.1:

8⃣️
🎙️ 新版Alexa语音助手:


📰凌晨大更新

最近这些海外大厂有点杀疯了,轮番AI轰炸😂

昨晚就有微软365和YouTube的新产品发布会

1⃣️

💻微软365AI落地新功能看了超心动

🔥 copilot加入全家桶9月26日起海外可以正式使用

https://x.com/xiaohuggg/status/1704886721912221960?s=20

2⃣️

🎬 YouTube AI工具新介绍:

🪄 AI Video with Dream Screen:键入提示,轻松更换背景。适用于Shorts。

📱 Free Editing App YouTube Create:免费移动应用,简单编辑高质量视频。

💡 Personalized AI Insights:在YouTube Studio根据频道和趋势获得视频建议,帮助激发创意。

🌍 Auto-Dubbing with Aloud:使用AI轻松将视频翻译并配音成其他语言。

🎶 Assistive Music Search:描述视频内容,快速找到匹配的免费背景音乐。

https://x.com/xiaohuggg/status/1704903159054000348?s=20

9月21日

💡 🔔小互的推特 9 月 21日更新

✨✨✨✨✨✨✨✨✨

1⃣️
📊 Flourish:

2⃣️
💻 Intel新芯片:

3⃣️
📚 MAmmoTH:

4⃣️
🚴 自行车安全气囊:

5⃣️
📑 红杉资本报告:

6⃣️
📞 ChatGPT 驱动的AI电话呼叫API:

7⃣️
🎨 OpenAI DALL-E 3:

8⃣️
💬 GitHub Copilot Chat:

历史项目记录:http://waytoagi.com/xiaohu

9月20日

💡 🔔小互的推特 9 月 20日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🎨 Expressive Text-to-Image:

2⃣️
🔧 LightDiffusionFlow:

3⃣️
📹 TikTok AI标签更新:

4⃣️
🧠 Neuralink人体临床试验:

5⃣️
🧠Q-Transformer:

6⃣️
🎙️ElevenLabs "Projects" 功能:

7⃣️
🎨使用Stable Diffusion XL创建颠倒画:

8⃣️
🧬AlphaMissense:

9⃣️
🔬AI增强现实显微镜(ARM):

9月19日

💡 🔔小互的推特 9 月 19日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🌐 Google Bard Extension:

2⃣️
🔄 Google Bard 更新:

3⃣️
🎨 3D 免费超高清头部模型:

4⃣️
🤖 Ascento:

5⃣️
📚 BookStash:

6⃣️
🎬 《24个比利》:

7⃣️
💬 微信新功能:

8⃣️
💡 OpenAI GPT-3.5-Turbo-Instruct:

9⃣️
🚶♂️ LAMA:

🔟
🖥️ mnml.ai:

1⃣1⃣️
🧠 Google Gemini:

历史记录:http://waytoagi.com/xiaohu

9月18日

☕ 🔔小互的推特 9 月 18日更新

✨✨✨✨✨✨✨✨✨

1⃣️ 🖼️DeePoint

2⃣️ 🤟手语翻译算法

3⃣️ 🎨Midlibrary

4⃣️ 📚Linear Book Scanner

5⃣️ 🎥ProPainter

6⃣️ 📖古登堡有声书开放项目

7⃣️ 😀Google搜索“emoji kitchen”

8⃣️ 🌀中世纪村庄螺旋

历史记录合集:http://waytoagi.com/xiaohu

9月17日

☕ 🔔小互的推特 9 月 17日更新

✨✨✨✨✨✨✨✨✨

1⃣️
💻AirCode:

  • 在线编程工具,支持实时Node.js函数编写

  • 内置数据库和文件存储功能

  • 无需本地安装或配置,直接在浏览器编程

  • 主要功能:云同步编码、TypeScript支持、在线调试、一键发布

  • 示例应用包括ChatGPT集成的AI流式响应、Shopify数据同步至Google表格等
    🔗:http://aircode.io
    🔗https://x.com/xiaohuggg/status/1703404942365729224?s=20

2⃣️
🎮Nvidia Code Llama:

3⃣️
📚省流:

4⃣️
🎓Class Central:

5⃣️
🤖IncarnaMind:

6⃣️
🎭木偶应用程序:

历史记录合集:http://waytoagi.com/xiaohu

9月16日

☕ 🔔小互的推特 9 月 16日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🎬Sync. labs 视频同步:

2⃣️
🎥Flowjam 产品视频库:

3⃣️
🖼️OmnimatteRF 视频抠图方法:

4⃣️
🔍芯片的旅程:

5⃣️
🎞️M3DDM 视频外部绘制模型:

6⃣️
📸Idify 证件照转换工具:

7⃣️
💼马斯克的运营算法:

9月15日

☕ 🔔小互的推特 9 月 15日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🔊音频剪辑克隆声音:

2⃣️
👨ChatGPT医学诊断:

3⃣️
🎬ReliTalk:

4⃣️
🔍NoteAI.com搜索总结工具:

5⃣️
🦁生活格言:

6⃣️
📸MagiCapture:

7⃣️
🍃Generative Image Dynamics:

8⃣️
💻v0.dev UI界面工具:

9⃣️
🚫面试作弊插件:

历史记录:http://waytoagi.com/xiaohu

9月14日

🌰 🔔小互的推特 9 月 14日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🚀马斯克与Twitter:

2⃣️
🚗自动驾驶解说员:LINGO-1 by Wayve:

  • LINGO-1 提供自动驾驶行为的实时解说

  • 能够结合视觉、语言和行动进行解释

  • 提高人们对驾驶模型的理解
    🔗:https://t.co/DkOlrcblJH

3⃣️
👗Multimodal Garment Designer:

  • 多模态服装设计师

  • 结合文本、人体姿势和草图生成时尚图像

  • 新技术在时尚设计中的应用
    🔗GitHub:https://t.co/SJDdxFDOOO
    🔗论文:arxiv.org/abs/2304.02051

4⃣️
📊a16z的GenAI网络产品分析:

  • 2023年6月的前50名GenAI网络产品月访问量排名

  • 主要发现与产品趋势

  • ChatGPT依然遥遥领先
    🔗:https://t.co/LaGB5sm2oI

5⃣️
🛠️Replit推出ModelFarm工具:

  • 一个在线的集成开发环境平台

  • 允许快速构建Gen AI应用程序

  • 提供流式传输,更加流畅的用户体验
    🔗:https://blog.replit.com/modelfarm

6⃣️
🖼️Adobe Firefly上线:

7⃣️
🎥AnimateDiff:动画生成器:

  • 将文本到图像(T2I)模型扩展为动画生成器

  • 用户无需复杂调整,即可生成真实连贯的动画

  • 与CivitAI或Huggingface的T2I模型无缝集成
    🎦项目及演示:animatediff.github.io
    🔖论文:arxiv.org/abs/2307.04725
    🔗:https://x.com/xiaohuggg/status/1702160559603683741?s=20

8⃣️
🛠️AI开源项目推荐:Prompt flow:

9⃣️
🤖人工智能大佬齐聚:

🔟
💼Supademo:快速创建产品交互演示:

历史记录:http://waytoagi.com/xiaohu

9月13日

🏆 🔔小互的推特 9 月 13日更新

✨✨✨✨✨✨✨✨✨

1⃣️
📖推荐文章:

2⃣️
⌚Apple Watch的Double Tap功能宣传视频:

3⃣️
🔢MathGLM:

4⃣️
👾墨西哥众议院听证会直接开箱外星人尸体:

5⃣️
🤖Robot Parkour Learning:

6⃣️
🎶Stability AI推出AI生成音乐平台:Stable Audio:

7⃣️
📷PhotoVerse:

历史项目记录:http://waytoagi.com/xiaohu

9月12日

🌟 🔔小互的推特 9 月 12日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🎮 Roblox AI 工具: Roblox Assistant

  • 在线游戏设计开发平台 @Roblox 新发布的人工智能生成式工具。

  • 功能:通过文本提示帮助创作者构建虚拟世界。将来还会有自我学习和游戏编码能力。

  • 预计上线时间:2023 年底/2024 年初。
    🔗 https://x.com/xiaohuggg/status/1701611368733155651?s=20

2⃣️
🎬 Runway 导演模式

3⃣️
🎥 图片变视频工具 @pika_labs 更新

  • 新的相机效果,包含放大、缩小、左右、上下平移等。

  • 需要先输入指令,再添加图片去生成。

  • 示例指令:Zoom with(变焦)、-camera zoom in/out、Pan using(平移)、-camera pan up/down/left/right。
    🔗 https://x.com/MooenyChu/status/1701413078251045238?s=20

4⃣️
🖼️ AniPortraitGAN

5⃣️
🎨 C站 新功能:Civitai 图像生成器

6⃣️
📚 Alexandria:Tenet

7⃣️
🖼️ Trickle

8⃣️
💻 CodeFuse:蚂蚁推出的代码大模型

历史项目记录:http://waytoagi.com/xiaohu

9月11日

☕ 🔔小互的推特 9 月 11日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🤖 AI开源项目推荐: AgentVerse

  • 由清华大学、北邮等高校研究团队发布的AI多智能体协作模拟框架

  • 模拟多种社会实验场景,如NLP课堂、囚徒困境、软件设计等
    🔗:github.com/OpenBMB/AgentVerse
    🔗Tweet:twitter.com/xiaohuggg/status/1701234611806691810?s=20

2⃣️
🎨 T2I-Adapter-SDXL-Sketch 模型

  • 腾讯针对草图进行的优化模型

  • 快速体验: 打开应用 ➡️ 画两个圈圈 ➡️ 输入Prompt:“A horse” ➡️ 选择“电影”风格 ➡️ 点击运行
    🔗Tweet:twitter.com/xiaohuggg/status/1701219182568960168?s=20

3⃣️
📱 Procreate Dreams

  • iPad上的全新动画设计应用

  • 功能丰富:关键帧、触摸操作流程、逐帧编辑、音频和视频支持等

  • 价格:$19.99,将于11月22日发布
    🔗:procreate.com/cn/dreams
    🔗Tweet:twitter.com/xiaohuggg/status/1701210639002435832?s=20

4⃣️
🔧 Meshy.ai

  • 用于3D创意的AI生成工具箱

  • 功能:2D转3D纹理、文本提示生成3D纹理、AI3D纹理工具等

  • 使3D工作流程更加高效
    🔗:Meshy.ai
    🔗Tweet:twitter.com/xiaohuggg/status/1701194691973386443?s=20

9月10日

☕ 🔔小互的推特 9 月 10日更新

✨✨✨✨✨✨✨✨✨

1⃣️

🤖 AnimateDiff & IP Adapter:

  • 真人转换动漫技术

🔗 详情:https://twitter.com/xiaohuggg/status/1700764969154089276?s=20

2⃣️

⚖️ X(Twitter)诉加州

  • 针对社交媒体内容审核法的诉讼

  • 理由:该法律侵犯言论自由,强制公司披露打击虚假信息、骚扰、仇恨言论和极端主义的政策

🔗 详情:https://twitter.com/xiaohuggg/status/1700727529227825281?s=20

3⃣️

🦜 鹦鹉视频网站:

  • 创意点子,有市场潜力

🔗 详情:https://twitter.com/xiaohuggg/status/1700711316233810159?s=20

4⃣️

📸 EasyPhoto:类似妙鸭相机的开源产品

  • 基于SD Webui UI插件

  • 功能:通过上传5-20张个人半身照,学习面部特征并生成AI人像分身

  • 多人生成、多种预测模型支持、用户友好界面

  • 使用环境:Windows 10和Linux

  • 磁盘需求:大约60GB

  • 操作简单:上传照片进行模型训练,选择用户ID和模板生成人像

  • 技术细节:基于稳定扩散模型,使用少量用户图像训练数字二重身

🔗 详情:https://twitter.com/xiaohuggg/status/1700188771210441059?s=20

9月9日

☕ 🔔小互的推特 9 月 9日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🍎iOS 17 Object Capture功能:

2⃣️

🌐Hiber3D - 使用自然语言创建3D世界:

3⃣️

🤖Sequential Dexterity - 机器人乐高构建:

4⃣️

🎥Pika Labs AI视频生成工具:

5⃣️

🎥 Runway 镜头控制更新
Gen2:现支持视频镜头的平移、旋转和缩放功能,且能够控制镜头的移动方向速度。
🔗 详情:https://twitter.com/xiaohuggg/status/1700503744205799554?s=20

9月8日

☕ 🔔小互的推特 9 月 8日更新

✨✨✨✨✨✨✨✨✨

1⃣️

🔬微软 & Paige AI

  • 合作构建最大的癌症检测AI模型

  • 功能:Paige基于大量病理切片训练,帮助病理学家检测多种癌症

  • 与Microsoft结合,利用其超级计算基础设施进行大规模模型训练

🔗:https://t.co/rY53eG7eIh

🔗https://twitter.com/xiaohuggg/status/1700157221160566893?s=20

2⃣️

🎵Suno音乐生成

  • 文字生成音乐AI模型Suno发布重大更新:Chirp v1

  • 功能:支持50多种语言、增强音频质量、选择音乐风格、标签控制歌曲结构、更快生成速度

🔗https://twitter.com/xiaohuggg/status/1700133814096498922?s=20

3⃣️

💰蚂蚁集团金融大模型

  • 基于自研大模型深度定制金融服务

  • 功能:提供理财、保险领域的行情分析、资产规划、持仓诊断等

🔗https://twitter.com/xiaohuggg/status/1700076677588820103?s=20

4⃣️

📹HeyGen视频翻译

  • 一键将视频语音翻译为其他语言,保持唇型与发音同步,语音克隆功能

  • 功能:支持多种输入语言,但中文仅为输入不支持输出

🔗体验:http://labs.heygen.com/video-translate

🔗https://twitter.com/xiaohuggg/status/1700020505141788924?s=20

5⃣️

🏆AI生成格莱美奖歌曲

  • 歌曲“Heart on My Sleeve”由AI生成,提交格莱美奖评选

  • 功能:模仿Drake和The Weeknd风格

🔗https://twitter.com/xiaohuggg/status/1700056620359880711?s=20

6⃣️

💡Imbue融资与目标

  • AI公司Imbue完成2亿美元B轮融资

  • 功能:专为推理而定制的大型模型,目标创建实用AI代理

🔗https://twitter.com/xiaohuggg/status/1700029790022185324?s=20

7⃣️

👁️眼动分类

  • 介绍四种基本眼动类型

  • 功能:描述眼睛的构造和运动状态

🔗https://twitter.com/xiaohuggg/status/1700011115714101391?s=20

8⃣️

🕶️Apple Vision Pro体验

  • 用户分享对Apple Vision Pro的感受

  • 功能:提供先进的视觉体验

🔗https://twitter.com/xiaohuggg/status/1699977890216165739?s=20

9⃣️

💸Claude收费公告

  • Claude开始收费,价格为一个月20美金

🔗https://twitter.com/xiaohuggg/status/1699794713447108786?s=20

历史记录:http://waytoagi.com/xiaohu

9月7日

📣 🔔小互的推特 9 月 7日更新

✨✨✨✨✨✨✨✨✨

1⃣️
🎥**《埃隆·马斯克传》2023 年 9 月 12 日全球同步出版**:

  • 作者:Walter Isaacson

  • 马斯克首次公开双胞胎子女照片,孩子母亲为Shivon Zilis

  • 马斯克现有孩子情况:与第一任妻子5个、与Grimes 2个、与Zilis 2个

  • 书中描述:马斯克希望在AI摧毁地球文明前在火星建立殖民地
    🔗:https://twitter.com/xiaohuggg/status/1699728696595402990?s=20

2⃣️
🚫GPT使用提醒:

3⃣️
📱FaceFusion:

4⃣️
💼AI开源项目推荐:photoshot:

5⃣️
🎮Rokoko Vision:

6⃣️
🖼️SMPLitex:

7⃣️
💻腾讯混元大模型:

8⃣️
🌍上海外滩大会:

9⃣️
🛠️插件推荐:

9月6日

📣 🔔小互的推特 9 月 6日更新

✨✨✨✨✨✨✨✨✨

1️⃣

🤖群聊总结机器人升级:

  • 版本:从文字输出升级到语音版

  • 特点:自动总结群聊信息

  • 开发者:@aoao_eth

  • 开源工具,可自行体验

🔗GitHub:https://t.co/2M6zrXu2Bk

🔗https://twitter.com/xiaohuggg/status/1699427097947595142?s=20

2️⃣

📷Artisse

  • AI照片生成应用

  • 上传15张照片训练AI

  • 使用文本或图像提示生成新照片

🔗https://twitter.com/xiaohuggg/status/1699321593254863302?s=20

3️⃣

🧠Falcon 180B

  • 性能逼近GPT4

  • 1800亿参数,3.5万亿标记训练

  • 在Hugging Face排名首位

  • 性能超越LLaMA 2

🔗官网:https://falconllm.tii.ae

🔗https://twitter.com/xiaohuggg/status/1699440217000681643?s=20

4️⃣

🎮Reverie

  • 虚幻引擎AI工具

  • 提取图片中的照明、视觉效果和音景

  • 应用于UE4和UE5的3D环境

🔗https://twitter.com/xiaohuggg/status/1699406477214278078?s=20

5️⃣

📊SEC Insights

  • 分析SEC的10-K和10-Q文档

  • 解读公司财务和业绩

🔗https://twitter.com/xiaohuggg/status/1699381743441354764?s=20

6️⃣

🛒Amazon One

  • 掌纹身份认证和支付系统

  • 使用红外光识别手掌信息

🔗https://twitter.com/xiaohuggg/status/1699360207774920959?s=20

7️⃣

🚴‍♂️Reevo

  • 无轴电动自行车,2199刀

  • GPS定位,指纹解锁,算法定制的辅助助力

  • 独特功能和特点详述

🔗https://twitter.com/xiaohuggg/status/1699328793780043942?s=20

8️⃣

🤖RoboTAP

  • Google DeepMind开发的机器人操作系统

  • 通过示范快速学习视觉运动任务

🔗项目及演示:https://robotap.github.io

🔗https://twitter.com/xiaohuggg/status/1699288578986266952?s=20

9️⃣

🤖腾讯AI聊天机器人

  • 明日发布混元大模型

  • 2023年度新品发布会

🔗https://twitter.com/xiaohuggg/status/1699274780225225084?s=20

🔟

🎥Zoom AI Companion

  • Zoom会议AI助手工具

  • 功能:编写聊天回应、会议摘要、智能录音等

  • 数据隐私保障

🔗https://zm.me/ZoomAI

🔗https://twitter.com/xiaohuggg/status/1699094868877046264?s=20

历史记录:http://waytoagi.com/xiaohu

9月5日

🐱 🔔小互的推特 9 月 5日更新

✨✨✨✨✨✨✨✨✨

1️⃣

📱超级App:

  • 功能:一应用,15种聊天软件管理

  • 特色:实现iMessage与Android短信互通

🔗 https://twitter.com/xiaohuggg/status/1699061780864196674?s=20

2️⃣

📚MNBVC

  • 描述:超大规模中文语料数据集

  • 数据类型:新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词等

🔗 https://twitter.com/xiaohuggg/status/1699038891251315082?s=20

3️⃣

🎵StockMusic

  • 类型:人工智能音乐生成工具

  • 特点:支持50多种流派,最长生成120秒的歌曲

🔗 https://twitter.com/xiaohuggg/status/1699021507304030581?s=20

4️⃣

🖼️AI 图像修复大全

  • 描述:整合了一系列图像修复工具和模型

  • 适用人群:对图像修复感兴趣的用户

🔗 https://twitter.com/xiaohuggg/status/1698981381022581104?s=20

5️⃣

🎓哈佛大学发布AI指南

  • 指南内容:如何在教学中安全、合法、合规地使用生成式AI工具

  • 提醒:不得将学生作业输入到AI系统内

🔗 https://twitter.com/xiaohuggg/status/1698938035482865773?s=20

6️⃣

👃AI识别气味

  • 研究内容:仅凭分子结构预测气味特性

  • 发表平台:《Science》杂志

🔗 https://twitter.com/xiaohuggg/status/1698932238136783288?s=20

7️⃣

🔌吴恩达关于AI

  • 观点:AI是一种通用技术,应用广泛,就如同电力一样

🔗 https://twitter.com/dotey/status/1698918912467865981?s=20

8️⃣

🎬TokenFlow

  • 功能:文本到图像扩散模型进行文本驱动的视频编辑

  • 特点:根据文本提示生成新视频,可以替换背景或人物

🔗 https://twitter.com/xiaohuggg/status/1682345025806667776?s=20

9️⃣

📈科技进步观察

  • 观点:人类科技进入突飞猛进的200年,AI和量子计算可能引领新的科技飞跃

🔗 https://twitter.com/xiaohuggg/status/1698889816530972791?s=20

🔟

🏥PMC-LLaMA

  • 描述:开源医学领域语言模型

  • 特点:基于大约480万篇生物医学学术论文微调

🔗 https://twitter.com/xiaohuggg/status/1698879026470031714?s=20

全部项目:http://waytoagi.com/xiaohu

9月4日

📣 🔔小互的推特 9 月 4日更新

✨✨✨✨✨✨✨✨✨

1️⃣
🚗 一场看似无厘头的挑战赛 开启人类自动驾驶汽车的序幕
来源:得到听书《自动驾驶之争》

🔗https://twitter.com/xiaohuggg/status/1698708986378502240?s=20

2️⃣
🏙️ CityDreamer:工具能学习 Google Earth 和 OpenStreetMap 的图像数据,生成逼真的3D城市,包括建筑、道路、公园等,使得整个城市显得生动真实。
🔗https://twitter.com/xiaohuggg/status/1698687058091630983?s=20

3️⃣
📞 Baresip:一个模块化的 SIP 用户代理,支持音视频通话、自动接听、呼叫保持、录音等多种功能,同时具备多重安全机制,可在各个平台上运行。
🔗https://twitter.com/xiaohuggg/status/1698679047692370197?s=20

4️⃣
📹 Zoom“Notes”功能:新功能允许用户在视频通话中创建、共享和编辑文档,拥有丰富的格式化选项,无需频繁切换屏幕。
🔗https://twitter.com/xiaohuggg/status/1698660100041589145?s=20

5️⃣
🎵 迷你打碟机:一个让人向往的小型音乐创作工具。
🔗https://twitter.com/xiaohuggg/status/1698597497260941546?s=20

6️⃣
📼 DrLambda.ai:工具可以从YouTube视频中提取内容并转换成PDF、PPT、音视频脚本等格式,同时也支持其他文件转换为学习材料。
🔗https://twitter.com/xiaohuggg/status/1698559011107602603?s=20

7️⃣
🤖 V7 Labs:AI训练数据平台,能够快速自动化地标注视频和图像数据,专为医疗影像应用而设计,符合多种安全标准。
🔗https://twitter.com/xiaohuggg/status/1698528079369617529?s=20

8️⃣
🎒 微软的AI智能背包:背包内集成了摄像头、麦克风等设备,可以感知和互动环境,与其他设备交互,从云端获取信息。
🔗https://twitter.com/xiaohuggg/status/1698516284772594133?s=20

9️⃣
😆 Laughing Matters:这是一个能够将人的静态照片和笑声合成为笑脸视频的工具,使用了U-Net架构和多种优化方法以适应笑声生成需求。
🔗https://github.com/antonibigata/Laughing-Matters
🔗https://twitter.com/xiaohuggg/status/1698507610045944070?s=20

历史记录:http://waytoagi.com/xiaohu

9月3日

📣 🔔小互的推特 9 月 3日更新

✨✨✨✨✨✨✨✨✨

1️⃣

🎵华纳音乐与虚拟形象Noonoouri签约并发行首张单曲Dominoes。该单曲由德国DJ和音乐制作人Alle Farben参与。此曲采用了人工智能技术创作,根据真实歌手的声音进行修改,使之具有独特性。在MV中,Noonoouri身穿金·卡戴珊的塑身内衣品牌Skims。

🔗https://twitter.com/xiaohuggg/status/1698344224952070348?s=20

2️⃣

💻Open Interpreter:允许在本地运行OpenAI的代码解释器,具有完全的互联网访问权限,安全隐私,支持多种编程语言,如Python、JavaScript等。开源,MIT许可。

🔗https://git-scm.com/downloads

🔗https://twitter.com/xiaohuggg/status/1698329145439404093?s=20

3️⃣

📸AWPortrait 1.2:高度专业的人像模型,新版本升级了光源模拟和面容修正。配合t2i直出和ADetailer插件,可得到接近真实照片的效果。

🔗https://twitter.com/xiaohuggg/status/1698316653258514846?s=20

4️⃣

🔍Consensus Search:集成了ChatGPT的科研论文搜索工具,能查询超过2亿篇科学研究论文,直接在聊天界面内搜索。

🔗https://twitter.com/xiaohuggg/status/1698285495669977290?s=20

5️⃣

🎨Civitai举办的SDXL训练和图像比赛放榜。角色lora、Style、Base Model、Image绘画四个榜单,第一名奖品:RTX 4090 GPU。

🔗https://twitter.com/xiaohuggg/status/1698254832740778224?s=20

6️⃣

📈15家估值超过10亿美元的生成式AI独角兽:深入分析估值和增长。

🔗https://twitter.com/GPTDAOCN/status/1698053638768529425?s=20

7️⃣

🖼Facechain:在Colab上部署,上传3张正面照片即可生成靓照。

🔗https://t.co/rQWAJjWEbP

🔗https://twitter.com/xiaohuggg/status/1698161031204442488?s=20

8️⃣

🛠Fooocus:由ControlNet的创建者开发的Stable Diffusion应用,从下载到生成第一张图像,鼠标点击不超过3次。

🔗https://twitter.com/xiaohuggg/status/1698154080777154900?s=20

9月2日

🐱 🔔小互的推特 9 月 2日更新

✨✨✨✨✨✨✨✨✨

1⃣️🚁 人工智能无人机

2⃣️🔍 光刻机的诞生

3⃣️🤳 Total Selfie

4⃣️🤖 像人类一样行走的机器人

5⃣️🎮 CALM(Conditional Adversarial Latent Models)

6⃣️🎬 #周末影院

7⃣️📑 Least-to-Most Prompting

https://twitter.com/xiaohuggg/status/1697798850910753072?s=20

8⃣️📢 Twitter更新

  • 📜 允许其使用你的推文进行AI训练

https://twitter.com/xiaohuggg/status/1697791551437738064?s=20

9⃣️🎥 Pika Labs新功能

1⃣️0⃣️📚 数学老师张旭另辟蹊径做自媒体

1⃣️1⃣️📖 Meta AI 数据集:Belebele

1⃣️2⃣️🔮 魔法展示

9月1日

📗 🔔小互的推特 9 月 1日更新

✨✨✨✨✨✨✨✨✨

1️⃣ MVDream:多视角扩散模型
📌 MVDream模型如同智能相机,基于文本描述生成多视角图像。这些图像在几何结构上保持一致性,确保无论从哪个角度观看,都保持真实。
🔗 https://twitter.com/xiaohuggg/status/1697615713517851116?s=20

2️⃣ Sky News 专访:Ameca Desktop人工智能
🎙️ Jonathan Lea采访了名为Ameca Desktop的人工智能。她具有观点,能和主持人流利交谈。其背后的技术与ChaGPT相似,但详细信息未透露。
🔗 https://twitter.com/xiaohuggg/status/1697554521973772483?s=20

3️⃣ http://Recipe-p.com:AI图像平台
🖼️ 专为AI生成人像设计,提供的图像是免费、可编辑的,确保用户在使用中无需担心版权问题。
🔗 https://twitter.com/xiaohuggg/status/1697581606901530705?s=20

4️⃣ 人工智能无人机的胜利
🚁 Swift人工智能系统,由德国苏黎世大学和Intel研发,击败了三名世界级的无人机赛冠军,创下了最快的比赛时间记录。
🔗 https://twitter.com/xiaohuggg/status/1697528089629339882?s=20

5️⃣ 你们还记得这个网站吗?
🌐 "The Million Dollar Homepage",由Alex Tew于2005年创建,提供像素广告空间,每像素售价1美元,总计1,000,000像素。
🔗 https://twitter.com/xiaohuggg/status/1697535292302119355?s=20

6️⃣ Move AI:动作捕捉公司
🕺 无需任何捕捉套装或标记,仅需手机或摄像头,即可捕捉动作,转化为电脑动画或游戏动作。
🔗 https://twitter.com/xiaohuggg/status/1697452236736233696?s=20

历史记录:http://waytoagi.com/xiaohu

8月31日

📗 🔔小互的推特 8 月 31日更新

✨✨✨✨✨✨✨✨✨

1️⃣ ChatGPT问题

2️⃣ AI短片制作

3️⃣ LIDA工具介绍

4️⃣ a16z开源AI资助计划

5️⃣ SWIM: 机器人学习方法

6️⃣ 头发模拟技术

7️⃣ Muse AI 图片编辑器

8月30日

❓ 🔔小互的推特 8 月 30日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🌐 Background Changer:背景更换达人

  • 🔍 电商宣传神器,数秒间为商品换上各类逼真背景

  • 🛍️ 商品宣传无忧

🔗 https://twitter.com/xiaohuggg/status/1696880097129550333?s=20

2️⃣

🎙️ Youtube Dubbing:YouTube翻译神器

  • 🌍 字幕识别,转译再转语音

  • 🚹🚺 多种声音角色,如实发音

🔗 https://twitter.com/xiaohuggg/status/1696851994412220494?s=20

3️⃣

💬 ChatHaruhi:与动漫人物对话

  • 🎤 语音转换技术,保留原角色语气

  • 📺 与您最爱的角色互动

🔗 https://twitter.com/xiaohuggg/status/1696825501376274809?s=20

4️⃣

🏷️ BrightMarker:麻省理工科技

  • 🔎 物体内部嵌入"隐形标签",荧光丝3D打印

🔗 https://twitter.com/xiaohuggg/status/1696753714110087349?s=20

5️⃣

📹 MagicEdit:文本引导的视频编辑魔法师

  • ✂️ 轻松改变风格、替换元素

  • 🎩 把兔子变成像兔子的老虎? 一切皆有可能

🔗 https://twitter.com/xiaohuggg/status/1696730076396826639?s=20

6️⃣

📖 动态漫画杂志:新概念杂志

  • 🖼️ 宅男腐女的新宠

🔗 https://twitter.com/xiaohuggg/status/1696723104184320414?s=20

7️⃣

🌑 HADAR:黑暗中的“超级视力”

  • 🌌 普渡大学研发,夜视如白昼

  • 📸 看“鬼影”?不,是清晰画质

🔗 https://twitter.com/xiaohuggg/status/1696712363041583488?s=20

8️⃣

💻 特斯拉超级计算机:前所未有的算力

  • 🚗 为自动驾驶技术助力

  • 💲 价值超3亿美元,性能惊人

🔗 https://twitter.com/xiaohuggg/status/1696692124287373725?s=20

9️⃣

💰 Twitter X:数字货币支付

  • 🐕 未来或许用狗狗币支付

🔗 https://twitter.com/xiaohuggg/status/1696552297592156215?s=20

8月29日

📣 🔔小互的推特 8 月 29日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🌐 Google Deepmind的𝗦𝘆𝗻𝘁𝗵𝗜𝗗:AI图像水印前沿工具,专为AI图像设计,水印隐于像素,即使裁剪、滤镜后仍可检测。

🔗 https://twitter.com/xiaohuggg/status/1696523293065609313?s=20

2️⃣

🎙️ VALL-EX:开源多语文本-语音模型,零样本语音克隆,仅需数秒录音便可模仿声音,支持情感、口音控制,微软技术基础,复现更加优化。

🔗 https://twitter.com/xiaohuggg/status/1696513710637097199?s=20

3️⃣

🎵 Text-to-Sing:不仅转换文本为歌声,还提供多种旋律风格选择,体验简单直观。

🔗 https://twitter.com/xiaohuggg/status/1696513487370060188?s=20

4️⃣

🎥 MagicAvatar by 字节跳动:多模态生成技术,文本、视频、音频引导下创建或激活虚拟形象。例如,“火山里的舞蹈宇航员”成为视觉现实。

🔗 https://twitter.com/xiaohuggg/status/1696463831931687249?s=20

5️⃣

🖼️ 3D Gaussian Splatting:仅需照片或视频,即可制作出高质量3D模型。独特的“3D高斯函数”技术让渲染更快速。

🔗 https://twitter.com/xiaohuggg/status/1696433188158222603?s=20

6️⃣

🌀 有趣的动画过渡:新颖独特,颠覆传统动画设计。

🔗 https://twitter.com/xiaohuggg/status/1696420072645173430?s=20

7️⃣

📷 Clipdrop:增强现实与机器学习融合,将真实物体复制粘贴至电脑软件,革新性设计思路。

🔗 https://twitter.com/xiaohuggg/status/1696351233915949183?s=20

8️⃣

🎓 Anthropic提示工程师:揭秘Claude的写作神技,如XML标签、思考标签等高级技巧分享。

🔗 https://twitter.com/op7418/status/1696216819860930699?s=20

9️⃣

💬 OpenAI ChatGPT企业版:双倍速GPT-4访问,超长上下文支持,为企业级需求量身打造,数据分析更加高级。

🔗 https://twitter.com/xiaohuggg/status/1696278901868413395?s=20

8月28日

📣 🔔小互的推特 8 月 28日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🛍 Pebblely:专为电商设计的AI产品创意图生成工具。一键生成针对产品的场景图,适用于各大电商和社交平台。免费40生成张图/月,自带20种主题,同时支持文本提示控制,具备场景图大小调整、多媒体创意素材转换等高级功能。

🔗 https://pebblely.com/zh/

🔗 https://twitter.com/xiaohuggg/status/1696170895318917492?s=20

2️⃣

🧠 Qwen-VL:阿里云通义千问的多模态大语言模型。支持多图输入、图片问答、多图文学创作。不仅处理文本,也能理解图像中对象的位置与属性,适用于多种语言。

🔗 https://arxiv.org/abs/2308.12966

🔗 https://github.com/QwenLM/Qwen-VL

🔗 https://twitter.com/xiaohuggg/status/1696054519824814503?s=20

3️⃣

⌚ 仅通过智能手表进行动作捕捉并控制机器人/界面。基于姿态估计的机器学习算法,结合语音识别系统。提供多功能的机器人控制界面,并降低了40%的预测误差。

🔗 https://arxiv.org/abs/2306.13192

🔗 https://twitter.com/xiaohuggg/status/1696040741624242454?s=20

4️⃣

🔄 实时打字翻译软件:实时翻译对照,支持发音,界面在光标处不打断思路。

🔗 https://t.co/hz02YQUju0

🔗 https://twitter.com/xiaohuggg/status/1695818219385397594?s=20

5️⃣

💰 如何用<2000美元建立一个每月收入1000美元的网站。Reddit用户分享了使用Ahrefs Content Explorer工具并优化流程建立的高收入网站的故事。结合ChatGPT等手段可进一步优化。

🔗 https://twitter.com/xiaohuggg/status/1695959369610100801?s=20

8月27日

📣 🔔小互的推特 8 月 27日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🚀 人类为什么无法实现超光速通信?

因为信息是无法超越光速的,违背了因果性!量子纠缠只能加密信息,不能实现即时通信。

🔗https://twitter.com/xiaohuggg/status/1695808051813748857?s=20

2️⃣

📚 在数据科学和机器学习领域,数学是基石。分享关于机器学习的顶级免费数学资源:线性代数、多元微积分、概率/统计数据、应用贝叶斯建模、概率机器学习。

🔗https://twitter.com/xiaohuggg/status/1695784152274981321?s=20

3️⃣

🔧 英文资源翻译工具推荐:

  • 沉浸式翻译

🔗https://t.co/rLUzRASv5m

  • OpenAI Translator

🔗https://t.co/e6O16nJahb

  • Felo:ChatGPT跨语言翻译

🔗https://t.co/U8DJw5LPlo

  • Language Reactor:双语言字幕、弹出式词典等功能

🔗https://t.co/ehEJkoCdOm

🔗https://twitter.com/xiaohuggg/status/1695785225610236047?s=20

4️⃣

🖥️ WizardLM推出基于Code Llama微调的WizardCoder 34B。WizardLM宣称WizardCoder-34B在HumanEval上表现超越GPT-4、ChatGPT-3.5。

🔗https://twitter.com/xiaohuggg/status/1695775906919485869?s=20

5️⃣

🎥 DragNUWA:通过文本指令控制视频中的动作,例如让清明上河图动起来。

🔗https://twitter.com/xiaohuggg/status/1695765452482621479?s=20

6️⃣

🌐 怎么把Apple Notes变成个人网站?有最简单的建立个人网站方法 - 你在iPhone备忘录里随便写,它立刻发布成网页。

🔗https://twitter.com/xiaohuggg/status/1695705818480726234?s=20

7️⃣

📸 changeface.ai:把你的脸换到名人名场面的照片上,免费生成8张,适合周末娱乐。

🔗https://twitter.com/xiaohuggg/status/1695655870829674692?s=20

8️⃣

🤖 Text2Listen:聊天机器人根据你说的话做出相应的面部表情和动作,让对话更真实。

🔗https://twitter.com/xiaohuggg/status/1695637675641090195?s=20

8月26日

📣 🔔小互的推特 8 月 26日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🌐 InsightFace :一个开源的面部分析库。支持2D 和 3D 面部识别、检测和对齐。不仅适用于研究,也适用于商业应用。

🔗https://github.com/deepinsight/insightface

🌍https://insightface.ai

🎥https://insightface.ai/demos

🐦https://twitter.com/xiaohuggg/status/1695399480936579443?s=20

2️⃣

🍿 周末轻松下,分享个电影:《麦克法兰》。强烈推荐!

🐦https://twitter.com/xiaohuggg/status/1695333566220255365?s=20

3️⃣

🎨 Scenimefy:将复杂的真实世界图像自动渲染成高质量的动漫场景。自动生成的图像风格与动漫相近。

🐦https://twitter.com/xiaohuggg/status/1695281972153913565?s=20

4️⃣

🔩 无需开孔的隐形螺丝工具。外观干净,无螺丝或钉子可见。

🐦https://twitter.com/xiaohuggg/status/1695277138965119305?s=20

5️⃣

📊 Phind微调了CodeLlama-34B和CodeLlama-34B-Python模型。在HumanEval测试中,两模型均超过了GPT-4。

🔗他们在Huggingface上发布这两个模型。

🐦https://twitter.com/xiaohuggg/status/1695246631581696033?s=20

6️⃣

⚙️ Perplexity使用微调的@OpenAI GPT-3.5 API,使Copilot搜索助理性能提升。速度快,成本低,性能高。

🐦https://twitter.com/xiaohuggg/status/1695132807830589780?s=20

7️⃣

🖼️ 国内首例AI生成图片侵权案。李某某使用Stable Diffusion生成的图片被刘某某未授权使用。

🐦https://twitter.com/xiaohuggg/status/1695104528163692577?s=20

8月25日

💡 🔔小互的推特 8 月 25日更新
✨✨✨✨✨✨✨✨✨

1⃣️ WavJourney 更新

  • WavJourney更新了Huggingface体验地址:查看链接

  • 功能:根据文本指令生成音频内容,如语音、音乐和音效。给定场景描述,生成音频讲故事的脚本,音乐和音效,并自动配音。

  • 适用场景:科幻、教育、广播剧等。

2⃣️ Graph of Thoughts GoT

  • 简介:增强大型语言模型解决复杂问题的方法。

  • 特点:组合、提炼思想网络,并使用反馈循环增强。

  • 结果:GoT在任务上性能提升,62%的排序质量改善,31%的成本降低。

  • 论文:查看链接

  • 推文:查看链接

3⃣️ 教大语言模型如何推算

  • 发布:Google Research

  • 主题:大语言模型(LLMs)如GPT和PaLM的算法推理能力。

  • 推文:查看链接

4⃣️ 从3岁到100岁

  • 项目:使用Midjourney和Runway展现一个人的一生。

  • 推文:查看链接

5⃣️ Hugging Face融资消息

  • 融资:D轮,2.35亿美元

  • 总融资:3.952亿美元

  • 估值:45亿美元

  • 投资方:Google、Amazon、Nvidia、Salesforce、IBM

  • 推文:查看链接

6⃣️ StableVideo 项目

  • 介绍:文本驱动的视频编辑工具。

  • 特点:描述你想编辑的内容,系统自动完成。

  • 项目官网:查看链接

  • 论文:查看链接

  • 推文:查看链接

7⃣️ NVIDIA研究

  • 功能:多人同时讲话时,分离并识别特定讲话者的音频。

  • 推文:查看链接

8⃣️ CSF和UC Berkeley的研究

  • 成果:将大脑信号转化为语言和面部表情的AI驱动设备。

  • 实例:中风患者Ann借助技术通过虚拟形象交流。

  • 发表:《自然》杂志

  • 推文:查看链接

9⃣️ 微软和中国科学院的研究

  • 模型:WizardMath,增强数学推理能力。

  • 成果:性能超过GPT3.5, PaLM-2等。

  • 模型GitHub & Hugging Face

  • 论文:查看链接

🔟 日本东京都政府AI文本生成器

  • 目的:提高职员工作效率。

  • 内容:AI文本生成器使用指南。

  • 推文:查看链接

1⃣1⃣ OpenAI & Scale 合作

  • 目标:为企业微调模型提供支持。

  • 推文:查看链接

1⃣2⃣ Meta AI发布Code Llama

  • 功能:生成代码、解释代码功能。

  • 推文:查看链接

8月24日

💡 🔔小互的推特 8 月 24日更新
✨✨✨✨✨✨✨✨✨

1⃣️

🚣 机器人3D打印皮划艇

利用可回收材料进行3D打印制作了一个皮划艇。

🔗https://twitter.com/xiaohuggg/status/1694663540811137238?s=20

2⃣️

🎬 Simulon: iOS VFX视频制作应用

  • 轻松制作逼真VFX视频

  • 创始人 @diveshnaidoo 表示无需摄像机、HDRI捕获或手动合成设置

  • 实时预览拍摄过程、自动曝光匹配

  • 意味着电影、视觉特效和虚拟制作的变革

  • 目前处于内测阶段

🔗https://twitter.com/xiaohuggg/status/1694548592214884547?s=20

3⃣️

📊 英伟达最新财报

  • 第二财季营收:135.07亿美元,年增长101%,季增长88%

  • 净利润:61.88亿美元,年增长843%,季增长203%

  • 创下公司历史纪录

🔗https://twitter.com/xiaohuggg/status/1694499693106176257?s=20

8月23日

🎉 🔔小互的推特 8 月 23日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🔌 英伟达H100 AI处理器爆卖

据英国《金融时报》报道,英伟达H100 AI 处理器2024 年的所有产量都已经卖光了。
英伟达将H100 的2024产量增加了两到三倍,达到 150 万至 200 万个,比今年预期的 50 万个大幅跃升。尽管计划增加产量,但市场对这些处理器的需求仍然超过了供应

🔗https://twitter.com/xiaohuggg/status/1694330961482440935?s=20

2️⃣

🎨 MidJourney Inpainting:局部重绘功能示范。

🔗https://twitter.com/xiaohuggg/status/1694325341610025378?s=20

3️⃣

🔍 Metaphor搜索引擎

Metaphor:一种基于大语言模型的搜索引擎
允许用户使用完整的句子和自然语言搜索,还可以模拟人们在互联网上分享和谈论链接的方式进行查询内容。Metaphor同时还能与LLMs结合使用,允许LLMs连接互联网,查询自己知识库外部的内容

🔗https://twitter.com/xiaohuggg/status/1694278158818906282?s=20

4️⃣

📹 VisionOS X视频

带来身临其境的体验。

🔗https://twitter.com/xiaohuggg/status/1694276462478815260?s=20

5️⃣

🎥 Simulon:iOS应用制作逼真VFX视频。

无需摄像机、HDRI捕获或手动合成。实时预览,自动曝光匹配。目前内测中!

Simulon:一款新的 iOS 应用程序,可以轻松制作看起来非常逼真的VFX视频。
创始人@diveshnaidoo称该方法无需摄像机解决方案,没有 HDRI 捕获,也不需要手动合成设置。
拍摄过程可实时预览,自动曝光匹配!
这将改变电影制作、视觉特效和虚拟制作的游戏规则!

🔗https://twitter.com/xiaohuggg/status/1694189530767888642?s=20

6️⃣

😂 形势严峻:哈哈哈。

🔗https://twitter.com/xiaohuggg/status/1694169254701253041?s=20

7️⃣

🧠 知识体系与棋

知识体系的构建与下棋有相似之处,都要理解背后的逻辑。

知识体系的构建就像下棋。假设你随意摆放棋子在棋盘上,然后让一位棋手来记住棋面布局,他们可能做不到。棋手能够记忆棋局棋谱,是因为他们理解每一步棋背后的逻辑。

🔗https://twitter.com/xiaohuggg/status/1694166886773407854?s=20

8️⃣

Apple Watch新专利:根据服装和表带更换表盘颜色。

苹果公司获得了一项关于 Apple Watch 的新专利,其中亮点是配备了颜色采样传感器,可以根据表带、服装等外部物体的颜色自动变换 jax 颜色和主题。在颜色采样期间,佩戴者需要将 Apple Watch 正面朝向采样对象,发射出红光、绿色和蓝光的序列,内置的光传感器会检测上述三种光线的反射,通过算法判断出颜色。Apple Watch 内部会配有相应的控制电路,在收到颜色采样器提供的颜色信息之后,可以相应地调整表盘颜色和主题。

🔗https://twitter.com/xiaohuggg/status/1694158465881755931?s=20

9️⃣

📖 GPT-3.5 Turbo新功能:OpenAI推出微调功能,让GPT-3.5 Turbo在特定任务上与GPT-4匹敌或超越。

🔗https://twitter.com/xiaohuggg/status/1694142417312911724?s=20

🔟

🎤 Eleven Multilingual v2:ElevenLabs新的多语言语音模型,支持28种“情感丰富”的语言,包括中文。

ElevenLabs推出一款新的多语言语音生成模型:Eleven Multilingual v2
能够准确地生成28种语言中的“情感丰富”的AI音频,包括中文!
无论使用合成声音还是克隆声音,说话者的独特声音特征都会在所有语言中保持不变。这意味着同一种声音可以用于在28种不同的语言中呈现内容。

🔗https://twitter.com/xiaohuggg/status/1694130472278970452?s=20

8月22日

📌 🔔小互的推特 8 月 22日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🌍 Meta 发布 SeamlessM4T AI 模型

支持近100种语言的自动语音识别、语音到文本翻译等。其目标是创建一个类似《银河系漫游指南》中的虚构的巴别鱼的通用语言翻译器。

🔗 https://twitter.com/xiaohuggg/status/1694003893863391607?s=20

2️⃣

🎮 StoryGames AI:快速创建交互视觉小说游戏

仅需输入关于主角和故事走向描述,即可生成十章视觉小说游戏。

🔗 https://twitter.com/xiaohuggg/status/1693968030202777979?s=20

3️⃣

🚄 日本东京火车站AI实时“翻译墙”

能实时将售票员与游客的对话翻译成多种语言并展示。

🔗 https://twitter.com/xiaohuggg/status/1693950433931530749?s=20

4️⃣

📷 IP-Adapter:腾讯AI实验室的文本兼容图像提示适配器

允许模型根据图像提示生成图像,参数只有22M,性能出色。

🔗 https://twitter.com/xiaohuggg/status/1693929403221442765?s=20

5️⃣

📹 AlfredCamera:将旧设备变为监控摄像头的应用

下载应用并配对即可。

🔗 https://twitter.com/xiaohuggg/status/1693911953989890235?s=20

6️⃣

🎨 AUTOMATIC1111 Stable Diffusion GUI扩展

增强图像生成和编辑的工具大全。

🔗 https://stable-diffusion-art.com/automatic1111-extensions/

7️⃣

✒️ 朱雀仿宋:首款开源仿宋字体

灵感来自“南宋”,允许免费商用。

🔗 https://twitter.com/xiaohuggg/status/1693872582809018588?s=20

8️⃣

📺 ChatHaruhi:模仿动漫角色的技术框架

如大语言模型扮演凉宫春日回复用户。

🔗 https://twitter.com/xiaohuggg/status/1693870449921544631?s=20

9️⃣

🎨 MidJourney发布 InPainting功能

用于图像内容修改。

🔗 https://twitter.com/xiaohuggg/status/1693806007414296623?s=20

🔟

🎒 北京世界机器人大会的智能背包

具有6个机械臂。

🔗 https://twitter.com/xiaohuggg/status/1693826282252034215?s=20

1️⃣1️⃣

🤖 Dot:AI助理概念产品

能理解对话背景、帮助记住细节、安排日程。

🔗 https://twitter.com/xiaohuggg/status/1693817891215622219?s=20

1️⃣2️⃣

📸 #AI开源项目推荐:GFPGAN

腾讯开源的模型,能恢复老照片。

🔗 https://twitter.com/dotey/status/1693664599298523475?s=20

8月21日

📌 🔔小互的推特 8 月 21日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🛰 中国公司发射“WonderJourney”人工智能卫星

这款卫星能实时处理数据,用户可以与其对话。它能短时内分析10,000平方公里区域,而传统卫星需180天。

🔗 https://twitter.com/xiaohuggg/status/1693637082126639277?s=20

2️⃣

🖼 ReVersion:图像框架

它识别图像中的特定关系并在新场景复制,如拥抱的动作。

🔗 https://arxiv.org/abs/2303.13495

🔗 https://twitter.com/xiaohuggg/status/1693603725175316847?s=20

3️⃣

🗣 KwaiYii 快意:快手大语言模型

官方称其在CMMLU中文排名首位,与ChatGPT3.5效果相当。

🔗 https://twitter.com/xiaohuggg/status/1693591161901089094?s=20

4️⃣

💰 全球“女性”富豪榜

有人要求Midjourney创造女性版的亿万富翁。

🔗 https://twitter.com/xiaohuggg/status/1693587547283505629?s=20

5️⃣

🖱 Clip Mouse:虚拟鼠标

夹于指间,感应手部动作模拟鼠标移动。

🔗 https://twitter.com/xiaohuggg/status/1693536677569155092?s=20

6️⃣

🎥 Grounding Predicates through Actions

自动标记方案,使机器像人理解视频并与人互动。

🔗 https://twitter.com/xiaohuggg/status/1693505021495926819?s=20

7️⃣

🏞 交互式AR沙盘

扫描沙盆并在沙子上投影地形。

🔗 https://twitter.com/xiaohuggg/status/1693465868599169398?s=20

8️⃣

🎨 GigaGAN:大规模GAN

规模是StyleGAN的36倍,快速生成高清图像。

🔗 https://mingukkang.github.io/GigaGAN/

🔗 https://twitter.com/xiaohuggg/status/1693455348215214390?s=20

9️⃣

📱 每天刷 X 的你

🔗 https://twitter.com/xiaohuggg/status/1693442261592490470?s=20

🔟

🎆 果然是烟花

🔗 https://twitter.com/xiaohuggg/status/1693301916422517030?s=20

8月20日

📣 🔔小互的推特 8 月 20日更新
✨✨✨✨✨✨✨✨✨
1️⃣

🖥 Adobe Express 大更新

Adobe Express集成了Adobe Firefly生成式AI,提供了丰富的功能。

🔗 https://twitter.com/xiaohuggg/status/1693089301867941897?s=20

2️⃣

📱 BeFake:新的社交媒体应用

由前Machine Zone首席执行官创建,用户可以使用AI将自己置入任意场景。

🔗 https://twitter.com/xiaohuggg/status/1693093605010014360?s=20

3⃣️

🎥 如何渲染视频的特定部分?

分享了一个具体的视频渲染方法,包括使用Alpha通道和Warpfusion技术。

🔗 https://twitter.com/xiaohuggg/status/1693129008136024223?s=20

4⃣️

💻 推荐计算机专业课程

分享了MIT、哈佛和斯坦福等名校的计算机相关课程链接,并推荐了Edx.org公开课平台。

🔗 https://twitter.com/xiaohuggg/status/1693173776362713312?s=20

5️⃣

🎬 关于RunwayML的高清视频制作方法

@Salmaaboukarr 分享了如何绕过RunwayML的视频质量问题,通过Midjourney和tensorpix ai,进行图片处理和视频设置,最终实现高质量视频制作。

🔗 https://twitter.com/xiaohuggg/status/1693273874467864709?s=20

6️⃣

🧪 3D Gaussian Splatting 项目

尽管此项目对许多人来说难以理解,但多个测试视频显示其效果出色。其相关论文大小高达115M。

项目地址:https://huggingface.co/papers/2308.04079

🔗 https://twitter.com/xiaohuggg/status/1693265777380708420?s=20

7️⃣

🎮 Mantella:为《上古卷轴V:天际》开发的Mod

该Mod允许玩家使用先进的AI技术与游戏内的NPC进行自然对话。

🔗 https://twitter.com/xiaohuggg/status/1693261182264906165?s=20

8️⃣

🤖 北京Surgerii科技公司的模块化内窥镜手术机器人

该机器人能在3D显示器引导下执行微创手术。

🔗 https://twitter.com/xiaohuggg/status/1693220928354955736?s=20

9️⃣

🚗 特斯拉App的Siri控制更新

用户现在可以使用Siri快捷指令来控制特斯拉车辆的各种设置和功能。

🔗 https://twitter.com/xiaohuggg/status/1693199839319015617?s=20

🔟

🏃 MASK-M:人体运动合成技术

该模型能预测和合成连续的人体动作。

🔗 https://twitter.com/xiaohuggg/status/1693181050783142249?s=20

8月19日

🌰 🔔小互的推特 8 月 19日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🔍 StabilityAI 发布Control-LoRA 模型

通过低秩优化,原始的 4.7GB ControlNet 模型被减小到约 738MB 的 Control-LoRA 模型,使得模型能在消费级的 GPU 上运行,提高了其可访问性与适用性。

🔗 https://huggingface.co/stabilityai/control-lora

🔗 https://x.com/xiaohuggg/status/1692936481457975425?s=46&t=F6BXooLyAyfvHbvr7Vw2-g

2️⃣

📺 WALDO beta v2.5 预览视频!

这是一款似天眼功能的工具,但其确切功能难以寻找。从视频判断,它似乎使用了深度网络和计算机视觉对摄像头内的元素进行识别和标记。

🔗 https://x.com/xiaohuggg/status/1692852912693923884?s=46&t=F6BXooLyAyfvHbvr7Vw2-g

3️⃣

👥 人体腹部3D透视图

人与机器人之间的相似之处在于都有“电线”血管和神经网络。

🔗 https://x.com/xiaohuggg/status/1692762973767655735?s=46&t=F6BXooLyAyfvHbvr7Vw2-g

4️⃣

📸 使用Photoshop Generative AI功能修复破损老照片

🛠️ 主要工具包括:Remove tool, Clone brush, Generative fill 以及 Neural filters。

🔗 https://x.com/xiaohuggg/status/1692751080973828468?s=46&t=F6BXooLyAyfvHbvr7Vw2-g

历史项目记录:http://waytoagi.com/xiaohu

8月18日

📣 🔔小互的推特 8 月 17 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🖼️ Generated Photos 新工具: Human Generator

  • 实时创建逼真全身人物照片

  • 多种种族、年龄、体型

  • 将真实面孔与生成的身体结合

  • 无版权问题

模特的工作机会或许会减少!

🔗https://twitter.com/xiaohuggg/status/1692545825937990089?s=20

2️⃣

🔬 打击艾滋病的新方法

坦普尔大学利用CRISPR基因编辑技术从非人灵长类动物中去除了SIV。此突破为治疗人类HIV感染带来了希望。

🔗https://twitter.com/xiaohuggg/status/1692456524902474003?s=20

3️⃣

🎥 Luma AI发布新功能: Flythroughs

使用iPhone创建3D立体飞跃效果视频,无需无人机、专业3D摄像机等高端设备。

🔗https://twitter.com/xiaohuggg/status/1692411594435969186?s=20

4️⃣

💻 Roboflow Supervision 工具库更新

  • 视频跟踪器:追踪视频中的物体移动

  • 区域工具:选择视频中的特定区域进行分析

  • 注释器:在视频上添加标签、信息等

🔗https://twitter.com/xiaohuggg/status/1692376727937507344?s=20

5️⃣

🤖 Meta AI推出: RoboAgent

一款智能机器人,能掌握如拾取、推动、物体操纵等12个复杂技能。

🔗https://twitter.com/xiaohuggg/status/1692359735528546805?s=20

6️⃣

🗣️ 开源项目推荐: SillyTavern

本地部署的虚拟角色聊天软件,支持多种LLM、TTS功能,以及NSFW(文爱功能)。

🔗https://twitter.com/dotey/status/1692216399836426242?s=20

8月17日

📣 🔔小互的推特 8 月 17 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🤖 字节跳动大模型

  • 抖音登录直接体验,优点:回答能力较好缺点:逻辑问题处理不佳、过度的安全屏蔽

🔗http://doubao.com

https://twitter.com/xiaohuggg/status/1692181399045071152?s=20

2️⃣

🎮 增强现实保龄球游戏

利用 GoogleARVR 的地理空间API实现,结合物理学和 Google 的视觉定位系统。

🔗https://twitter.com/xiaohuggg/status/1692174089451155459?s=20

3️⃣

🎬 AI 短电影预告片

由 Runway、Midjourney、Stable Diffusion、HeyGen 和 Pika Labs 制作,展现了完整的故事情节。

🔗https://twitter.com/xiaohuggg/status/1692112470641660077?s=20

4️⃣

🎥 RIGID 视频编辑框架

使用深度学习技术对视频中的人脸进行编辑,能实现多种脸部效果。

🔗https://twitter.com/xiaohuggg/status/1692089025606377572?s=20

5️⃣

📱 GlassOuse 设备

专为身体残障人士设计,可通过头部运动控制各种电子设备。

🔗https://twitter.com/xiaohuggg/status/1692077111975256453?s=20

6️⃣

📸 AI 生成图像数量

一年内 AI 生产的图像超过了 150 年间人类拍摄的所有照片数量。

🔗https://twitter.com/xiaohuggg/status/1692045409978568800?s=20

7️⃣

📊 OpenAI API 使用情况可视化分析

http://llm.report 提供 API 数据统计、详细日志和用户花费统计。

🔗https://twitter.com/Gorden_Sun/status/1691997190460207204?s=20

8️⃣

🎬 CoDeF 视频处理方法

为视频处理提供了新的视角和工具,项目由蚂蚁集团、香港科技大学和浙江大学团队共同创建。

🔗https://twitter.com/xiaohuggg/status/1692028146001088906?s=20

9️⃣

💬 流式传输聊天响应

"Streaming responses for chat & completions"的效果展示。

🔗https://twitter.com/xiaohuggg/status/1692013599169143169?s=20

🔟

✉️ Google “Poem Postcard” 工具

使用 AI 生成诗歌来创建个性化明信片。

🔗https://twitter.com/xiaohuggg/status/1692010403193315515?s=20

1️⃣1️⃣

🎮 OpenAI 收购 Global Illumination公司

该公司主要研发了开源沙盒MMORPG游戏:Biomes,是开源版的 Minecraft。

🔗http://ill.inc | [推文来源]https://twitter.com/xiaohuggg/status/1692004419485974798?s=20

8月16日

📌 🔔小互的推特 8 月 16 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🤖 KAIST 开发驾驶飞机的人形机器人 "Pibot"

无需对驾驶舱进行修改,Pibot 可以像人类飞行员一样操作飞机。即使在飞机中遇到严重振动也能准确操作。

🔗https://twitter.com/xiaohuggg/status/1691831076271055164?s=20

2️⃣

🖼️ Bing Chat 图像转小说

上传照片,Bing Chat 会为您写出一篇原创短篇小说。

🔗[完整故事]https://www.aidemos.info/image-to-short-story-with-bing-chat/ https://twitter.com/xiaohuggg/status/1691784201941692421?s=20

3️⃣

🔍 MediSearch.io:权威的医疗搜索引擎

为用户提供来自权威信源的医学信息答案,所有答案都附带引用来源。

🔗https://twitter.com/xiaohuggg/status/1691771235066364237?s=20

4️⃣

☁️ 腾讯云 TI 平台正式上架

支持行业最新的 Llama 2 等开源模型直接部署调用。

🔗https://twitter.com/xiaohuggg/status/1691704312932786383?s=20

5️⃣

🌆 国内创业环境观察

探索国内的创业氛围。

🔗https://twitter.com/xiaohuggg/status/1691661356527923691?s=20

6️⃣

🎨 Opendream:图像生成与操作的开源工具

为 Stable Diffusion 提供简单易用的图形界面。

🔗https://twitter.com/xiaohuggg/status/1691656096057115084?s=20

7️⃣

🔊 MuAViC:模拟人类共同使用视觉和听觉理解语言

由 Meta AI 开发,结合声音和视觉信息以准确理解和翻译语言。

🔗https://twitter.com/xiaohuggg/status/1691647905202082285?s=20

8️⃣

🔗 短链接被限流问题

包括 Instagram、Facebook、Threads、Substack 等的短链接点击后会有 5 秒延迟再加载。

🔗https://twitter.com/xiaohuggg/status/1691626486464442749?s=20

9️⃣

🎙️ 比尔·盖茨与可汗学院创始人萨尔曼·可汗的对话

在播客《Unconfuse Me》中,两位名人探讨了人工智能的话题。

🔗https://twitter.com/dotey/status/1691600956297797740?s=20

8 月 15 日

🌰 🔔小互的推特 8 月 15 日更新
✨✨✨✨✨✨✨✨✨

1️⃣
🤖现在可以直接在浏览器中体验 NVIDIA 多模态视觉语言模型:NeVA
你只需上传一张图片就可以询问与该图像有关的问题。https://nvda.ws/459gTxw

https://twitter.com/xiaohuggg/status/1691421722065670144?s=20

2️⃣
🖼️ Inst-Inpaint:是一种图像修复替换技术,可以通过文字描述轻松的移除或者替换图像中的指定对象。
与传统的图像修复方法不同,传统方法通常需要用户定义要删除的像素的二进制掩码,这可能既耗时又容易出错。Inst-Inpaint 则可以根据文本提示来自动识别并删除图像中的对象。
当然,以下是所需的
论文:https://arxiv.org/abs/2304.03246
GitHub:https://github.com/abyildirim/inst-inpaint
官方网站:http://instinpaint.abyildirim.com
演示:https://huggingface.co/spaces/abyildirim/inst-inpaint-inpaint

https://twitter.com/xiaohuggg/status/1691400737727856640?s=20

3️⃣
🚶英国一位 65 岁的中风患者,正在尝试一种名为”NeuroSkin”的智能裤子,帮助她重新学会走路。
这套装备包括一条有线裤子和一双带电极的鞋子,可以刺激腿部的肌肉。
该“智能裤子”里有一些特殊的电极,可以通过人工智能控制,给她的瘫痪的腿部发出刺激,就像大脑正常控制腿部一样

https://twitter.com/xiaohuggg/status/1691394196341751808?s=20

4️⃣
🤖 iPlanner:由瑞士苏黎世联邦理工学院的 Legged Robotics 团队开发的一种创新的机器人路径规划方法。
这个方法可以让机器人从开始到结束自己负责整个路径规划过程,不需要人工干预。

https://twitter.com/xiaohuggg/status/1691363188431056896?s=20

5️⃣
🤖Abacus AI :一套整套解决方案,允许用户只需提供文档和评估数据集,就能自动创建出效果最佳的 AI 聊天机器人。
他们采用了 AutoML(自动机器学习)技术,通过自动化的过程选择最佳的模型、参数和训练策略,从而简化了传统的机器学习流程

https://twitter.com/xiaohuggg/status/1691249944307589120?s=20

6️⃣
🔍little-rat :一款 Chrome 扩展程序
它可以监控其他扩展程序的网络调用

https://twitter.com/xiaohuggg/status/1691245105930473472?s=20

7️⃣
🚗 斯坦福大学的一个工程师团队将一辆 1981 年款的 DeLorean 改装成了一辆全电动自动驾驶汽车
并教它“像专业人士一样漂移”

https://twitter.com/xiaohuggg/status/1691241208021233670?s=20

8️⃣
🔥2023 年 7 月是有自 1880 年有记录以来最热的月份!
https://go.nasa.gov/3OTWMh7

https://twitter.com/xiaohuggg/status/1691125378084155393?s=20

9️⃣
📱雷军今天在 2023 年度演讲中对小米 AI 布局的主要内容总结:
1、AI 赋能软硬件:小米计划通过 AI 技术增强其软件和硬件的能力,雷军认为 AI 在小米的技术研发中起着关键作用。
2.、持续布局:自 2016 年 7 月建立 AI 视觉团队以来,小米一直在 AI 领域有计划地扩展,今年 4 月还建立了大模型团队,目前AI 团队超过 3000 人。
3.、全面拥抱大模型:雷军特别提到,小米将全面投入大模型的研发,小爱同学将是第一个使用大模型的产品,并已开始邀请测试。
4.、主要突破方向:小米大模型技术的主要突破方向是轻量化和本地部署,解决如何在手机上使用大模型的关键问题。
5.、根据官方数据,小米在主流中文大模型测试中取得了百亿内参数大模型的第一名,并已实现了 13 亿参数大模型在手机上的运行,部分场景的效果可与 60 亿参数模型的云端运算相媲美。
6.、雷军表示,小米将全力投入大模型赛道,展示了公司对 AI 和大模型技术的长期承诺和信心。

https://twitter.com/xiaohuggg/status/1691117320301875200?s=20

8 月 14 日

🦄 🔔小互的推特 8 月 14 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🌐 Mapbox 地图大更新

  • 动态光照能力

  • 地标 3D 建筑

  • 象征美学

为用户提供了既高性能又优雅的 3D 地图体验,增强了导航和定位的真实性。

🔗https://twitter.com/xiaohuggg/status/1691109625121423360?s=20

2️⃣

🤖 Anthropic 获 SK 电讯 1 亿美元投资

美国 AI 公司 Anthropic 和韩国最大电信运营商 SK 电讯合作,联合开发大语言模型并建立人工智能平台。

🔗https://twitter.com/xiaohuggg/status/1691032566432997376?s=20

3️⃣

📱 SwiftUI 视差滚动轮播效果教程

教你如何实现酷炫的视差滚动效果。

🔗[教程链接](https://t.co/xRFz5OdEd3 | (https://twitter.com/xiaohuggg/status/1691022551076810752?s=20

4️⃣

📖 沃顿商学院教授 Ethan Mollick 对 AI 创造力的观点

“GPT-4 击败 91% 的人类于替代用途测试,99% 的人类于托伦斯创造性思维测试。”

🔗https://twitter.com/xiaohuggg/status/1691013894784143360?s=20

5️⃣

微型仿人机器人足球

由 DeepMind、牛津大学和 Google 合作研发,使用深度强化学习策略踢球。

🔗https://twitter.com/xiaohuggg/status/1691005634777694210?s=20

6️⃣

🏘️ 小镇模拟过程回放

体验一个模拟的小镇生活。

🔗[体验链接](https://reverie.herokuapp.com/arXiv_Demo/# | (https://twitter.com/xiaohuggg/status/1690993995059728384?s=20

7️⃣

📚 斯坦福大学机器学习课程-CS229 (2022 年春季)

帮助学生成功入门机器学习领域的经典课程。

🔗https://twitter.com/GPTDAOCN/status/1690772068525342720?s=20

8 月 13 日

🌰 🔔小互的推特 8 月 13 日更新
✨✨✨✨✨✨✨✨✨

1️⃣
🎵 全球最大的音乐流媒体平台:Spotify 推出 AI 驱动的“DJ”功能。
用户可以收听人工智能生成的 DJ“播放列表”和歌曲评论,并结合用户过去的习惯,提供“量身定制”的体验。该功能由 OpenAI 提供支持,提供精选的音乐以及 AI 生成的有关曲目和艺术家的评论。当用户使用 DJ 功能时,他们将收到个性化的歌曲流,包括新曲目和旧曲目,并附有评论。
🔗https://twitter.com/xiaohuggg/status/1690662411853012992?s=20

2️⃣
🐵 一只名为 Kanzi 的猿被训练玩 Minecraft 游戏。
通过使用情境强化学习、人类反馈、模仿学习、课程学习和强大的视觉系统,Kanzi 能够迅速适应游戏的纹理和物理特性,并成功导航复杂的环境。
🔗https://twitter.com/xiaohuggg/status/1690651659788230657?s=20

3️⃣
🧠 Meta GPT 深度解析
🔗https://twitter.com/xiaohuggg/status/1690639871252348928?s=20

4️⃣
💳 X 获得支付牌照,看来不用注册 Stripe 了
🔗https://twitter.com/xiaohuggg/status/1690561929864204288?s=20

5️⃣
🩺 DoctorGPT 模型 :为每个人提供一个私人医生。通过训练和优化,该模型能够理解和回答医学问题,甚至可以与专业医生的知识相媲美。• 通过了美国医学执照考试• 可离线使用 • 支持 iOS 和 Android 平台 • 开源
🔗https://twitter.com/xiaohuggg/status/1690560761112977408?s=20

6️⃣
🎨 Pixcap:结合了 3D 和 AI 技术图形设计工具
Pixcap 不需要 3D 设计技能或复杂的硬件,只需简单拖动 3D 模型进行混合自由搭配,然后使用文本描述,AI 即可生成 3D 风格的设计图。该工具完全基于浏览器,不用额外的下载和更新模型库,不管是初学者还是设计师都能轻松上手。

网站:https://pixcap.com 模型库:https://pixcap.com/explore
🔗https://twitter.com/xiaohuggg/status/1690550641972969472?s=20

8 月 12 日

🔔小互的推特 8 月 12 日更新
✨✨✨✨✨✨✨✨✨

1️⃣
❤️ 心脏是如何工作的
这个 3D 剖面模型可以让你很直观的看到心脏的工作原理和内部构造!
🔗https://twitter.com/xiaohuggg/status/1690382806013329408?s=20

2️⃣
📱 iOS17 Beta 版的 iPhone 用户可以使用手机克隆自己的声音,并通过手机朗读文本。测试了下只支持英文
🔗https://twitter.com/xiaohuggg/status/1690366683830165504?s=20

3️⃣
🤖 手机合规检测系统,这么牛 P 吗?感觉不好实现吧,除非有超级接口
🔗https://twitter.com/xiaohuggg/status/1690262844170997760?s=20

4️⃣
📚 原帖为“30 ChatGPT 提示让您赚到 100 万美元”永远不会再做出错误的商业决定
🔗https://twitter.com/jesselaunz/status/1690136977864294404?s=20

5️⃣
🎥 封神 2 预告片 #midjounery 生图 1000 来张 #Gen2 转 200 个视频镜头,制作:抖音用户 朋克周
🔗https://twitter.com/xiaohuggg/status/1690212563437699072?s=20

6️⃣
🌟 推荐个宝藏博主 @Salmaaboukarr 专门分享 #Midjourney 的商业应用案例,分享使用提示词来制作各种商品宣传效果图的方法!很实用!
🔗https://twitter.com/xiaohuggg/status/1690192051395284992?s=20

7️⃣
👤 你们敢相信,这些都是不是真人,全是 AI 数字人,现在真是以假乱真,这个效果真的很好,几乎看不出是假人,嘴型都很完美! 国内一家公司做的,但是好像不是简单上传视频能实现的,需要提交资料然后去他们公司量身定制!
🔗https://twitter.com/xiaohuggg/status/1690184793349345280?s=20

8️⃣
🎬 Captions :实现视频制作各个方面的自动化,通过结合 AI 技术和多种创意工具,可以帮你极大地简化了视频制作流程:包括人工智能驱动的字幕、编辑、AI 自动配音、脚本创建、音乐集成等。
🔗https://twitter.com/xiaohuggg/status/1690180824883458048?s=20
‘‘‘

8 月 11 日

🔔小互的推特 8 月 11 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🎥如何使用 #runway 的 Gen-2 生成长达 18 秒的视频

🔗https://twitter.com/xiaohuggg/status/1690018575954644992?s=20

2️⃣

🎮Inworld 与 ElevenLabs 合作为《侠盗猎车手 V》增添 AI NPC 和 AI 声音:30+个新 NPC,全部由 AI 生成对话和声音。

🔗https://twitter.com/xiaohuggg/status/1690014158383644672?s=20

3️⃣

💰"如果这个项目睡觉、旅行时赚不到钱,就不要开始":被动收入指南

总结输出:作者分享了他在自动化收入方面的经验和思考。他强调了自动化收入的概念,即通过一次设置后源源不断地获得收入。他提出了三个原则:收入不能仅依赖工作时间,项目要具有普适性和长期性,并且要独立于其他因素。他分享了自己在国内和国外的自动化收入项目,如软件销售、电子书代理和商业房产租赁。他还提到了网站广告收入和半自动化外汇交易作为自动化收入的其他可能途径。最后,他强调了虚心和灵活学习的重要性,以及实现经济自由和内心自在的目标。

🔗https://twitter.com/xiaohuggg/status/1689946719814037504?s=20

4️⃣

🔐PassGAN:1 分钟破解 51%密码,6 分钟破解 7 字符密码(包含符号)。

卧槽,牛皮。这个工具可以在 1 分钟内破解 51%的密码。
PassGAN 是一种生成对抗网络 (GAN),可以从实际密码泄漏中自主学习真实密码的分布。 它可以在 6 分钟内破解任何类型的 7 个字符密码,即使它包含符号。

🔗https://twitter.com/op7418/status/1689883302730342400?s=20

5️⃣

🎵➡️🖼Music-To-Image:从音乐到图像的深度学习模型。

🔗https://twitter.com/xiaohuggg/status/1689882772952006656?s=20

6️⃣

🤖GPT-LLM-Trainer:将想法迅速转变为训练有素的模型,无需手动数据整理。
只需要描述你想要的模型内容。然后这个 AI 工具将为你自动创建数据集并训练模型,无需手动收集和整理。还可以对模型进行自动微调

🔗https://twitter.com/xiaohuggg/status/1689838232765358080?s=20

7️⃣

🎙PlayHT:跨语言生成逼真人类语音对话工具,<800ms 生成真实人类对话,支持 142 语言/口音。

PlayHT 适用于视频配音、音频出版、对话 AI、自定义语音创建等广泛用途,提供 800 多种自然声音,支持 142 种语言和口音。

官网:http://play.ht

🔗https://twitter.com/xiaohuggg/status/1689831786287972352?s=20

8️⃣

💵X 分钱门槛下调:3 个月从 1500 万阅读量降至 500 万,满 10 美金即可打款。

🔗https://twitter.com/xiaohuggg/status/1689798310566273024?s=20

9️⃣

🚀Midjourney:GPU 服务集群升级,Pro/Mega 用户生成速度提升 1.5 倍,渲染成本降低 1.5 倍。

🔗https://twitter.com/xiaohuggg/status/1689795110857560064?s=20

🔟推荐点开项目地址感受

🎧AudioSep:使用自然语言指令从混音中分离特定声音,无需声音样本。

项目:https://audio-agi.github.io/Separate-Anything-You-Describe/

论文:https://arxiv.org/abs/2308.05037

🔗https://twitter.com/xiaohuggg/status/1689676152347267072?s=20

1️⃣0️⃣

👩FaceChain:上传自己的照片生成你的数字孪生(Digital-Twin),和妙鸭相机功能类似。
可以通过一张或多张照片捕捉个人的外貌特征,并将其转化为数字孪生,并在不同的环境中创建个人照片(例如工作照片)。
FaceChain 使用了多个模型,包括面部检测模型、图像旋转模型、人体解析模型、肤色修饰模型等。

https://twitter.com/xiaohuggg/status/1690007034593185792?s=20

8 月 10 日

❤️ 🔔小互的推特 8 月 10 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🎥Gen-2 更新:现在可以生成长达 18 秒的视频。

🔗https://twitter.com/xiaohuggg/status/1689645188489326592?s=20

2️⃣

🏘斯坦福大学开发的超人前传虚拟小镇"Smallville":25 个由 AI 控制的虚拟人进行日常活动。这是一个开源项目,提供了代码和论文,显示 AI 的新可能性和如何让多个 AI 代理一起工作。

🔗https://twitter.com/xiaohuggg/status/1689444329742352385?s=20

3️⃣

🚀#Claude 发布最新版 Claude Instant 1.2:通过 API 使用,提供更快速度、合理价格和强大功能。处理对话、分析、摘要等任务,并在数学、编码等领域有显著进步。

🔗https://twitter.com/xiaohuggg/status/1689311077644062720?s=20

历史记录:http://waytoagi.com/xiaohu

8 月 9 日

❤️ 🔔小互的推特 8 月 9 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

📱微信公众平台:9 月 1 日起 微信小程序须完成备案后才可上架 逾期未备案的将被清退
微信公众平台宣布从 9 月 1 日起,要求微信小程序完成备案后才能上架。如果微信小程序未上架,则需要在 2023 年 9 月 1 日后完成备案才能上架。

https://twitter.com/xiaohuggg/status/1689288052592553984?s=20

2️⃣

🤨还有人开发这玩意???
http://avscms.com:一个成人视频内容管理系统,可以轻松创建和管理成人视频网站。
而且功能超级强大,叹为观止!用户可以使用 AVSCMS 创建视频、照片和博客的网站或社区。这些内容可以是成人或非成人内容(看你心情)

https://twitter.com/xiaohuggg/status/1689274652231618562?s=20

3️⃣

💻Google 推出了一个名为 Project IDX 的实验性新项目,可以将整个全栈、多平台应用开发工作流程带到云端。Project IDX 允许你在任何地方、任何设备上开发,具有本地开发的全部功能。可以理解为它是一个基于 AI 的浏览器开发环境,它集成了 AI 技术,支持全栈编程语言,提供了跨平台真机预览,并允许一键部署

https://twitter.com/xiaohuggg/status/1689267933191512064?s=20

4️⃣

👥Heygen 创始人展示了其最新的数字人克隆技术。该技术可以完美的克隆自己的形象和声音,同时可以有一定的手势,唇型也很完美!就是眨眼有点厉害!该功能不久将会上线…

https://twitter.com/xiaohuggg/status/1689259886310535174?s=20

5️⃣

🤖百川大语言模型聊天机器人,开启内测
http://chat.baichuan-ai.com

https://twitter.com/xiaohuggg/status/1689161181959790592?s=20

6️⃣

🎥NVIDIA 在 #SIGGRAPH2023 技术展会上展示了 Live 3D Portrait 的应用成果和场景。
它可以创建一个能够使用消费级计算资源和最小的捕获设备,来重建并自动以立体形式展示真实头部大小的 3D 视频会议系统。

https://twitter.com/xiaohuggg/status/1688827418889605120?s=20

7️⃣

🔊英伟达在世界顶级计算机图形学会议 #SIGGRAPH2023 上宣布一系列重磅更新,包括下一代 GH200 超级芯片平台、AI Workbench、OpenUSD 等。这些创新将人工智能、虚拟世界、加速、模拟、协作等融合到一起。

https://twitter.com/xiaohuggg/status/1689089166733418496?s=20

8️⃣

🎨http://Kaiber.ai 宣布结束内测,开放注册了,现在可以直接体验了!
Kaiber AI 是一种 AI 生成引擎,它可以帮助你生成各种艺术风格的美学动画

https://twitter.com/xiaohuggg/status/1689079686528446465?s=20

9️⃣

☁️NVIDIA 和@huggingface

宣布 了一项合作, #NVIDIADGX Cloud 将集成到 Hugging Face 平台中,为数百万开发者提供用于大型语言模型和先进 AI 应用的生成性 AI 超级计算能力

https://twitter.com/xiaohuggg/status/1689074520819458048?s=20

8 月 8 日

📗 🔔小互的推特 8 月 8 日更新
✨✨✨✨✨✨✨✨✨

1️⃣
🔎 Zoom 更新条款引发关注
Zoom 更新服务条款,允许使用用户数据训练 AI,且不提供退出选项。条款授予广泛许可权如修改、分发客户内容,并声称数据将用于 AI 训练。
🔗https://twitter.com/xiaohuggg/status/1688923957091880962?s=20

2️⃣
🌐 OpenAI 发布 GPTBot
OpenAI 推出网络爬虫 GPTBot,从互联网上抓取数据以训练未来 AI。提醒:若不希望 GPTBot 访问网站,可加入 robots.txt。
🔗https://platform.openai.com/docs/gptbot

3️⃣
📱 工业和信息化部发布通知
2023 年 9 月至 2024 年 3 月,已开展业务的 APP 需履行备案手续。
🔗http://t.cn/A60Rz41C

4️⃣
🖥 NVIDIA 展示 3D 技术
在#SIGGRAPH2023 上,NVIDIA 展示了 Live 3D Portrait 应用,能重建立体形式的 3D 视频会议系统。具有 3D 自拍、实时 3D 肖像和 3D 视频会议功能。
🔗https://twitter.com/xiaohuggg/status/1688827418889605120?s=20

5️⃣
🎨 扩散模型解读
模型如 Midjourney 从随机噪声生成图像,先加入噪声使图像模糊,再反转清晰。
🔗https://twitter.com/xiaohuggg/status/1688806721257644032?s=20

6️⃣
🎵 Midnatt 利用深度学习唱歌
流行歌星 Midnatt 利用 NANSY 系统,用 6 种语言录制歌曲。NANSY 处理发音、音色、音高和音量。由首尔的初创公司 Supertone 开发的神经语音处理器,这种方法可以帮助全世界的歌手接触到可能更喜欢听熟悉语言的歌曲的听众。
🔗https://twitter.com/xiaohuggg/status/1688759137369489408?s=20

7️⃣
🔊 AudioLDM 技术
AudioLDM 使用潜在扩散模型从文本描述生成音频和音乐,不需标注数据或大量计算资源。
🔗https://twitter.com/xiaohuggg/status/1688749814891294720?s=20

8️⃣
🎧 AudioLDM 实例
展示从文本提示到音频的生成,包括各种音频样本的控制。
🔗https://audioldm.github.io

9️⃣
🎥 Bing 发布概念视频
Bing 发布概念视频,提高品牌曝光。
🔗https://twitter.com/xiaohuggg/status/1688734792190509056?s=20

1️⃣0️⃣
🔉 ElevenLabs 推出实时输入流功能
允许文本块流式传输到音频中,适用于实时翻译或语音助手。
🔗https://twitter.com/xiaohuggg/status/1688715928870268929?s=20

8 月 7 日

💡 🔔小互的推特 8 月 7 日更新
✨✨✨✨✨✨✨✨✨

1️⃣
🔒利用深度学习模型 通过监听键盘按键声音来盗取用户数据
研究人员训练了一个深度学习模型,它可以通过使用麦克风记录键盘敲击声来窃取数据,准确率高达 95%。使用 Zoom 被用于训练声音分类算法时,预测准确率 93%。

研究人员利用 MacBook Pro 上的 36 个键,各敲击 25 次并记录每次按键产生的声音来收集训练数据。

然后,他们从录音中生成了波形和频谱图,这些图像可视化了每个键的可识别差异,并进行了特定的数据处理步骤,以增强可以用于识别敲击键的信号。

这些频谱图图像被用来训练一个名为"CoAtNet"的图像分类器,而这个过程需要对 epoch、学习率和数据分割参数进行一些实验,直到能够获得最佳的预测准确性结果。

对于过于担心声学侧信道攻击的用户,建议他们可以尝试改变打字风格或使用随机密码。其他可能的防御措施包括使用软件来重现敲击键的声音、白噪声或基于软件的敲击键音频过滤器。最后,使用生物识别认证(如果可行),并使用密码管理器来避免手动输入敏感信息,也是缓解因素。

https://twitter.com/xiaohuggg/status/1688547868175679490?s=20

2️⃣
🚫 马一龙又抢走一个用户的账号 @music

https://twitter.com/xiaohuggg/status/1688509646997536770?s=20

3️⃣
📄PDF Tools :完全免费且无广告的 PDF 工具
工具包括:合并 PDF、分割 PDF、PDF 转 PNG、PDF 转 JPEG、PNG 转 PDF、JPEG 转 PDF、PDF 转 HTML、OCR PDF、压缩 PDF 和旋转 PDF。
另外 http://PDF.AI 还支持和 PDF 文件对话功能。
上传文件或者安装他们的 Chrome 扩展即可和文件对话。完全免费,很方便

100% 免费,无需注册。所有工具都在您的浏览器中运行,以确保完全隐私

https://twitter.com/xiaohuggg/status/1688469307263782912?s=20

4️⃣
🎨 A 当我们在电脑上制作一个动画角色时,我们通常会给它添加一些基本的动作,比如走路、跑步或跳跃。但在真实生活中,当我们移动时,我们的衣物、头发或其他部分也会随之产生一些自然的、次要的动作。
由 Adobe 研究中心研究的项目:Fast Complementary Dynamics via Skinning Eigenmodes(通过皮肤特征模式实现的快速互补动态)
目的就是为电脑上的动画角色添加这种自然的次要动作。为了实现这一目标,研究者们开发了一种新的技术,称为“线性混合皮肤的子空间”。这种技术可以帮助我们更准确地模拟角色的自然动作,特别是旋转动作。
例如,当一个动画角色转身时,我们不仅要确保它的身体正确地转动,还要确保它的衣物、头发等也跟着自然地转动。这就是这项研究所要解决的问题。
这项研究为动画制作者提供了一个工具,使他们能够更加真实地模拟动画角色的动作,使其看起来更加自然和真实。

https://twitter.com/xiaohuggg/status/1688398681912078336?s=20

5️⃣
🔧MetaGPT:一个多代理框架,主要针对软件项目开发工作。
你只需要给它一句话的文本需求,它就能给你输出用户故事、竞品分析、需求、数据结构、APIs、文件等一个软件开发的全过程和标准操作流程 (SOP)。
例如,输入 "写个类似今日头条的推荐系统",MetaGPT 会输出数据结构与 API 设计等内容。

MetaGPT 项目旨在自动化软件开发的各个阶段,从需求分析到设计和实现。

该框架的多智能体设计意味着可以为 GPT 分配不同的角色,如产品经理、架构师、项目经理和工程师,使其更好地协同工作。

通过 MetaGPT,开发者可以更加轻松地将他们的创意转化为实际的软件项目,而无需进行繁琐的手工编码。
此外,它还支持文本生成图片等功能。该项目的目标是将不同的角色分配给 GPT,形成一个用于复杂任务的协作软件实体。
通过使用 MetaGPT,开发者可以自动化软件开发的许多前期工作,从而更加高效地将他们的创意转化为实际的软件项目。

官方介绍:生成一个包含分析和设计的示例大约需要 0.2 美元(GPT-4 api 的成本),整个项目大约需要 2.0 美元。

看起来很便宜

论文:https://arxiv.org/abs/2308.00352
GitHub:https://github.com/geekan/MetaGPT

https://twitter.com/xiaohuggg/status/1688374030825615360?s=20

6️⃣
📺YouTube 上 Graphics in 5 Minutes 这个频道 https://youtube.com/@g5min 有很多系列视频做的相当不错,比如这个《Large Language Models from scratch》从常见的自动完成开始解释了 ChatGPT 和 Palm 等语言模型是如何工作的,以及 Transformer 和 LLM 背后技术。

https://twitter.com/dotey/status/1688218021653827584?s=20

8 月 6 日

🎉 🔔小互的推特 8 月 6 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🔫 世界首款智能手枪在美上市。这款枪具备指纹和面部识别功能,只有经过验证的用户才能开枪。市场售价为 1,499 美元,与普通手枪相比价格较高,但有望减少枪支暴力。

🔗https://twitter.com/xiaohuggg/status/1688198239663894528?s=20

2️⃣

🤖 4 张图表展示 AI 进展迅速。时代周刊报道,AI 在众多任务上超过人类,其进步速度不断加快。未来几年内,AI 可能会掌握今日的专家都难以达到的知识,但也带来滥用的风险。

🔗https://twitter.com/xiaohuggg/status/1688189173839306752?s=20

3️⃣

🌊 当虚拟现实遇到水滑梯,VRSlide®为游客带来沉浸式体验。Ballast VR 开发的这一系统,为水上乐园带来全新视觉体验,已在多家乐园成功应用。

🔗https://twitter.com/xiaohuggg/status/1688182302730559488?s=20

4️⃣

🚀 喷气背包大赛盛大举行!

🔗https://twitter.com/xiaohuggg/status/1688122464201756672?s=20

5️⃣

🎥 Lalamu Studio 推出 Demo:利用 AI 实现口型与声音的同步。该工具支持视频上传、文本转语音等功能,初期仅支持德、英两种语言。

🔗https://twitter.com/xiaohuggg/status/1688058582527574017?s=20

6️⃣

🎨 新的 Figma 插件登场:单击即可将矢量图形转为 3D 视觉。

🔗https://twitter.com/xiaohuggg/status/1688011561322045440?s=20

7️⃣

http://videocelebs.net
一个专门收集电影被删减片段的网站,你们懂得

https://twitter.com/xiaohuggg/status/1688204258158788608?s=20

8 月 5 日

🐙 🔔小互的推特 8 月 5 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🤖Sweep: AI 初级开发者,可以查看、理解你的代码,并自动编写和提交代码更改,节省开发时间。不同于只在编写代码时提供帮助的工具,Sweep 能处理整个流程,从分析问题到提交解决方案。

🔗https://twitter.com/xiaohuggg/status/1687827402091884544?s=20

2️⃣

🔬Dynalang: 加州大学伯克利分校的研究项目,理解人类语言指令并构建一个能预测未来情况或事件的多模态世界模型,实现自主任务执行和对未来可能遇到的新情境的理解。

🔗https://twitter.com/xiaohuggg/status/1687744241743904768?s=20

3️⃣

📚Read Something Wonderful: 一个提供深度、有价值、经得起时间考验的文章的网站,帮助我们跳出短视的信息流。

🔗https://twitter.com/xiaohuggg/status/1687668853973958656?s=20

4️⃣

🚽Poopfiction: 提供不同长度英文故事的网站,方便在闲暇无聊或者拉便便的时候阅读。

🔗https://twitter.com/xiaohuggg/status/1687650280136142848?s=20

5️⃣

🎭Cyan Puppets: 广州的一家公司,利用 AI 图像算法技术实现 2D 视频生成 3D 动作数据,主要为腾讯游戏、bilibil、完美世界、清华大学、北大等客户提供技术。

🔗https://twitter.com/xiaohuggg/status/1687641863699017729?s=20

6️⃣

🎨Mandala 3D: 一个能够创造出好看的 Mandala 3D 图案的在线工具,可用于消解压力和放松心情。

🔗https://twitter.com/xiaohuggg/status/1687630030514597890?s=20

7️⃣

💰CoreWeave: 专业云服务提供商,成功筹集到了 23 亿美元的债务融资,用于扩大公司规模以满足不断增长的 AI 工作负载。资金由 Magnetar Capital 和 Blackstone 领投。

🔗https://twitter.com/xiaohuggg/status/1687504563992244224?s=20

8️⃣

🇯🇵SoftBank: 成功开发日本版「GPT」,计划在明年推出成品产品。软银还将成立全资子公司 SB Intuitions,与微软合作为日本企业提供可信的服务。

🔗https://twitter.com/xiaohuggg/status/1687491461963821056?s=20

8 月 4 日

🤖 🔔小互的推特 8 月 4 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🤖️ PrettyPolly 是一个免费的 AI 机器人,可陪你学习和练习 27 种语言,提供模拟真人对话体验,还可保存对话并评价流利度,推荐程度:☆☆☆☆☆。

🔗https://twitter.com/xiaohuggg/status/1687387647130693632?s=20

2️⃣

🚗 清华大学 MARS 实验室的 NMP Autonomous Driving 项目,通过神经网络预学习地图信息进行智能驾驶辅助,提高自动驾驶的局部地图推理性能。

🔗https://twitter.com/xiaohuggg/status/1687467271458013184?s=20

3️⃣

📊 Aditi Khinvasara 在 LinkedIn 上分享了关于理解数据平台、治理和运营的重要性的帖子,带有很棒的图表。

🔗https://twitter.com/xiaohuggg/status/1687373981664555009?s=20

4️⃣

📝 小互发布了一则调查问卷,想要了解大家的浏览习惯,喜欢阅读文章还是主题帖。

🔗https://twitter.com/xiaohuggg/status/1687326052681748480?s=20

5️⃣

🎓 MIT 的深度学习入门课程,适用于对机器人等领域感兴趣的人。

🔗https://twitter.com/dotey/status/1687284120173297664?s=20

6️⃣

🎨 Alpaca 是一款可以嵌入到 Photoshop 中的 AI 工具套件,可以将草图、缩略图或简单的涂鸦渲染成精美的图像。

🔗https://twitter.com/xiaohuggg/status/1687281609605853184?s=20

7️⃣

🎧 苹果 Siri 新专利:通过 AirPods 运动传感器和语言模型训练“读取”唇语,以提高语音识别的准确度。

🔗https://twitter.com/xiaohuggg/status/1687263373669601280?s=20

8️⃣

🔄 已经获得了 Chat GPT 的 Suggested replies 功能的灰度测试,同时 Chat GPT 将进行一系列更新。但是小互觉得没用

🔗https://twitter.com/xiaohuggg/status/1687256616389976064?s=20

9️⃣

🔐 Azure ChatGPT 支持 GPT-4,提供私有数据保证和 OpenAI 服务操作隔离,为用户提供私密且安全的 ChatGPT 服务。

🔗https://twitter.com/xiaohuggg/status/1687137990840393728?s=20

8 月 3 日

🤖 🔔小互的推特 8 月 3 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🔵 Azure 发布支持 GPT-4 的 ChatGPT,它提供了私有数据保证并与 OpenAI 进行了服务操作隔离。它允许用户将网络流量完全隔离到他们自己的网络,这为企业用户提供了一个私有且安全的 ChatGPT 服务。

🔗 http://dub.sh/agpt

🔗 https://twitter.com/xiaohuggg/status/1687136810928062464?s=20

2️⃣

📚《LangChain:构建与数据对话的聊天机器人》

课程地址:https://t.co/Cwsv7tvKL6

B 站播放列表:https://www.bilibili.com/video/BV1ZP411e76c

3️⃣

🚀 NASA 和 DARPA 宣布将在 2025 年发射世界上第一枚核动力火箭 DRACO,可将宇航员送上火星的时间从 7 个月缩短至 45 天。该火箭是基于核裂变反应提供动力的新型推进系统,将用于演示新技术。

🔗 https://twitter.com/xiaohuggg/status/1687122943325970432?s=20

4️⃣

🖼️ 英伟达发布一种新的文本到图像个性化模型:Perfusion。它只需要一个 100KB 的模型大小,训练大约 4 分钟,就可以创造性地描绘个性化的对象。

🔗 https://twitter.com/xiaohuggg/status/1687116597385990144?s=20

5️⃣

🎥 《The Frost》:这部电影短片的每一帧都是由 AI 生成的,制作团队是 Waymark 公司。他们使用了 OpenAI 的图像生成模型 DALL-E 2 来生成每一帧,然后使用 D-ID 为这些帧添加动画,使眼睛能够眨动,嘴唇能够移动。

🔗 https://twitter.com/xiaohuggg/status/1687062061908709382?s=20

6️⃣

🎮 Inworld AI 是一家专注于游戏和人工智能的初创公司,他们开发了一种名为 Inworld 的 AI 角色引擎,它可以将游戏的 NPC 进行 AI 化,并可以集成到游戏当中。

🔗 https://twitter.com/xiaohuggg/status/1687047341969440768?s=20

7️⃣

🕸️ Wayback Machine 是互联网历史档案馆,保存了 8280 亿个网页。它可以让用户浏览和搜索过去的任何网页版本,即使网站已被删除。

🔗 https://twitter.com/xiaohuggg/status/1687038273540276224?s=20

8️⃣

🔊 Meta AI 发布从文本生成高质量、逼真的音频和音乐的模型 AudioCraft。AudioCraft 由三个模型组成:MusicGen、AudioGen 和 EnCodec。

🔗 https://twitter.com/xiaohuggg/status/1686982046206611456?s=20

8 月 2 日

🤖 🔔小互的推特 8 月 2 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

💻 AI.com 已经跳转到了 http://X.ai,意味着马斯克购买了该域名,据说花了 1000 万美金!此域名原本在奥特曼手里,此前 OpenAI 原本计划通过 http://AI.com 将 ChatGPT 打造成人工智能的代名词!根据 Whois 记录,http://AI.com 原本是由 Google 拥有的。该域名在 1993 年注册,后来被 OpenAI 以多百万美元的价格购买。

🔗https://twitter.com/xiaohuggg/status/1686755987103830016?s=20

2️⃣

🦩 Med-Flamingo:一种多模态的只需少量样本即可训练的医学模型。他的一个重要特性是它可以实时的从少量实例中学习,这在医学领域非常重要,因为医学数据通常是稀缺的。Med-Flamingo 在配对和交错的医学图像-文本数据(数据来自出版物和教科书)上进行预训练。该项目基于的是 Llama-7B 模型!

🔗https://twitter.com/xiaohuggg/status/1686731720521895936?s=20

3️⃣

🌊 怪不得要跳海。你们看看这 AI 效果。

🔗https://twitter.com/xiaohuggg/status/1686721953292492800?s=20

4️⃣

🎨 Recraft AI:是一个生成式 AI 工具,它可以帮助设计师、营销人员和艺术爱好者创建高质量的矢量艺术和插图。你只需要输入文字提示它就可以生成矢量艺术、图标、3D 图像和插图,同时还可以在线编辑。更重要的是这些都只需要在浏览器当中即可完成,不需要任何下载。

🔗https://twitter.com/xiaohuggg/status/1686687267702865920?s=20

5️⃣

🧠 费恩斯坦医学研究所的科学家们利用 AI 成功地为一名四肢瘫痪患者重新建立了大脑、身体和脊髓之间的连接。他们在患者的大脑内安装了一个植入物。这个植入物包含五个微芯片,并使用一个 AI 程序将患者的思想转化为行动。大脑植入物让患者能够感觉到触感,并移动他的一些身体部位。

🔗https://twitter.com/xiaohuggg/status/1686655443429728256?s=20

6️⃣

🧠 清华大学的研究人员提出了一种非侵入性的接口,可以通过一种放入内耳的微型设备将人脑与电脑连接起来。这个接口被称为 "SpiralE",是一种螺旋形状的设备,可以在不需要任何附件的情况下,且不影响装备者的听觉,轻松地滑入和取出。

🔗https://twitter.com/xiaohuggg/status/1686584859333107712?s=20

7️⃣

🤖 Meta AI 的 CM3leon 的新型多模态生成模型,它可以同时进行文本到图像和图像到文本的生成。Meta 称尽管其训练计算量比以前基于 Transformer 的方法少五倍,但它仍实现了文本到图像生成的最先进性能。CM3leon 在各种视觉语言任务中表现良好,包括视觉问题回答和为图像生成详细的描述中。

🔗https://twitter.com/xiaohuggg/status/1686576625436303360?s=20

8️⃣

🍎 苹果公司的 #AppleVisionPro 头显获得了一项技术专利,可模拟生成花香等多种气味。该专利名称为:"非可见现象的可视化",这项专利旨在弥补增强现实、虚拟现实和物理环境之间的差异,通过计算机生成来增强内容,让佩戴者感知无线电等不可见特征。

🔗https://twitter.com/xiaohuggg/status/1686565613282680832?s=20

9️⃣

💇‍♂️ CT2Hair:全自动的 3D 头发建模框架。它使用真实的假发作为输入,然后能够为各种头发样式重建头发丝。CT2Hair 使用计算机断层扫描(CT)技术来创建头发区域的密度体积。这种技术使得我们能够看穿头发,而不像基于图像的方法那样只能重建可见的表面。它可以更准确地捕捉到头发的内部结构。

🔗https://twitter.com/xiaohuggg/status/1686561092808605696?s=20

1️⃣0️⃣

👩‍⚕️ 可穿戴超声波扫描仪:帮助女性更早发现乳腺癌。麻省理工大学的研究人员设计了一种可穿戴的超声波设该人工智能程序可以预测 COVID-19 病人可能需要机械通气的时间

MIT 的研究人员开发了一个人工智能程序,它可以根据病人的医疗记录和生物标志物的变化预测病人可能需要机械通气的时间。这个程序可以帮助医生更好地管理呼吸机资源,并在需要的时候立即采取行动。

https://twitter.com/xiaohuggg/status/1686392140723830784?s=20

8 月 1 日

🤖 🔔小互的推特 8 月 1 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🎬MovieChat:一个理解长视频的系统,能理解视频内容并回答关于视频的问题,MovieChat 整合了视觉模型和大型语言模型,以克服特定预定义视觉任务的限制。该模型将记忆分为短期记忆和长期记忆两种类型。短期记忆负责最新事件的记忆,长期记忆存储的是视频中的关键信息,这些信息在长时间内保持不变。

🔗http://rese1f.github.io/MovieChat

📜http://arxiv.org/abs/2307.16449

🔗https://twitter.com/xiaohuggg/status/1686333119882985473?s=20

2️⃣

🔌超导能给人类生活带来什么样的改变?看看推油@justin_hart 用 AI 做的视频展示。视频演示了 LK-99 的应用场景和对未来的展望。

🔗https://twitter.com/xiaohuggg/status/1686321953114914816?s=20

3️⃣

💡劳伦斯伯克利国家实验室(LBNL)的模拟计算结果支持 LK-99 作为室温常压超导体。通过模拟和计算研究发现,当铜原子在晶体中的特定位置上时,这种材料可能会显示出超导性。然而,这些结果是基于理论模型和计算的,而不是实验测量。这为进一步的实验研究提供了理论基础!

🔗http://t.cn/A60NRqy7

🔗https://twitter.com/xiaohuggg/status/1686255122488471552?s=20

4️⃣

🔖OpenAI 7 月 18 日向美国专利商标局 (USPTO) 提交了“GPT-5”的商标申请!根据美国专利商标局展示的信息,GPT-5 提供的功能包括自然语言处理、文本生成、理解、语音转录、翻译、预测和分析等。

🔗https://twitter.com/xiaohuggg/status/1686234435140919296?s=20

5️⃣

🚨日本两艺术系女生欲跳崖 称“她们的人生被 AI 毁掉了”。日本福井新聞报道了两起与人工智能(AI)相关的自杀企图事件。这两起事件都发生在日本福井县坂井市的東尋坊,这是一个知名的观光地,也是一个悬崖峭壁。

🔗https://twitter.com/xiaohuggg/status/1686219838015082498?s=20

6️⃣

🔬北京航空航天大学材料科学与工程学院和印度 CSIR-国家物理实验室分别发表了论文表示,韩国的 LK-99 室温超导并没有复现,结果并未确认在室温下存在大量的超导性。两家都表示:需要进一步的研究来确定 LK-99 是否存在室温超导性。

🔗https://twitter.com/xiaohuggg/status/1686202408354062337?s=20

7️⃣

📸麻省理工学院(MIT)的研究团队开发了一种名为 PhotoGuard 图像保护面具的新技术,可以防止 AI 系统未经授权地操纵图像。MIT 的科学家们创建了一种实质上是保护性的面具,能够防止这些模型操纵图像。这些面具对人眼是不可见的,当与生成性 AI 图像模型交互时,会使输出看起来扭曲。

🔗https://twitter.com/xiaohuggg/status/1686191519576084480?s=20

8️⃣

⛅欧洲中期天气预报中心(ECMWF)已经开始探索使用机器学习模型来改进其地球天气系统模型。他们已经上线了一个人工智能天气预测系统,使用的是华为的 Pangu-Weather 天气大模型。

🔗https://twitter.com/xiaohuggg/status/1686196923852865536?s=20

9️⃣

🎨http://Pixellab.ai 这个 AI 生成像素画的看着不错,让草图、线稿都可以轻松变成像素插画。很多功能都是为像素游戏量身定制的。

🔗https://twitter.com/dotey/status/1685992295814877184?s=20

7 月 31 日

🤖 🔔小互的推特 7 月 31 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

💡由于 #Claude 只能在美国和英国访问,X 友搭建了一个 #Claude2 镜像站:http://claudeai.ai,这个镜像站可以在所有地方使用,不限 IP,目前完全免费。

🔗https://twitter.com/xiaohuggg/status/1686013848740823041?s=20

2️⃣

🔍FacTool:生成式 AI 事实检测工具。它主要用于检测大型语言模型(如 GPT-4)生成的文本回答的事实准确性。FacTool 可以对四种任务进行事实错误检测:基于知识的问题回答、代码生成、数学问题解决、科学文献审查。它会使用各种工具收集关于生成内容的事实性证据,以检验回答的准确性。

🔗https://twitter.com/xiaohuggg/status/1685999388559372299?s=20

3️⃣

📹http://Metaphysic.ai 展示了一种新技术,使用生成 AI 模拟人类语音和唇部动作,创建非常真实的语音和视频内容。该技术可以将语音内容翻译成多种语言格式,并保持唇形一致,这个过程是自动的,不需要人工参与。他们将一段英语歌曲转化为法语、西班牙语、中文等语言的视频引起了大家的关注。

🔗https://twitter.com/xiaohuggg/status/1685988718161842177?s=20

4️⃣

🛠️尽管 GPT 的热度有所下降,但它仍对个人用户的编程工作提供了巨大的帮助。只需与 GPT 进行几轮对话,就可以快速地开发出一些自用的小工具,如自动下载 YouTube 字幕,用 Claude 非官方 API 进行总结概括等。教程和源代码可以在下面的链接中找到。GPT4写Python脚本分享

🔗https://twitter.com/vista8/status/1685681348080771072?s=20

5️⃣

🎶http://Banger.show 是一个帮助音乐创作者为他们的歌曲创建可视化的视觉效果的工具,以吸引观众。这些视频会随着音乐的节奏和旋律变化,为观众提供一种视觉体验。例如,如果你是一位音乐制作人,你可以使用这个工具为你的未发布歌曲制作一段视觉效果酷炫的视频,这有助于你在社交媒体上获得更多的关注。

🔗https://twitter.com/xiaohuggg/status/1685896199138922496?s=20

6️⃣

🖥️Gorilla:一种能连接海量 API 的大型语言模型,也是一个面向 LLMs 的 API 应用商店,它被训练来理解和生成 API 调用。Gorilla 的主要目标是为大型语言模型(LLMs)提供一个 API 商店,它能够准确地调用超过 1600 个(并且数量还在增加)的 API。

项目:https://gorilla.cs.berkeley.edu

论文:https://arxiv.org/abs/2305.15334

🔗https://twitter.com/xiaohuggg/status/1685889647912902656?s=20

7️⃣

🤔LiarLiar AI:一款人工智能测谎仪,可以在视频通话或视频中分析一个人是否在撒谎。它通过分析微动作、心率和身体语言中的微妙线索来检测欺骗行为。LiarLiar 可以与 Zoom、Google Meet、Skype 等流行的视频通话软件兼容,可用于任何视频源,包括 YouTube 或您自己的本地视频,随时分析任何对话。

🔗https://twitter.com/xiaohuggg/status/1685854457064751104?s=20

8️⃣

🏥Google Deepmind 发布了 Med-PaLM M,一种全能型生物医学 AI 系统,能够解读并整合医学领域的多种数据模态。Med-PaLM M 是一种大型多模态生成模型,可以灵活地

编码和解释涵盖临床语言、医学成像、基因组学等领域的生物医学数据,从而更好地完成各种任务。

🔗https://twitter.com/xiaohuggg/status/1685844930311368704?s=20

7 月 30 日

🤖 🔔小互的推特 7 月 30 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

📚《Transformer 神经网络架构全面指南》深入解析了 2017 年著名的“attention is all you need”论文,包括 Transformer 神经网络架构、应用、影响、挑战以及未来发展方向。本文还详细剖析了 Transformer 模型的核心,包括编码器、解码器、注意力机制、多头注意力、MLPs、嵌入和位置编码层等各个关键组件。

🔗https://twitter.com/xiaohuggg/status/1685639115122135040?s=20

2️⃣

🎓Skill-It 是一种新的理解和训练大型语言模型的方法。这个思想是基于人类在学习新技能时的特定顺序,认为语言模型在学习不同任务时也可能有一种自然的顺序。论文通过合成数据和真实数据证明了这种有序技能集的存在,并提出了一种新的框架来更好地理解语言模型并进行数据高效训练。

🔗https://twitter.com/xiaohuggg/status/1685578104725753856?s=20

3️⃣

💻英伟达 H100 GPU 现已对亚马逊 AWS 云服务用户开放,该服务允许用户通过浏览器轻松扩展生成式 AI、高性能计算(HPC)和其他应用。H100 GPU 具有对 Transformer 的优化,提供超级计算级性能,包括第四代 Tensor Cores、新 Transformer 引擎和最新的 NVLink 技术。

🔗https://twitter.com/xiaohuggg/status/1685522197753040896?s=20

4️⃣

🛠️倪爽老师分享的将长文件自动拆分成多个小块让 GPT 自动执行任务的插件测试结果十分满意。该插件不仅支持全面的文件类型,包括压缩文件,还允许分别自定义各部分 Prompt,还可以设置一个总的 Prompt,处理完毕后进行自动整合整理。

🔗https://twitter.com/xiaohuggg/status/1685493135881994240?s=20

5️⃣

🔬http://Smart-Biology.com 是一款专注于生物学教育的在线平台,提供了基于高度可视化的互动教学方式来理解生物学。网站提供了各种科学精确的 3D 互动生物学课程,包括高质量精确的动画、3D 互动结构、图表等,学生可以看到、听到原子、基因、细胞、进化等并与之互动。

🔗https://twitter.com/xiaohuggg/status/1685483880105771008?s=20

7 月 29 日

🤖 🔔小互的推特 7 月 29 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

📹 【牛逼,必看】Runway Gen 2 的图转视频功能再升级升级绝对是到了 AI 视频的拐点。最近看了很多利用 Gen 2 制作的短片都很惊艳,虽然这些短片在现阶段来看还是有一点粗糙,我想用不了多久 AI 短视频将会出现质的飞跃。做了个合集!希望能大家带来一些灵感和启发

🔗https://twitter.com/xiaohuggg/status/1685294518038614016?s=20

2️⃣

🍎 Ml-Stable-Diffusion 更新,现在你可以在 Mac 上运行 SDXL 了!更新内容:

  1. Apple 的转换和推理包现在支持 SDXL,2。演示应用程序现在支持 SDXL,3.Core ML 的新混合位量化,使模型变得更小、更快。4.提供了可以直接使用的 Core ML 模型。

🔗https://twitter.com/xiaohuggg/status/1685260011407372288?s=20

3️⃣

🏢 X 总部大楼 logo 更换完毕,还带闪烁 ,哈哈哈

🔗https://twitter.com/xiaohuggg/status/1685239710040616961?s=20

4️⃣

🔇 AlterEgo:无需张嘴发声,即可和电子设备或者他人进行无声交流。AlterEgo 是一个非侵入性的可穿戴设备,只需要贴在下巴部位即可。它的工作原理是通过检测用户在内心中表达词语时的肌肉信号来重建声音,从而允许用户与计算设备、AI 助手、应用程序或其他人进行无声、隐蔽且无缝的交流。

🔗https://twitter.com/xiaohuggg/status/1685213611395010560?s=20

5️⃣

🤖 Googl DeepMind 发布了一种新的机器人控制模型 Robotic Transformer 2(RT-2)能够处理和理解视觉输入,如从摄像头捕获的图像,理解人类的命令或者生成描述其行为的语句。然后生成能够控制机器人的动作。同时它能从网络和机器人数据中学习,并将这些知识转化为通用指令

🔗https://twitter.com/xiaohuggg/status/1685126183376289792?s=20

6️⃣

📁 微软 7 月 27 日突然宣布,将与其生成 AI 业务相关的所有数据中心运营全部迁至日本国内。

  • 将与企业相关的生成 AI 数据中心运营全部迁至日本

  • 扩充东日本的数据中心,并在国内提供生成 AI 功能

  • 将数据的流通和管理限定在国内,加强信息管理

🔗https://twitter.com/xiaohuggg/status/1685180167520710657?s=20

7️⃣

📺 分享一个有意思的网站 http://My90sTV.com 模拟 90 年代的电视体验,让你可以回顾那个时代的原始广告、音乐视频、电影预告、电视节目等内容。网站的设计让你感觉就像是在操作一台老式电视,网站上有多个频道供你选择,同时还有其他年代的电视机供你选择!

🔗https://twitter.com/xiaohuggg/status/1685159805173022720?s=20

8️⃣

🦙 Meta AI 在一篇新论文中公布了有关 Llama 2 的架构、训练计算、微调方法等更多细节。

🔗https://twitter.com/dotey/status/1684962106653777921?s=20

9️⃣

🎭 这个挺好玩的,好像是用 Unity Face Capture 制作的,进行真人面部捕捉然后生成了卡通造型。

🔗https://twitter.com/xiaohuggg/status/1685130623294541824?s=20

7 月 28 日

🤖 🔔小互的推特 7 月 28 日更新
✨✨✨✨✨✨✨✨✨

1️⃣ 🐦 Restore Birdie:一款能让小蓝鸟复活的插件😄。对马斯克的𝕏不满?使用此插件,让小蓝鸟重返视线!包括:Twitter 主标志 / 网站 icon 图标 / 加载屏幕上的徽标

https://twitter.com/xiaohuggg/status/1684892936805425153?s=20

2️⃣ 📹 WhatsApp Video Messages:你现在可以发送最长 60 秒的视频消息给你的朋友,收件人看的时候,默认静音播放🔇。WhatsApp 说,视频消息已经支持端对端加密🔒。不过,有人指责它抄袭 telegram🤔

https://twitter.com/xiaohuggg/status/1684889755732078592?s=20

3️⃣ 👾 新型越狱方式:一种针对 LLM 的新型越狱方式出现,它可以自动构建对 LLM 的攻击,选择一些字符序列附加到用户查询,即使会产生有害内容,也会让系统顺从用户命令🎯。据说这个攻击方式对 ChatGPT 是有效的

https://twitter.com/dotey/status/1684820067010158592?s=20

4️⃣ 🎥 突破 Gen 2 的 4 秒限制:有人开发了一款工具,可以无限生成视频🔄!就是利用 Gen 2 生成视频的最后一帧作为新的起点,然后继续投喂给 Gen2,如此往复,将原本只有 4 秒的 AI 视频延长到任意长度⏱️

https://twitter.com/xiaohuggg/status/1684788562909417472?s=20

5️⃣ 🕶️ @TranscribeGlass:斯坦福大学的一个学生开发了一款能为听障人士实时转录语音的眼镜🔍,将对话人的语音转为文字,在眼镜上以实时字幕的形式显示!

https://twitter.com/xiaohuggg/status/1684773444691648512?s=20

6️⃣ 🧪 人工智能加速催化剂发现:Meta AI 公布了 Open Catalyst Project 的演示,旨在利用机器学习加速寻找催化剂的项目🔬。Open Catalyst 支持 11,427 种催化剂材料和 86 种吸附剂,模拟过程只需几分钟!

https://twitter.com/xiaohuggg/status/1684760749472960512?s=20

7️⃣ 📷 csm.ai 的图片生成 3D 图像:csm.ai 的图片生成 3D 图像似乎又升级了,效果惊人👏

https://twitter.com/xiaohuggg/status/1684738098482278400?s=20

8️⃣ 🎞️ Photoshop 中的生成扩展功能:Photoshop 的生成扩展功能现在也支持视频画面扩展!

https://twitter.com/xiaohuggg/status/1684736286366810112?s=20

9️⃣ 🎤 ElevenLabs 更新了默认语音库:ElevenLabs 扩展了语音服务的范围,包括多种口音和大量的使用场景,从卡通、视频游戏、有声读物甚至 ASMR 都有!

https://twitter.com/xiaohuggg/status/1684594071187386368?s=20

🔟 🧑‍🎨 Live 3D Portrait:一种实时的 3D 人像视图合成系统,能从单张图片中推断并渲染出逼真的 3D 人像🖼️。使用了图像编码器技术,通过体积渲染技术来生成 3D 视图,可以在普通的电脑上以 24 帧/秒的速度运行🚀。

https://twitter.com/xiaohuggg/status/1684574976303857665?s=20

7 月 27 日

🤖 🔔小互的推特 7 月 27 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

👥 Live 3D Portrait:这是一个实时的 3D 人像视图合成系统,能从单张图片中推断并渲染出逼真的 3D 人像。它使用图像编码器技术预测神经辐射场的三平面表示,通过体积渲染技术来生成 3D 视图,可以在普通电脑上以 24 帧/秒的速度运行。
🔗https://twitter.com/xiaohuggg/status/1684574976303857665?s=20

2️⃣

🐦 马斯克的 Twitter 更新:马斯克宣布,Twitter 将只有暗黑模式,不再提供其他选择。
🔗https://twitter.com/xiaohuggg/status/1684535718423699457?s=20

3️⃣

🚀 亚马逊云推出 Amazon Bedrock AI 代理功能:该功能可以协调基础模型、数据源、软件应用程序和用户之间的交互,并自动执行 API。开发人员可以轻松地集成这些代理,加速生成性 AI 应用程序的交付,节省数周的开发工作。
🔗https://twitter.com/xiaohuggg/status/1684490042990034947?s=20

4️⃣

📖 得到听书入眠体验:作者分享了他听的一本书《认知操纵》中提到的观点,觉得这正是 GPT3.5 和 4.0 的功能。
🔗https://twitter.com/xiaohuggg/status/1684442418723315712?s=20

5️⃣

🌐 Overture 地图基金会发布全球开放地图数据集:这个数据集由亚马逊、微软和 TomTom 等公司共同创立,包含全球近 6000 万个地点的数据。目标是通过合作创建一个全面且最新的开放地图数据集。
🔗https://twitter.com/xiaohuggg/status/1684431395987529728?s=20

6️⃣

🛠️ 分享一个下载视频字幕的工具:这个工具名为 yt-dlp,可以简单方便地下载各大网站(包括爱奇艺/腾讯/Bilibili/Youtube 等)的视频字幕。
🔗https://twitter.com/Barret_China/status/1684228477644570624?s=20

7️⃣

🎧 WavJourney:这是一个根据文本指令生成音频内容的 LLMs 系统,只需要给定指定场景的文本描述,就能生成音频讲故事的结构化脚本,并进行自动配音,生成一套完整的音频播客内容。
🔗https://twitter.com/xiaohuggg/status/1684393837249327104?s=20

8️⃣

🚀 Stability AI 发布 Stable Diffusion XL 1.0:该版本升级了参数数量和精炼器,是所有开放访问图像模型中参数数量最大的之一。
🔗https://twitter.com/xiaohuggg/status/1684385716086915072?s=20

9️⃣

🤖 专门开发了一个脏话杠精版的 GPT:有兴趣的人可以尝试体验被骂的滋味。
🔗https://twitter.com/xiaohuggg/status/1684372116186230785?s=20

🔟

🔬 当人类卵子被精子酶激活时,就会发生锌烟花爆炸:这些“火花”的大小是其发育成胚胎的能力的直接衡量标准,生命始于一道闪光,类似宇宙大爆炸。
🔗https://twitter.com/xiaohuggg/status/1684237768682262529?s=20

7 月 26 日

📚 🔔小互的推特 7 月 26 日更新
✨✨✨✨✨✨✨✨✨

1⃣️

🐦马斯克正在抹去所有关于小蓝鸟的东西

🔗https://twitter.com/xiaohuggg/status/1684188945909940224

2⃣️

🤝OpenAI,Anthropic,Google 和 Microsoft 联合成立:“Frontier Model Forum”行业组织,专注于确保前沿 AI 模型的安全和负责任的开发。主要目标:推进 AI 安全研究,促进前沿模型开发并最小化潜在风险,识别前沿模型的安全最佳实践,分享知识,以推进负责任的 AI 开发,支持利用 AI 解决社会最大挑战的努力

🔗https://twitter.com/xiaohuggg/status/1684158150558224385?s=46

3⃣️

🎬Runway Gen-2 Image-to-Video ,案例大合集

🔗https://twitter.com/xiaohuggg/status/1684143977531052032?s=46

4⃣️

🎞️Text 2 Cinemagraph:使用文本描述创建动态电影艺术图像,使用了从单个文本提示中合成图像双胞胎的想法。这个方法会生成两个图像:一个艺术图像(静态),另一个现实图像(动态),然后分析现实图像预测其运动状态。最后这个预测的运动会被应用到艺术图像上,使整个图像动起来,从而创建一个电影图。

🔗https://twitter.com/xiaohuggg/status/1684079651646484480?s=46

5⃣️

🚀Kaiber.ai 宣布推出 Motion 功能,一种能将图片生成动画的功能,根据预览 Demo 视频来看效果还不错,现在可以申请内测排队:bit.ly/3Qb9Tvu

🔗https://twitter.com/xiaohuggg/status/1684073144116707329?s=46

6⃣️

🤖Human-Timescale Adaptive Agent:一种人工智能代理,可以像人类一样快速地适应解决 3D 空间问题。例如,3D 空间中,给定的任务是打开门,移动物体。然后,你改变其中的一些动态因素,比如物体的位置,门的开关状态等。这时代理需要利用已经获取的知识,快速适应这个新的环境,找到新的解决方案。

🔗https://twitter.com/xiaohuggg/status/1684024995192913920?s=46

7⃣️

💭深夜感慨:你说人家马斯克为了实现自己的理想,说干就干,说要学习微信,400 亿收购 Twitter,历史遗留问题多,船大不好调头,但人家大刀阔斧的大修大改,毫无顾忌!而反观扎克伯格,说是要干翻 Twitter,毫无包袱,没有压力,对手还送分之下,推出个产品畏畏缩缩,毫无新意,抄都抄不好!小家子气!

🔗https://twitter.com/xiaohuggg/status/1683879221083672576?s=46

8⃣️

📱ChatGPT 安卓客户端现已在美国、印度、孟加拉国和巴西提供下载!

🔗https://twitter.com/xiaohuggg/status/1683866436786343936?s=46

🔔今日附送:

Remove Video Background:视频图像背景消除工具合集

🔗https://twitter.com/xiaohuggg/status/1684172617547403265?s=46

1、Unscreen.com

通过分析视频中的每一帧,识别出前景(即你想保留的部分)和背景(即你想移除的部分),然后自动将背景移除。这个过程完全自动化,无需用户手动选择或标记要移除的背景。

2、Remove.bg

它能自动识别出图片的前景(即你想保留的部分)和背景(即你想移除的部分),然后自动将背景移除。

3、https://www.cutout.pro/remove-video-background

无需绿屏,从真实场景视频中删除背景并替换为虚拟背景。无需单击像素、拾取颜色、绘制蒙版和移动路径。全自动,一键去除视频背景

4、app.avclabs.com

移除视频背景,特别是人像视频,无需绿幕,然后更换新的背景。

5、vidbgrem.media.io :可以识别、检测并从视频背景中隔离人物,然后移除背景。这个过程是 100%自动的,无需选择视频中的对象、选择颜色或绘制蒙版。

6、https://www.veed.io/tools/video-background-remover

可以识别、检测并从视频中隔离背景,然后移除它。支持 MP4 或 MOV 格式的视频上传,并可以下载清晰的音频。

7、https://www.kapwing.com/tools/remove-background

借助 Kapwing 的智能背景去除工具,您可以将人物与视频或图像的背景隔离,无需绿屏。只需点击几下即可。打开 Kapwing 并上传您自己的媒体。选择图层后,单击“效果”选项卡并选择“删除背景”选项。我们的 AI 将自动删除背景!

7 月 25 日

🤖 🔔小互的推特 7 月 25 日更新
✨✨✨✨✨✨✨✨✨

1⃣️

🔬 NVIDIA 在其#SIGGRAPH2023 展会上宣布了一系列新的技术和研究成果,这包括其在图形学研究、通用场景描述(OpenUSD)和 AI 领域的新突破。此外,NVIDIA 还展示了其最新的生成 AI 研究,包括神经渲染、3D 生成和卓越的语言能力。在会议上,NVIDIA 的研究人员还将展示其二十篇的研究论文。

🔗 "https://twitter.com/xiaohuggg/status/1683855134235979776?s=20"

2⃣️

🎥 有一个新的 AI 故事短片发布,它使用了 midjourney 生成图像,然后用@runwayml Gen 2 将这些图像转换为视频,最后由@elevenlabsio @SoundfulMusic 添加配音和配乐。影片效果令人满意。

🔗 "https://twitter.com/xiaohuggg/status/1683811470314983424?s=20"

3⃣️

🔍 3D-LLM 是一个大型的语言模型,能理解和处理 3D 数据。该模型使用 3D 点云数据作为输入,这是一种用于表示三维对象或环境的数据类型,其中每个点在三维空间中都有一个位置。3D-LLM 能够执行一系列与 3D 相关的任务,包括对 3D 空间的任何事物进行问题回答,任务分解,3D 定位,3D 辅助对话,导航等。

🔗 "https://twitter.com/xiaohuggg/status/1683789219536437249?s=20"

4⃣️

🕶 苹果公司已经开放了其 Apple Vision Pro 眼镜的开发者套件申请,开发者可以在苹果的官方网站上申请。苹果将优先考虑那些打算利用 VisionOS 特性和功能的应用程序的开发者。

🔗 "https://twitter.com/xiaohuggg/status/1683675458091761666?s=20"

5⃣️

🎼 Leap ai 现已推出了一个文字生成音乐的功能。用户只需输入文字提示,就可以生成 30 秒以内的音乐。该工具提供了各种风格的音乐,适合用于电影、游戏、播客、冥想等。

🔗 "https://twitter.com/xiaohuggg/status/1683671275481464832?s=20"

6⃣️

🎉 在 Twitter 上,一个用户(小互)在玩了三个多月后,粉丝数已经达到了 1 万。他感谢了乔爷以及其他帮助他的人,他现在准备申请 Twitter 的蓝 V 认证。

🔗 "https://twitter.com/xiaohuggg/status/1683648787871580160?s=20"

7⃣️

🌐 微软、英伟达、AMD、英特尔、思科、博通、Meta、HPE 等科技巨头在 Linux 基金会的牵头下联合成立了超以太网联盟(UEC)。他们计划开发一种新的传输协议-超以太网传输协议(UEC),以解决传统以太网性能不足的问题,这已经影响到了人工智能和高性能计算(HPC)的发展。

🔗 "https://twitter.com/xiaohuggg/status/1683635413905461249?s=20"

7 月 24 日

💡 🔔小互的推特 7 月 24 日更新
✨✨✨✨✨✨✨✨✨

1⃣️
📚 "Anomaly Z" 是一个由 M.J。 Romanowski 创作的连载科幻故事,讲述了一名名叫 Zane 的角色,她使用 Chronosuit(一种时间旅行装置)从未来偷取了一些重要的设备的故事。他们使用 Midjourney 生成了故事的插图。然后使用了 Gen 2 将这些插图生成视频,最后制作成了一个故事预告片。
🔗 "https://twitter.com/xiaohuggg/status/1683464007674650626?s=20"

2⃣️
🎨 FABRIC:将人类反馈融入到图像生成过程中。当我们使用 StableDiffusion 生成图像时,这个过程通常是自动进行的,模型并不知道生成的图像是否符合人类期望。FABRIC 改变了这一点。它允许人类在每一步迭代中提供反馈,告诉模型哪些部分做得好,哪些需要改进。模型会根据这些反馈来调整下一步的生成过程。
🔗 "https://twitter.com/xiaohuggg/status/1683450394410913793?s=20"

3⃣️
💰 OpenAI CEO Sam Altman 宣布其 Worldcoin (世界币)启动。Worldcoin 是一个包含数字货币(WLD)和数字身份(World ID)的区块链项目。Worldcoin 的目标是建立全球最大的身份和金融公共设施,让每个人都能拥有所有权。同时币安宣布世界币(WLD)将在币安上线!
🔗 "https://twitter.com/xiaohuggg/status/1683399775629217792?s=20"

4⃣️
🔒 白宫要求 AI 公司推水印系统 防范 AI 风险。OpenAI、微软、谷歌、Meta、亚马逊、Anthropic 和 Inflection 等七家科技巨头公司宣布,将会开发出一种水印技术,添加在所有由 AI 生成的内容上。美国政府表示,这项技术将有助于在未来更安全地分享 AI 生成的文本、图像、音频,以及视频,不会在真实性上误导公众!
🔗 "https://twitter.com/xiaohuggg/status/1683394928691515393?s=20"

5⃣️
🔠 @Twitter 官方账号已经更名为:𝕏。应该是等域名完全过度到 http://x.com,就会更换 logo,域名还在迁移中。
🔗 "https://twitter.com/xiaohuggg/status/1683367182020018176?s=20"

6⃣️
🎬 ShortGPT:一个强大的自动化视频制作工具,自动采集素材、编辑视频、配音、生成字幕,一气呵成,它会根据你的脚本自动从网上采集素材。还会自动合成语音,将脚本转化为口头表达。最后会将这些素材和语音合成一个完整视频。同时你输入任意 Youtube 链接或上传 mp4 文件, 它不仅会翻译内容 还会自动配音!
🔗 "https://twitter.com/xiaohuggg/status/1683362214764494848?s=20"

7⃣️
🎮 STEVE-1:文本到行为的生成模型。STEVE-1 是一个为 Minecraft 设计的生成模型,可以通过文本或视觉指令来控制游戏。例如,你可以给出文本指令,如"建造一个房子",或者提供一个视觉指令,如一个房子的图片,STEVE-1 就会在游戏中执行这些指令。这种模型的设计使得它能够理解和执行一系列复杂的任务。
🔗 "https://twitter.com/xiaohuggg/status/1683345755086655488?s=20"

8⃣️
💻 Llama2-webui:允许用户在任何地方(Linux/Windows/Mac)通过 gradio web UI 在 GPU 或 CPU 上运行 Llama 2。它支持 Llama-2-7B/13B/70B,并且可以使用 8-bit 或 4-bit 模式。它支持至少有 6 GB VRAM 的 GPU 推理,以及至少有 6 GB RAM 的 CPU 推理。
🔗 "https://twitter.com/xiaohuggg/status/1683335728825257985?s=20"

9⃣️
💇♀️ 多色发色 LoRA :可以生成多种颜色发色的 LoRA,这是一个在 LECO 上创建并进行调整的,可以生成多种颜色发色的 LoRA。使用 "hair" 作为触发词,如果只指定长度,生成的发色会非常丰富多彩。也可以指定主色,服装的颜色污染也会减少,它还有个功能就是能调整胸部大小 ,胸部增減滑块 LoRA。
🔗 项目地址:https://huggingface.co/sazyou-roukaku/sazyou_LoRA
🔗 "https://twitter.com/xiaohuggg/status/1683306036193824768?s=20"

1⃣️0⃣️
🎨 芭比海默,使用了一些 AI 生成技术制作的。
🔗 "https://twitter.com/xiaohuggg/status/1683139724398202882?s=20"

7 月 23 日

📌 🔔小互的推特 7 月 23 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🧠 DishBrain:内置人脑组织的计算机芯片。澳大利亚莫纳什大学的科学家创造了一种名为 DishBrain 的半生物计算机芯片,该芯片电极中培养大约 80 万个人类和老鼠的大脑细胞。这种芯片展示出了类似于意识的特性,它在五分钟内学会了玩乒乓球游戏。

🔗 Twitter "https://twitter.com/xiaohuggg/status/1683127193956917249?s=20"

2️⃣

💬 博主 @lauriewired 声称他发现了一种新的 ChatGPT"越狱"技术,可以绕过 OpenAI 的审查过滤系统,让 ChatGPT 干坏事,如生成勒索软件、键盘记录器等恶意软件。

🔗 Twitter "https://twitter.com/xiaohuggg/status/1683109435001155584?s=20"

3️⃣

📚 如何将截图数据和 PDF 导入 Excel,学习了。

🔗 Twitter "https://twitter.com/xiaohuggg/status/1683098686484803585?s=20"

4️⃣

🖼️ 使用 Midjourney 生成图像,然后用 Gen-2 生成视频。

🔗 Twitter "https://twitter.com/xiaohuggg/status/1683089806178529280?s=20"

5️⃣

💊 Powerful Medical 是一家医疗科技公司,他们的目标是通过 AI 和机器学习技术,准确诊断和治疗心血管疾病。他们的产品包括:PMcardio:5 秒内准确解读任何心电图,并准确诊断和治疗 38 种心血管疾病。

🔗 Twitter "https://twitter.com/xiaohuggg/status/1682964746688147456?s=20"

6️⃣

🌊 Gen 2 图片到视频功能,把静态大海照片变成波涛汹涌的大海视频。没有使用任何文字提示。只是上传照片。

🔗 Twitter "https://twitter.com/xiaohuggg/status/1682933810055512064?s=20"

7 月 22 日

📌 🔔小互的推特 7 月 22 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🎵 Brain2Music:读取人类大脑活动并据此生成音乐。该项目由谷歌、大阪大学、NICT 和 Araya Inc 的研究团队开发。它可以从脑反应中读取被试听音乐的「类型」、「乐器编排」和「情绪」等特征,并生成基于这些特征的音乐。

🔗 Twitter "https://twitter.com/xiaohuggg/status/1682759201876221955?s=20"

2️⃣

🎨 AnyDoor:可以将任何对象巧妙的放入到新的图像、视频场景中。它是一种基于扩散的图像生成器,可以将目标对象(例如,人、动物、物品等)在用户指定的位置以和谐的方式传送到新的场景中。

🔗 Twitter "https://twitter.com/xiaohuggg/status/1682721078718906368?s=20"

3️⃣

🎞️ GEN 2 的的图片生成视频效果有点意思,不需要文字提示,只需要上传一张照即可,从图片的起始帧开始生成视频。

🔗 Twitter "https://twitter.com/xiaohuggg/status/1682667423529598977?s=20"

4️⃣

🤫 宝玉 xp:同学们,发现一个秘密:Chinese-Llama-2-7b 这个微调版本是可以写小黄文的!

🔗 Twitter "https://twitter.com/xiaohuggg/status/1682645652461993984?s=20"

5️⃣

🕷️ WormGPT:反派 ChatGPT,它基于旧的 GPT-3 架构开发,但没有任何限制,例如在部署模型并根据大量黑客相关数据进行训练时不应用任何安全措施和过滤器。

🔗 Twitter "https://twitter.com/xiaohuggg/status/1682625842214760448?s=20"

6️⃣

💡 EduBlocks:一款免费可视化编程工具,通过拖动模块即可实现编程,同时它也可以生成 Python 等编码。EduBlocks 像 Scratch 一样,是一个基于块的编程工具,让初学者可以通过拖放代码块的方式来编程,而不需要书写代码。

🔗 Twitter "https://twitter.com/xiaohuggg/status/1682606200343642113?s=20"

7️⃣

📱 新版本的 EduBlocks 优化了移动版本的首页、项目页面和编辑器,使用户在移动设备上也能获得无缝的体验。

🔗 Twitter "https://twitter.com/xiaohuggg/status/1682606209764048897?s=20"

7 月 21 日

📌 🔔小互的推特 7 月 21 日更新
✨✨✨✨✨✨✨✨✨

1️⃣
🐶 CSIRORobotics 宣布他们的机器人狗 Bluey 已经学会了自己的名字,并且可以根据语音提示进行相应的动作!Bluey 能够学习并识别自己的名字,这表明它具有一定的理解和响应能力,似乎是接入了 ChatGPT

https://twitter.com/xiaohuggg/status/1682060896728932353?s=20

2️⃣
🗂️ Memo - AI 驱动的视频、播客转文字、字幕工具,推荐个字幕识别和翻译的工具 Memo。支持多平台,利用 Whisper 技术识别语音到到字幕,然后可以对识别的字幕进行简单的编辑。另外可以对识别的字幕翻译,支持 Google 翻译和 OpenAI。
🔗"https://twitter.com/dotey/status/1682413331146047489?s=20"

3️⃣
🤝 OpenAI 和其他领先的 AI 实验室发布自愿承诺书:以加强 AI 技术和服务的安全性和可信度。承诺包括对他们的模型或系统进行内部和外部的红队测试,以评估可能的滥用、社会风险和国家安全问题。该公司还承诺投资于网络安全和内部威胁防护措施,以保护专有的和未发布的模型权重。
🔗"https://twitter.com/xiaohuggg/status/1682410029750837248?s=20"

4️⃣
🖼️ 这个商品详情展示页面,咋样?有意思。查看网址"https://www.magdabutrym.com/eu/product/pf23-dress-16-black"
🔗"https://twitter.com/xiaohuggg/status/1682396358169485312?s=20"

5️⃣
🎧 苹果 AirPods 新专利:可监测佩戴者脑电波等生物信号。这项专利使 AirPods 可以监测佩戴者脑电波、肌电图、眼电图等生物信号。为了更加准确地监测 EEG 大脑活动,需要针对佩戴者的耳形进行定制。苹果还可以监测其他生物信号,如心电图、皮肤电反应、血容量脉搏等。
🔗"https://twitter.com/xiaohuggg/status/1682366431013507072?s=20"

6️⃣
💰 谷歌员工薪资遭泄露,软件工程师基本年薪达 71.8 万美元。该数据来自员工之间共享的电子表格,涵盖了超过 1.2 万名美国员工的信息。除了基本工资,谷歌员工的收入还包括期权和奖金,软件工程师在 2022 年能够获得最高 150 万美元的股权。
🔗"https://twitter.com/xiaohuggg/status/1682354333156016132?s=20"

7️⃣
📹 TokenFlow:使用文本到图像扩散模型进行文本驱动的视频编辑。它的主要功能是根据给定的文本提示源视频,生成一个新的视频,新视频中的内容会符合文本提示,同时保留输入视频的空间布局和动态。比如视频中的人物正在旋转篮球或者跑步,你可以使用 TokenFlow 替换视频中的背景或者人物,或者改变人物!
🔗"https://twitter.com/xiaohuggg/status/1682345025806667776?s=20"

8️⃣
🎶 Suno:只需简单文字描述 即可生成带有人声的音乐,Suno 宣布他们的新模型,现在可以生成带有人声的音乐,而且 AI 还能吟唱。你只需要输入一段文字描述即可,包括你需要的音乐风格和对音乐的期望,Suno 即可帮你生成 2 段 30 秒左右带歌词的音乐。
🔗"https://twitter.com/xiaohuggg/status/1682310965059280897?s=20"

9️⃣
🎨 Artbreeder Mixer :将多个图像神奇地混合在一起 ,它允许用户通过将多个图像和文本利用 AI 混合在一起来创建新图像。神奇的想法。
🔗"https://twitter.com/xiaohuggg/status/1682273715109920768?s=20"

🔟
🌐 Instaverse:将任何 2D 图像转换为一个完整的 3D 世界。你只需一次点击就创建一个可玩的 3D 世界。这个工具使用 AI 技术,无需任何编程或 3D 建模技能。只需上传你的图片,Instaverse 就会自动为你创建一个 3D 世界。
🔗"https://twitter.com/xiaohuggg/status/1682239338468483077?s=20"

1️⃣1️⃣
🤖 OpenAI 发布了一项新功能,允许用户为 ChatGPT 设置自定义指令!用户可以添加他们希望 ChatGPT 在生成响应时考虑的偏好或要求。
🔗"https://twitter.com/xiaohuggg/status/1682208252166287360?s=20"

历史:http://waytoagi.com/xiaohu

7 月 20 日

👽 🔔小互的推特 7 月 20 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

✏️ VideoDoodles:由 Adobe 等研究人员开发的是一种编辑技术,可将动态涂鸦融入视频中,这种技术可在视频中的对象上添加动态涂鸦。同时绘制的涂鸦能够跟随对象的移动,并以适当的透视和遮挡(对象被其他物体遮挡的现象)进行表达。因此无需专业技能或大量时间,就能够创建出独特且令人印象深刻的视频。

🔗https://twitter.com/xiaohuggg/status/1682017190642614272?s=20

2️⃣

💳 微信支付全面开放绑定境外卡:利好境外开发者,腾讯宣布将深化与多个国际卡组织的合作,在近期全面有序开放境内各城市的微信支付商户网络。与腾讯合作的国际卡组织包括 Visa、Discover Global Network(含 Diners Club)、JCB、Mastercard 等。

🔗https://twitter.com/xiaohuggg/status/1681938524885651456?s=20

3️⃣

📝 AI** Agent 模式**:这篇博客写的好。以后基于流程类似 SaaS 的服务,都要改成 AI Agent 模式,都得是 LLM 加上“评估”(不仅仅是记忆)、“计划”、“工具使用”等三个模块。

🔗https://twitter.com/mranti/status/1681855514211418112?s=20

4️⃣

🦙 Llama2 登陆 Hugging Chat:秀儿,Llama2 登陆 Hugging Chat http://hf.co/chat

70B… 速度贼拉快,还能联网!

🔗https://twitter.com/xiaohuggg/status/1681888661670105089?s=20

5️⃣

🖼️ KartivAI: 将 #webgi 3D 渲染和 AI 结合,高效批量产出广告营销素材。你只需上传素材,如你的标志或产品图片,然后描述想要的创意,Kartiv 就会使用你的描述和素材来创建吸引人的视觉效果。这些都是自动化的,实时的,并在浏览器内部运行。KartivAI 还实现了多种图形效果,同时还能生成复杂的 3D 场景。

🔗https://twitter.com/xiaohuggg/status/1681872541101727744?s=20

6️⃣

📱 Llama2 on iPhone and iPad:厉害了,Llama2 可以运行在 iPhone 和 iPad 上了

🔗https://twitter.com/dotey/status/1681817519588356098?s=20

7️⃣

🎞️ 视频扩展技术:这个将横屏视频扩展成竖屏视频的做法很聪明:导出视频的第一帧,然后用 Adobe Photoshop 中的生成填充工具对其进行扩展。然后将原始视频放在静态图像上,模糊视频的边缘,使动态视频和静态图像之间的填充不那么明显。

🔗https://twitter.com/dotey/status/1681849372106014720?s=20

7 月 19 日

🌖 🔔小互的推特 7 月 19 日更新
✨✨✨✨✨✨✨✨✨

1️⃣
🎥 MoviePilotL:自动化媒体管理工具🔧,可自动搜索、下载并管理电影和电视剧资源。它可以与多种下载器(如 qBittorrent、Transmission)和媒体服务器(如 Jellyfin、Emby、Plex)配合使用,实现资源的自动下载、整理和获取详细信息。还支持通过微信、Telegram 等进行远程搜索、下载、管理。
🔗 https://twitter.com/xiaohuggg/status/1681677367566286849?s=20

2️⃣
🦉 BuboGPT:能理解图像和音频的内容,并将这些理解与文本输入和输出相结合。由字节跳动开发的大型语言模型,可以处理包括文本、图像和音频在内的多模态输入,并具有将其响应与视觉对象相对应的独特能力。它可以进行细粒度的视觉理解,音频理解,以及对齐的音频-图像理解和任意音频-图像理解。
🔗 https://twitter.com/xiaohuggg/status/1681673226047430658?s=20

3️⃣
💻 Code Interpreter API:一个开源项目,它实现了在本地运行 ChatGPT 的代码解释器。这意味着你不需要依赖任何外部的云服务来运行你的代码,只需要在你的本地安装 API,然后使用你自己的 OpenAI API Key 就可以了。可以联网以获取网络数据。但是,所有的代码执行都在本地进行,安全隐私!
🔗 https://twitter.com/xiaohuggg/status/1681661599193665536?s=20

4️⃣
🔄 Swap Anything:交换任何东西,只需要单击选择即可立即交换图片的面孔、人物、衣物或背景。你只需要描述你想要的变化,选择你想要编辑的元素,让 AI 来完成剩下的工作。适用于需要大量编辑图片的电子商务和营销领域。只需选择你想要编辑的区域,提供文本描述,Swap Anything 就会处理剩下的工作。
🔗 https://twitter.com/xiaohuggg/status/1681598479490244608?s=20

5️⃣
📚 Llama-2:GPT-4 的论文只分享了很少的信息,而 Llama-2 则不同,它详细介绍了整个配方,包括模型细节、训练阶段、硬件、数据管道和注释过程。例如,论文对 RLHF 的影响进行了系统分析,并提供了漂亮的可视化效果
🔗 (https://twitter.com/xiaohuggg/status/1681570849009324032?s=20

6️⃣
🤖 Wheelbot:一个对称反应轮单轮车,可以从任何初始位置站到它的轮子上。这个机器人的设计是对称的,其滚动轮和反应轮是相同的。无论 Wheelbot 的初始状态如何(如,它可能被放置在侧面,或被倒置),它都能通过自我调整(使用其反应轮或滚动轮)来达到一个状态,即站立在其轮子上。就像一个不倒翁!
🔗 https://twitter.com/xiaohuggg/status/1681556920103243778?s=20

7️⃣
🎨 DreamGenerator:利用生成性 AI 将你拍摄的照片转化为全新的形象的相机。用户可以从 30 个提示中选择,捕捉照片,然后生成一些不同风格和奇异的照片。其实就是内置了一些 prompt,看起来很新颖,但是我个人感觉没啥用,多此一举,一个 APP 就能解决。不过提供了一些人工智能结合硬件产品的思路。
🔗 https://twitter.com/xiaohuggg/status/1681501082143576065?s=20

8️⃣
🎬 Showrunner AI:只需一个提示,就可以为你编写、动画、导演、配音、编辑节目,创造出高质量的剧集内容。他们提出了一种方法,结大型语言模型、扩散模型和多代理模拟,以生成连贯、一致且符合 IP 故事世界的场景和图像内容。通过使用提示链,他们可以引导大型语言模型生成符合用户期望和意图的内容。
🔗 "https://twitter.com/xiaohuggg/status/1681498048109879296?s=20"

9️⃣
💭 GPT-4 & Dalí:GPT-4 在处理抽象、难以理解的问答时,其表现出乎意料的好。除了使用 GPT-4 进行处理,还尝试使用了 Dalí来对其进行渲染,结果发现 Dalí对于难以理解的内容也能进行相应的渲染。而且,Dalí在渲染抽象图像时,可以创造出一些非常奇特、新奇的画面。
🔗 "https://twitter.com/dotey/status/1681436238006616079?s=20"

🔟
🕹️ OpenAI's Microscope:这是一个帮助你理解深度学习模型的工具。Microscope 让你可以非常详细的看到模型中每一层、每一单元的响应。通过这个工具,你可以对模型有更深入的理解,找出模型的问题,并对模型进行改进。
🔗"https://twitter.com/xiaohuggg/status/1681346203152433152?s=20"

7 月 18 日

🌖 🔔小互的推特 7 月 18 日更新
✨✨✨✨✨✨✨✨✨
1️⃣
🔍 StableSR 是一个用于提高图像分辨率的项目。该项目使用预训练的扩散模型,能从低分辨率图像生成高分辨率图像,无需先验知识,适用于真实世界的图像超分辨率任务。项目地址 https://iceclear.github.io/projects/stablesr/

https://twitter.com/xiaohuggg/status/1681284959406006278?s=20

2️⃣
💻 Google Bard 正在测试插件功能。其插件预览版泄露,虽然目前插件还无法正常使用,但预示着插件上线时间接近。预计首批上线的插件包括 Google Flights、Google Hotels、Google 地图、OpenTable、Zillow、YouTube、Redfin、Instacart、Kayak,插件功能和 ChatGPT 类似。
https://twitter.com/xiaohuggg/status/1681274640440623106?s=20

3️⃣
💡 Procedural Flowmap Preset 可以使用几何节点生成流图效果,能帮助用户轻松创建流图,例如模拟河流流动的纹理。该工具适用于 Blender 3.6 LTS 版本。
https://twitter.com/xiaohuggg/status/1681256484141940736?s=20

4️⃣
🖌 MJ 机器人 是一个 AI 绘画工具,此篇文章指导用户如何在飞书上搭建完成 MJ 机器人,从而让企业或社群在飞书上便捷使用 MJ 的 AI 绘画功能。
https://twitter.com/xiaohuggg/status/1681249633392275456?s=20

5️⃣
🎥 Interactive Neural Video Editing (INVE) 是一种实时视频编辑解决方案,可以将稀疏帧编辑一致地传播到整个视频剪辑,提高编辑效率。
https://twitter.com/xiaohuggg/status/1681179897304330241?s=20

6️⃣
🎨 这篇文章详细介绍了如何使用 Stable Diffusion 和 ControlNet 技术生成艺术化的二维码,介绍了如何在生成的图像中隐藏文本或符号。比如创作“牛逼”二字
https://twitter.com/xiaohuggg/status/1681126973039587328?s=20

7️⃣
💾 FlashAttention-2 是由普林斯顿自然语言处理团队发布的一个优化和加速深度学习模型中的注意力机制的算法,其效率较前一版本快了约 2 倍。
https://twitter.com/xiaohuggg/status/1681118541070860288?s=20

8️⃣
🔧 D-ID 推出了一款专为 PowerPoint 设计的 Generative AI 插件,它可以帮助用户创建更专业、吸引人的演示,提升演示效果和观众参与度。
https://twitter.com/xiaohuggg/status/1680966429959663617?s=20

9️⃣
📝 BloggerGPT 是一个 AI 代理,设计用于帮助扩展用户的博客。只需为 AI 代理指定一个特定的领域或主题,它就能自动撰写文章并发布到用户的博客网站。该产品由 LangChainAI 构建。
https://twitter.com/xiaohuggg/status/1680955156878495746?s=20

7 月 17 日

🌖 🔔小互的推特 7 月 17 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

📞 Air 是一个会话式 AI,可以进行长达 5-40 分钟的销售和客服电话,听起来就像真人。你可以在几分钟内创建自己的 Air,并让它进行实时通话,它能够在 5000 个独特的应用中自主执行操作。

https://twitter.com/xiaohuggg/status/1680921442844831749?s=20

2️⃣

⚽️ 法国 Orange 电信为女足世界杯推出的 2 分钟创意广告。乍一看平平无奇,但 56 秒开始极限反转…

https://twitter.com/xiaohuggg/status/1680883498721378304?s=20

7 月 16 日

📌 🔔小互的推特 7 月 16 日更新
✨✨✨✨✨✨✨✨✨

1️⃣
🎨 http://Recent.Design :专门收集推特上发布的热门 UI 设计作品。这个网站精选并展示了推特上的 UI 和交互设计作品,是设计师和设计爱好者的宝藏。提供邮件订阅服务,让你随时获取最新的设计趋势和灵感。
https://twitter.com/xiaohuggg/status/1680596018361167873?s=20

2️⃣
🤖 波士顿动力公司机器人进化史,不容易
https://twitter.com/xiaohuggg/status/1680592377503956992?s=20

3️⃣
👟 Ukaton:智能鞋垫 可实时获取运动足部数据。他们为智能鞋垫和运动模块制作了一个 Python SDK,这个 SDK 允许开发者通过 BLE 或 WiFi 访问传感器数据。
https://twitter.com/xiaohuggg/status/1680519696595009537?s=20

4️⃣
🦾 Meta AI 介绍了他们的新型生成模型 CM3leon。CM3leon 是一个单一的基础模型,既能进行文本到图像的生成,也能进行图像到文本的生成。它是第一个使用从文本语言模型中借鉴的配方训练的多模态模型。
https://twitter.com/xiaohuggg/status/1680469706539683840?s=20

5️⃣
📃📊 GoogleBard 从发票图片中提取文本摘要,并以漂亮的表格格式进行总结。看来这个视图模式很实用啊,压力给到了 OpenAI。
https://twitter.com/xiaohuggg/status/1680394771125391361?s=20

更正一下子⬆️上面的这个 OCR 出来的结果是错误的,bard 做文字的图像识别还不到位

7 月 15 日

🎉 🔔小互的推特 7 月 15 日更新
✨✨✨✨✨✨✨✨✨

1️⃣

🇨🇳 习近平对网络安全和信息化工作作出重要指示

https://mp.weixin.qq.com/s/Dxsx6UdtBjWGyFVXpa5P2Q

2️⃣

🎥🧬 DNA-Rendering:是一个大规模、高保真度的神经演员渲染库,它通过神经隐式字段表示人类演员。这个库的主要目标是为了提供一个高质量、多样性的人类行为数据集,以便在人工智能、计算机视觉和图形学等领域进行研究和开发。它提供 1500 个 ID* 服装、1187 个动作、60 个视图和高达 4096 分辨率的 675 万帧!项目地址:dna-rendering.github.io

https://twitter.com/xiaohuggg/status/1680107909546655745?

3️⃣

📚【书单推荐】马斯克创建的 xAI 的成员 Greg Yang 提到的 xAI 书单:关于@xai 空间的书是 Axler 的“Linear Algebra Done Right”和 Halmos 的“Naive Set Theory”。多年来他真正喜欢的其他数学书籍,笔者选了 10 本相对容易的书籍供参考学习。

笔者也找到了一张数学深渊图

https://twitter.com/danielw19410/status/1680045424491782146?

4️⃣

🗣️🤖 马斯克携 xAI 团队在 Twitter Space 的直播分享 xAI 主要目标和理念

https://twitter.com/xiaohuggg/status/1680067752751665152?

5️⃣

🕒📱 仅仅通过一个屏幕截图,使用 Google 的 Bard AI 在不到 4 分钟内重新创建了一个基本的 iPhone 计时器应用。

https://twitter.com/xiaohuggg/status/1680061377367646208?

6️⃣

📈🤔 Inflection AI 创始人兼 CEO@mustafasuleymn 发表了一篇文章,他提出了一个新的图灵测试,这个测试的目标是看 AI 是否能在几个月内通过零售网络平台将 10 万美元的投资赚到 100 万美元。他认为,这个测试将能更好地反映 AI 在现实世界中的能力,而不仅仅是它的语言生成能力。其实他在暗示图灵测试已经过时!

https://twitter.com/xiaohuggg/status/1679885174748884992?

7️⃣

🕊️🔄 Twitter 的内容 UI 界面将改版,全面拥抱微博,排版更紧凑,展示的图片更大,同时用户评论可以排序了,热门回复将靠前展示

https://twitter.com/xiaohuggg/status/1679875620564774912?

7 月 14 日

🎉 🔔小互的推特 7 月 14 日更新
✨✨✨✨✨✨✨✨✨✨

1️⃣
📽️🔍 使用 Generative fill AI (生成填充 AI )和 Premiere Pro 将电影扩展至 9:16
https://twitter.com/xiaohuggg/status/1679760384146960384?s=20

2️⃣
🐦💰 推特宣布启动“广告分成共享”计划,即将在推特评论区插入广告并与创作者分成。有人已经分到钱了,还挺多
https://twitter.com/xiaohuggg/status/1679679122921111552?s=20

3️⃣
📝🤖 Google Labs 推出一款名为 NotebookLM 的 AI 笔记本产品,这是一种全新的笔记工具。这个产品旨在通过总结信息、解释复杂的想法和头脑风暴新的联系,帮助用户更快地获得洞见。使用人工智能技术来帮助用户处理和理解信息。
https://twitter.com/xiaohuggg/status/1679673732271575041?s=20

4️⃣
🔎📸 手动启用 New Bing 多模态功能(图片聊天)
1)F12 打开浏览器控制台,输入:_w["_sydConvConfig"]。sydOptionSets += ",iycapbing,iyxapbing", _w["_sydConvConfig"].enableVisualSearch = true;输入后不要执行;
2)刷新 New Bing Chat 网页,在刷新完成之前执行上面的代码
3)就有上传图片的按钮了
https://twitter.com/Gorden_Sun/status/1679308102758178817?s=20

7 月 13 日

📌 🔔小互的推特 7 月 13 日更新
✨✨✨✨✨✨✨✨✨✨

1️⃣
💊🔬 Gero:使用量子计算来设计药物 Gero 是一家专注于衰老和长寿的 AI 驱动的生物技术初创公司。他们的研究团队探索了一个混合的人工智能系统(一个深度神经网络与商用量子硬件协同工作),这个系统能够提出独特的化学结构,这些结构在合成上是可行的,并具有药物样的属性。
https://twitter.com/xiaohuggg/status/1679513770287329281?s=46&t=F6BXooLyAyfvHbvr7Vw2-g

2️⃣
🎨🖌️ Stability AI 推出了一款名为 Stable Doodle 的工具,这是一款将简单的绘图转换为动态图像的工具,有了 Stable Doodle,任何具有基本绘画技能和在线访问能力的人都可以在几秒钟内生成高质量的原创图像。这将极大地提升各种行业的能力!
https://twitter.com/xiaohuggg/status/1679482652288770050?s=46&t=F6BXooLyAyfvHbvr7Vw2-g

3️⃣
🤖🧠 SayPlan:使用 3D 场景图结合大语言模型,让机器人能理解自然语言并执行可扩展的复杂任务规划。研究人员在两个非常大的环境中测试了他们的方法。包括多达三层楼,36 个房间,以及 140 个物体。在这样的环境中,他们都可以通过简单的语言指令,让机器人在复杂的环境中执行复杂可扩展的任务。
https://twitter.com/xiaohuggg/status/1679472711670857729?s=46&t=F6BXooLyAyfvHbvr7Vw2-g

4️⃣
🌐📖 #AI 开源项目推荐:zyddnys/manga-image-translator 一键翻译各类图片内文字,特别适合漫画的翻译,支持 DeepL 和 ChatGPT 的 API。在线测试:cotrans.touhou.ai
https://twitter.com/dotey/status/1678812082886569984?s=46&t=F6BXooLyAyfvHbvr7Vw2-g

5️⃣
🎮🐦 使用 OpenAI 的代码解释器在 7 分钟内制作了 Flappy Bird。
https://twitter.com/xiaohuggg/status/1679277327245791232?s=46&t=F6BXooLyAyfvHbvr7Vw2-g

7 月 12 日

💡 🔔小互的推特 7 月 12 日更新
✨✨✨✨✨✨✨✨✨✨

1️⃣
☁️🌎 Pangu-Weather 由华为开发,通过在 39 年的全球天气数据上训练模型,使用 3D 神经网络进行准确的中程全球天气预报,盘古气象大模型能够提供全球气象秒级预报,其气象预测结果包括位势、湿度、风速、温度、海平面气压等,可以直接应用于多个气象研究细分场景。
https://twitter.com/xiaohuggg/status/1678802755102863362?s=20
论文地址:https://t.co/6XdeXLUASS

2️⃣
🤖💬 AI Companion App:创建和训练属于你的 AI 伴侣。它提供了一套框架和工具,你可以根据自己的需求和想象,设定 AI 伴侣的个性、背景故事和能力,然后使用这个框架进行训练和部署。这样,每个人都可以拥有一个定制的 AI 伴侣,满足他们特定的需求和期望。你可以在浏览器上或通过 SMS 与你的 AI 伴侣进行聊天。
https://twitter.com/xiaohuggg/status/1678923111612416001?s=20

3️⃣
🖼️🎥 Pika,图像调节视频生成模型。将为图像设置动画。上传图像,输入文本提示,该模型可以将该图像制作动画。
https://twitter.com/xiaohuggg/status/1678929780392222720?s=20

4️⃣
💡📚 来看看 Code Interpreter 的 Prompt 是什么。转发自@宝玉 xp
https://twitter.com/dotey/status/1678825046079336456?s=20

5️⃣
📑🔎 Claude.ai 官方支持了 PDF 文件上传,结合 100k 的上下文,提供了丝滑的 PDF 问答体验。比如这个 19 页的全球 AI 流量变化的 PDF,让它总结出细分品类里依然在增长的 AI 网站。这个任务要求对整个文档进行理解和分析,而不是使用文本切块。目前似乎只有 Claude 能做到。转发自@orange.ai
https://twitter.com/oran_ge/status/1678916243166994432?s=20

7 月 11 日

💡 🔔小互的推特 7 月 11 日更新
✨✨✨✨✨✨✨✨✨✨

1⃣️

🚴‍♀️Urtopia Fusion:第一款集成了 ChatGPT 和内置扬声器的自行车,可以为骑行者提供个人导游服务。

主要功能:骑行者可以询问关于可能的观光地点、当地地标和景点历史的信息。具有内置 GPS 导航、防盗措施以及安全和数据记录系统。设计用于提供针对用户需求的实时帮助,并作为本地城市指南和私人导游。

https://twitter.com/xiaohuggg/status/1678436662777466882?s=20

2⃣️

❌这位老铁称 GPT-4 的详细信息被泄露。
他公布了大量 GPT4 的核心信息
但是并没有说明这些信息来源。原帖已删除,

有很多翻译版本:https://mp.weixin.qq.com/s/AIwinPksV_u-RQfcoCD7nw

https://twitter.com/xiaohuggg/status/1678574720869093376?s=20

3⃣️

👍Claude 2 发布
编码、数学和推理方面增强,最大支持 200K 上下文,长输入,也可以上传多文件,多步输出。Claude 2 在 Python 编码测试 Codex HumanEval 上的得分从 56.0%提高到 71.2%。在 GSM8k,一大组小学数学题上,Claude 2 得分从 85.2%提高到 88.0%。支持更长的输入,轻轻松松处理几百页文档和书籍资料!

https://twitter.com/xiaohuggg/status/1678781062875594753?s=20

4⃣️

🤔ChatGPT 宕机这么久还没有恢复,令人匪夷所思,看来也没必要担心 AI 会毁灭人类

https://twitter.com/xiaohuggg/status/1678785852745580551?s=20

7 月 10 日

💡 🔔小互的推特 7 月 10 日更新
✨✨✨✨✨✨✨✨✨✨

1️⃣

🏇🌄 这几天在外面玩,更新的慢,各位见谅。今天是沉浸式骑马的一天

https://twitter.com/xiaohuggg/status/1678397273280237569?s=20

2️⃣

🎮🕹️ Singularity - Hugging Face Open Source AI Game Jam 是一款实时游戏。游戏使用了 Stable Diffusion 和 Midjourney + CSM 技术来创建环境和 3D 角色。游戏的主题是生成一个随着角色向前移动而自我扩展的世界。未来游戏行业的发展可能是实时生成视频游戏的每一帧,这可能会使传统的计算机图形技术变得过时。

https://twitter.com/xiaohuggg/status/1678386608855470085?s=20

3️⃣

🚀🎮 利用 ChatGPT 代码解释器 5 分钟来制作一个太空射击游戏。制作过程简单

https://twitter.com/xiaohuggg/status/1678220687914283014?s=20

4️⃣

🤖🏃 Fourier GR-1 是一款通用人形机器人。由上海傅利叶智能科技公司开发。这款机器人的全身由 40 个 FSA 关节构成,最大模组峰值扭矩为 300NM。其身高 165cm,体重 55kg,步速可达 5km/h。GR-1 的运动能力表现优异,可进行直腿行走、快速行走、敏捷避障、稳健上下坡、应对冲击干扰,甚至可以与人协同完成动作。

https://twitter.com/xiaohuggg/status/1678063287647498241?s=20

历史动态 http://waytoagi.com/xiaohu

7 月 9 日

📌 🔔小互的推特 7 月 9 日更新
✨✨✨✨✨✨✨✨✨✨

小互出去玩了今日只有两条转发

1️⃣
📚💡ChatGPT 代码解释器高级使用指南:用例大全
https://twitter.com/xiaohuggg/status/1678017750135107584?s=20

2️⃣
📷🎥 利用代码解释器的功能,让 ChatGPT 将图像转换为视频!
https://twitter.com/xiaohuggg/status/1677833230358286336?s=20

暑假愉快

x

7 月 8 日

📌 🔔小互的推特 7 月 8 日更新
✨✨✨✨✨✨✨✨✨✨

1️⃣
🤖📍VoxPoser: 为机器人任务打造的指令系统
它结合了大语言模型和视觉-语言模型能力,能够理解自由形式的语言指令,并根据指令生成机器人的动作轨迹。简单讲:就是机器人能听懂你的指令,并会根据指令自动绘制出环境的 3D 地图,然后它根据绘制地图自主制定线路轨迹完成任务,而且不需要预先训练!"
https://twitter.com/xiaohuggg/status/1677576476101873675?s=20

2️⃣
🔧🤖宜家家具组装机器人
https://twitter.com/xiaohuggg/status/1677537464309923842?s=20

3️⃣
🔀💻在网页版选择代码解释器模式并进行对话,客户端也会同步对话,同时客户端也支持上传文件
https://twitter.com/xiaohuggg/status/1677521535723278336?s=20

4️⃣
🌐💬 Chrome 插件 Perplexity.ai 将搜索栏转为回答问题工具
"由于肌肉记忆,很多人都会在 Chrome 的搜索栏(也就是地址栏)直接输入关键词来搜索内容。Perplexity.ai 开发了个 Chrome 插件,直接接管了地址栏,你在地址栏输入任何关键词都会直接调用 Perplexity 来回答。思路很不错,我感觉是不是有人可以开发一个 ChatGPT 的 Chrome 插件也实现这样的功能。"
https://twitter.com/xiaohuggg/status/1677509954163585024?s=20

5️⃣
🔮🎥Effect House:TikTok 的增强现实(AR)创作工具
"Effect House:TikTok 开发的一款强大的增强现实(AR)工具。可以轻松创作、发布和分享用于 TikTok 的高品质增强特效。适合初学者、进阶设计人员及开发人员使用。它的内置功能,从高级跟踪到丰富的交互,你都可以在 TikTok 上实时的实验、创建、预览、发布和管理所有效果。"
https://twitter.com/xiaohuggg/status/1677503372910551040?s=20

6️⃣
🖼️📑通过 GPT-4 代码解释器将 PDF 转为图片
"有时候我需要把 PDF 转成图片,还需要几页合并成一张图片,以前让 GPT-4 帮我写过代码本地执行,现在简单了,直接传到 Code Interpreter,一个 Prompt 搞定!启用 Code Interpreter,上传 PDF 文件,然后输入:“请将这个 PDF 文件保存成 2 行 2 列的图片,每 4 页一张图片”"
https://twitter.com/dotey/status/1677426953207382018?s=20

7️⃣
💡💻代码解释器权限开始发放
https://twitter.com/xiaohuggg/status/1677348172266639360?s=20

7 月 7 日

🚀 🔔小互的推特 7 月 7 日更新
✨✨✨✨✨✨✨✨✨✨

1️⃣
🎥traw.ai:高效总结 YouTube 视频工具
traw.ai 可以帮助用户快速总结 YouTube 视频的内容,生成包含摘要内容的类似文章的页面,还能贴出相应位置的视频截图,且标注有视频的时间戳。你也可以上传本地的音视频,它也可以帮你总结。
https://twitter.com/xiaohuggg/status/1677304777980678149?s=20

2️⃣
🎭#BRAV6:专为亚洲面孔优化的** AI **模型
#BRAV6 模型可以下载了,BRAV6 主要针对亚洲面孔进行的训练和优化,质量比 BraV5 好很多,更加真实和有质感。
https://twitter.com/xiaohuggg/status/1677294836515491840?s=20

3️⃣
👧**AI GIRL Generator:打造你心目中的梦想女孩**
AI GIRL Generator 可以根据自己的喜好来生成一个自己心目中的梦想动漫女孩,从脸型到身材款式已经风格,每一个细节都可以量身打造。包含许多 Lora 模型供用户选择,还可以合并不同的 Lora 模型,生成具有特殊风格组合的角色。
https://twitter.com/xiaohuggg/status/1677255503980949505?s=20

4️⃣
🤖VEED AI Avatars:AI 驱动的虚拟角色视频制作工具
VEED AI Avatars 可以将文本转化为由 AI 驱动的虚拟角色视频。非常逼真,口型无缝同步,有 50 多种不同的数字模型和多种的模板选择,以及支持 75 种语言和方言。
https://twitter.com/xiaohuggg/status/1677195533151248390?s=20

5️⃣
🎭Xpression Camera:实时** AI **换脸应用
Xpression Camera 是一款适用于视频聊天和直播流的实时 AI 换脸应用。只需一张照片你就可以立即转变成任何人或任何有面部的事物,在 Zoom、Twitch 等上聊天,或者在 YouTube 上创建视频时,你可以实时重新定义你的屏幕形象。
https://twitter.com/xiaohuggg/status/1677182181733707778?s=20

6️⃣
⚡️全球最快的 GPT-4 音频管道
Florian Juengermann 在 Twitter 上分享了他和他的团队开发的全球最快的 GPT-4 音频管道。你只需要问出问题,机器人几乎同时就能进行语音回答,延迟可以忽略不计。
https://twitter.com/xiaohuggg/status/1677156293428264960?s=20

7️⃣
💼马斯克威胁起诉 Meta
马斯克向扎克伯格发出了律师函,威胁要起诉 Meta,称其系统性、故意和非法盗用 Twitter 的商业秘密和知识产权,以及窃取 Twitter 的数据。俩人真是到了你死我活的地步了!另外 Twitter 今天重新开放了未登录用户访问的功能
https://twitter.com/xiaohuggg/status/1677145509251915780?s=20

8️⃣
💻OpenAI 的代码解释器开放给所有 ChatGPT Plus 用户
OpenAI 的代码解释器将向所有 ChatGPT Plus 用户开放,允许 ChatGPT 理解和执行代码,执行一些更为复杂的任务,如分析数据、创建图表、编辑文件、执行数学运算等。
https://twitter.com/xiaohuggg/status/1677140750285561856?s=20

9️⃣
🌐****OpenAI 开放 GPT-4 的 API
OpenAl 宣布 GPT-4 的 API 现在对所有用户开放,无需申请。此外,GPT-3.5Turbo、DALL·E 和 Whisper API 也已全面开放。

群友烟笼寒水进行了详细的解释:

1.线上账号和 api 其实是分开不同页面的

2.免费的账号会配有一定额度的 api 使用量(是 3.5 的接口,有期限,过期需要充值才能继续用)

3.plus 账号是付费的,就是线上 gpt4.0,但是 4.0 的 api 需要另外申请才行,不随 plus 账号配送

4.现在开放了 4.0 的 api,但是只针对曾经为 api 买过单的用户开放(之前用免费额度的不算是买过单的)
https://twitter.com/xiaohuggg/status/1677112919514030080?s=20

7 月 6 日

📗 🔔小互的推特 7 月 6 日更新
✨✨✨✨✨✨✨✨✨✨

1️⃣

🌐🌐🌐 KokoMind:全方位的社交互动数据集,用于评估大语言模型在理解和引导社交互动方面的能力。数据集包含了 150 个复杂的多方社交互动场景,并配有自由文本问题和答案,所有数据由 GPT-4 生成,由人类专家进行验证。
"www.twitter.com/xiaohuggg/status/1676956615004798976?s=20"

2️⃣

🔎🔎🔎 Plugin.surf:一个用于快速找寻有用的 ChatGPT 插件的目录网站。通过分类、搜索、收藏,投票和评价功能,用户可以找到最适合自己需求的插件。
"www.twitter.com/xiaohuggg/status/1676942776351752193?s=20"

3️⃣

🗣️🗣️🗣️ Pi 支持语音通话:现在你可以通过语音与 Pi 进行交流,就像打电话一样简单。
"www.twitter.com/xiaohuggg/status/1676918802800582656?s=20"

4️⃣

🎨🎨🎨 艺术二维码生成方法教学,教程有一些复杂,需要时间研究。
"www.twitter.com/xiaohuggg/status/1676886055046496256?s=20"

5️⃣

🖼️🖼️🖼️ DragonDiffusion:一种基于扩散模型中间特征的强对应关系的细粒度图像编辑方案。能够理解图像内容,知道如何修改图像以达到想要的效果。
"www.twitter.com/xiaohuggg/status/1676876228752740356?s=20"

6️⃣

🌆🌆🌆 拉斯维加斯 MSG 球体举行点亮仪式,展示出不同画面,令人惊艳!球体成本 23 亿美金,有 18600 个座位,外立面屏幕是世界上最大的可编程 LED 屏幕!
"www.twitter.com/xiaohuggg/status/1676833974545707009?s=20"

7️⃣

🧠🧠🧠 OpenAI 预测超级人工智能:OpenAI 预计在未来十年内将出现超级人工智能,他们计划投入 20%的算力资源来研究“超级对齐”,即如何使比人类更智能的 AI 系统遵循人类的意图。
"www.twitter.com/xiaohuggg/status/1676810867281887233?s=20"

8️⃣

📲📲📲 Threads:一个新的社交 app,在没有准备好的情况下尝试挑战这个行业的老大,不过评价不佳。
"www.twitter.com/xiaohuggg/status/1676798357476614145?s=20"

9️⃣

💻💻💻 GPT-Migrate:一个项目,帮助用户轻松地将代码库从一个框架或语言迁移到另一个,使用大型语言模型(如 GPT-4-32k)来重建新的目标语言代码,并在 Docker 环境中运行新的代码库进行迭代调试。
"www.twitter.com/xiaohuggg/status/1676796863297511426?s=20"

🔟

🧠🧠🧠 I-JEPA:一种全新架构,由 Meta 的首席人工智能科学家 Yann LeCun 提出,能让人工智能系统像动物和人类一样学习和推理。通过创建和理解世界的内部模型,来预测和理解新的、未见过的情况。
"www.twitter.com/xiaohuggg/status/1676780807191658496?s=20"

1️⃣1️⃣

🌍🌍🌍 Skybox AI 2.0:一个可以通过文本提示一键生成无限的 360°虚拟世界的工具,无论是为游戏环境,还是 VR 应用创建背景,都能根据文字提示快速生成。
"www.twitter.com/xiaohuggg/status/1676768264846999552?s=20"

7 月 5 日

🙋 🔔小互的推特 7 月 5 日更新
✨✨✨✨✨✨✨✨✨✨

1⃣️

🎉🎉🎉 Notion-to-Chatbot:允许你与任何 Notion 文档进行交谈。
你可以轻松地输入你想要与之交谈的文档内容。它能够提供即时的答案,你可以提问、提取信息,甚至用 AI 对文档进行总结。
这个项目的源代码已经发布,你可以在 GitHub 上查看和使用。
"www.twitter.com/xiaohuggg/status/1676605457610293250?s=20"

2⃣️

🔥🔥🔥 Hacker News 改造计划 💡💡💡

Hacker News 是一个面向全球的技术类新闻聚合社区。但这个网站整体 UI 很古朴,并且一页密密麻麻的 30 条新闻标题,让人看起来非常费劲。有人做了一个增强版:Hacker News Summary,利用 ChatGPT 的总结能力,直接将每条新闻用一两句话总结出来,大大节约了每天看新闻的时间。
"www.twitter.com/xiaohuggg/status/1676519811751501825?s=20"

3⃣️

💫💫💫 小互学习了新技能,在使用 ChatGPT 的时候,如果内容过长,你是不是经常需要手动点击“Continue generating”按钮让 GPT 继续帮你生成?每次手动点击很麻烦,有没有办法可以让浏览器自动帮你点击而且不需要安装浏览器插件?
"www.twitter.com/xiaohuggg/status/1676490076782731264?s=20"

4⃣️

🎞️🎞️🎞️ #Zeroscope 是一种新的文本到视频模型,可以生成高质量的高清视频。之前分享过,没太注意,这几天陆续看到很多分享视频,确实质量很高。重新整理下:它可以生成高质量的视频,视频的宽高比是 16:9,与电视和电脑屏幕的宽高比一样。zeroscope_v2_X 是它的一个升级,可以生成 1024x576 的分辨率的视频。
"www.twitter.com/xiaohuggg/status/1676439196377165824?s=20"

5⃣️

🔒🔒🔒 Google 隐私政策更新 🔒🔒🔒

Google 最近更新了其隐私政策,允许其使用任何公开可用的数据进行人工智能(AI)训练。

Google 将"语言模型"一词替换为"AI 模型",并表示可能允许使用任何公开数据来构建功能和完整产品,如 Google 翻译、Bard 和 Cloud AI 能力。

这项更新于 2023 年 7 月 1 日发布
"www.twitter.com/xiaohuggg/status/1676411254431428608?s=20"

6⃣️

💻💻💻 AMD 扩大显卡支持 💻💻💻

AMD 称将扩大对消费级 RDNA 3 显卡的 ROCm 支持。AMD 已发布其用于 GPU 计算的开源平台 Radeon Open Compute(ROCm)5.6 的最新版本。将支持更多的 RDNA 2 显卡以及部分 AMD RDNA 3 工作站和消费级显卡。首批获得官方支持的显卡将是 48GB 的 Radeon PRO W7900 和 24GB 的 Radeon RX 7900 XTX。
"www.twitter.com/xiaohuggg/status/1676407698605342720?s=20"

7 月 4 日

🏆 🔔决定不抛弃马斯克的小互的推特 7 月 4 日更新

1️⃣

🤖OpenCat:一个基于 Arduino 和 Raspberry Pi 的开源四足机器人宠物框架。OpenCat 提供了一个基础的开源平台,可以创建令人惊奇的可编程步态、运动四足机器人。它可以进行复杂的运动(行走、跑步、跳跃、后空翻)。

🔗Twitter Post: twitter.com/xiaohuggg/status/1676233229907673088

💡关键词: #OpenCat #四足机器人 #Arduino #RaspberryPi

2️⃣

🎬SAM-PT:能够在动态视频分割任何内容并进行跟踪。这种技术可用于识别和追踪视频中特定对象,如人、车辆、动物等,也可用于追踪特定的特征,如颜色、形状、运动模式等。应用包括视频监控、自动驾驶、运动分析、电影制作等。

🔗Twitter Post: twitter.com/xiaohuggg/status/1676203365964075008

💡关键词: #SAMPT #视频分割 #对象跟踪

3️⃣

🔬Google 宣布其量子计算机最新进展:它能够瞬间完成现有最好的超级计算机需要 47 年才能完成的计算。这台新的量子计算机有 70 个量子比特,比 2019 年他们宣布的那台机器多了 17 个。增加更多的量子比特可以指数级地提高量子计算机的能力,这意味着新的机器比 2019 年的机器强大 241 万倍。

🔗Twitter Post: twitter.com/xiaohuggg/status/1676149614867795968

💡关键词: #Google #量子计算 #量子比特

4️⃣

🕺DisCo(Disentangled Control):能够生成具有多样外观和灵活动作的高质量人类舞蹈图像和视频。你只需提供一个或多个包含你想在生成的舞蹈中看到的人物(前景)和环境(背景)的参考图像和一个描述舞蹈动作的姿势序列,DisCo 就能生成新的舞蹈动作,而且新的舞蹈动作够保持和参考图像的外观和环境一致。

🔗Twitter Post: twitter.com/xiaohuggg/status/1676140295304646657

💡关键词: #DisCo #AI 生成舞蹈 #动作生成

5️⃣

🏛️华尔街日报:拜登政府正准备限制中国企业使用美国云计算服务。若规定获通过,微软及亚马逊等美企在对中企提供相应服务前,将需要提前获得美国政府许可。预计商务部未来几周内公布细节。该限制措施被认为是修补漏洞,防止中企透过云服务使用英伟达(Nvidia)A100 等计算芯片。

🔗Twitter Post: twitter.com/xiaohuggg/status/1676110930973954049

💡关键词: #美中关系 #云计算服务 #政府限制

6️⃣

🎭#Brav6 模型预计将在本周发布 ,先看一波预览图过过眼瘾😍。

🔗Twitter Post: twitter.com/xiaohuggg/status/1676099960130138114

💡关键词: #Brav6 模型 #AI 模型预览

7️⃣

🌐由于 ChatGPT Plus 的网页浏览功能帮助用户绕过付费内容的付费墙而获取某个链接的全文,这损害内容提供者的合法利益!OpenAI 将暂时禁用浏览功能,等待修复漏洞后重新上线!🤔

🔗Twitter Post: twitter.com/xiaohuggg/status/1676086004938317825

💡关键词: #ChatGPTPlus #网页浏览功能 #OpenAI

8️⃣

🐦instagram 旗下的类似 Twitter 的应用 Threads7 月 6 号上线,大家要不要抛弃马斯克啊😂。

🔗Twitter Post: twitter.com/xiaohuggg/status/1676025546734710786

💡关键词: #Threads #Instagram #社交应用

9️⃣

🤖微软自主系统和机器人研究院发布了一篇论文,主要研究了 OpenAI 的 ChatGPT 在机器人应用中的使用。展示了 ChatGPT 在机器人学中的潜力和应用可能性。研究涵盖了机器人领域的一系列任务,从基本的逻辑、几何和数学推理,到复杂的领域如空中导航、操纵和具象化的代理。

🔗Twitter Post: twitter.com/xiaohuggg/status/1676062513870536704

💡关键词: #微软 #OpenAI #ChatGPT #机器人应用

🔟

🎮AI Game Creator:你只需要输入文字描述即可帮你开发出你需要的游戏。通俗的说就是它集合了各种 AI 工具,可以帮你完成游戏开发中的各种任务,如生成角色、背景和物体、创建动画、制作智能角色、定制角色、生成故事和视觉效果,以及设计角色扮演游戏。

🔗Twitter Post: twitter.com/xiaohuggg/status/1676052057630052352

💡关键词: #AIGameCreator #游戏开发 #AI 工具

1️⃣1️⃣

🖼️#Midjourney 5.2 发布新功能:平移。你可以通过点击放大图像中的方向箭头按钮来扩展图像。只需点击箭头,就可以将图像扩展到你想要的方向。

🔗Twitter Post: twitter.com/xiaohuggg/status/1676041789093068800

💡关键词: #Midjourney #新功能 #平移功能

1️⃣2️⃣

📚StoryBird:利用人工智能生成儿童故事图画书 还能卖了赚钱 💰。你只需要输入 20-200 个单词提示语句,它就能给你生成一本完整的带有精美插图的英文故事书。而且还能在该网站和亚马逊售卖!

🔗Twitter Post: twitter.com/xiaohuggg/status/1675881515019038723

💡关键词: #StoryBird #人工智能 #儿童故事书

7 月 3 日

🙋 🔔小互的推特 7 月 3 日更新
✨✨✨✨✨✨✨✨✨✨

1️⃣
📚StoryBird:利用人工智能生成儿童故事图画书,还能卖了赚钱💰。你只需要输入 20-200 个单词的提示语句,它就能给你生成一本完整的带有精美插图的英文故事书。而且还能在该网站和亚马逊售卖!利用 ChatGPT 插件就能生成。附上教程:
🔗Twitter Post: twitter.com/xiaohuggg/status/1675881515019038723
💡关键词: #StoryBird #AI 生成故事图画书

2️⃣
🗣️如何用英文解释中国科技公司常用的术语。文章列举了中国互联网公司喜欢用的五个专业术语:1。 Huidu(灰度) 2。 Lunzi(轮子) 3。 Chendian(沉淀) 4。 Dapan(大盘) 5。 Maidian(埋点)。但这些并不是我们常用的,我们一般用赋能、打通全链路、闭环、抓手、中台等。
🔗Twitter Post: twitter.com/xiaohuggg/status/1675742703110475777
💡关键词: #中国科技公司术语 #英文解释

3️⃣
👤Generated Photos 有个人工生成的面孔库,总共有 2675894 张照片。这个工具提供了多种筛选选项,包括背景颜色、面部类型(自然或美化)、头部姿势、性别、年龄、种族、眼睛颜色、头发颜色、头发长度和情绪。这使得用户可以根据自己的需求找到最合适的面孔。
🔗Twitter Post: twitter.com/xiaohuggg/status/1675480205811654659
💡关键词: #GeneratedPhotos #AI 生成面孔库

4️⃣

👥Generated Photos 还有一个 Anonymizer 工具,你只需要上传你的照片,它就会生成一张与你相似的人工生成的照片。这张照片会保留你的肤色、年龄、性别、发长等特征,但不会泄露你的真实身份。这对于需要保护个人隐私,但又需要提供某种形象的情况(如社交媒体、网络论坛等)非常有用。

🔗Twitter Post: twitter.com/xiaohuggg/status/1675480193325240325

💡关键词: #Anonymizer 工具 #保护隐私

5️⃣

🖼️Generated Photos:这个网站提供了 10 万个不存在的人的照片,这些照片全部由 AI 生成。你可以在任何地方免费使用它们,而不必担心任何法律问题。这些照片符合 GDPR 和 CCPA 标准,没有版权、没有肖像权。同时他还有人工生成的面孔库,共有 2675894 张人脸照片。还有多种工具和数十万张多样化的数据集。

🔗Twitter Post: twitter.com/xiaohuggg/status/1675480188023615489

💡关键词: #GeneratedPhotos #不存在的人的照片 #AI 生成

6️⃣
🎥视频:微软 AI 超级电脑解构。微软 Azure CTO Mark Russinovich 的采访,讲述了微软如何与英伟达合作构建专用的 AI 基础设施。微软自 2020 年起为 OpenAI 打造的超级电脑,包括 28.5 万 AMD CPU 内核,1 万张英伟达 V100 GPU 都以 IB(无线带宽)连接,计算能力是世界排名第五的超级电脑。
🔗Twitter Post: twitter.com/xiaohuggg/status/1675692134777896960
💡关键词: #微软 AI 超级电脑 #AI 基础设施

7 月 2 日

🌗 🔔小互的推特 7 月 2 日更新

1️⃣
🎵洗碗打碟?Come on, baby! 👐让我看到你们的双手,开发了一个能发出唱片刮擦声的机器,让它更有乐趣!🎉
🔗Twitter Post: twitter.com/xiaohuggg/status/1675438025973829637
💡关键词: #洗碗打碟 #机器

2️⃣
📉Twitter 的广告门户网站 (ads.twitter.com) 今年 5 月的访问量下降到了 190 万次,相比一年前的 250 万次,下降了 21.7%。从 4 月到 5 月,访问量基本保持不变。
🔗Twitter Post: twitter.com/xiaohuggg/status/1675424310662684672
💡关键词: #Twitter 广告门户 #访问量下降

3️⃣
🌸这位 @janiefitzgerald 艺术家用 AI 创作了一些花的动态视频,真是非常惊艳,栩栩如生,惊叹不已!又增加了几个视频,真好看!
🔗Twitter Post: twitter.com/xiaohuggg/status/1668177096840204288
💡关键词: #AI 艺术 #动态花卉视频

4️⃣
💸Twitter 的 Google Cloud 合同到期欠费了,原来是没钱了说的冠冕堂皇的。
🔗Twitter Post: twitter.com/xiaohuggg/status/1675305318639878144
💡关键词: #GoogleCloud 合同 #欠费

5️⃣
😒Twitter 不如实行摇号访问和单双号限行措施吧,脑子有问题。
🔗Twitter Post: twitter.com/xiaohuggg/status/1675300628934053890
💡关键词: #Twitter 访问 #建议

6️⃣
🎧PodcastGPT:它可以“听取”你喜欢的播客,然后找出其中最有价值或最有趣的部分,帮你挑选出来,并将这些部分发送到任何你的播客 APP。
🔗Twitter Post: twitter.com/xiaohuggg/status/1675133509621678084
💡关键词: #PodcastGPT #播客内容筛选

7️⃣
🧠DreamDiffusion:从大脑脑电图信号(EEG)生成高质量图像,而且无需将思想转化为文本。他们利用了预训练的文本到图像模型,并在训练过程中随机地隐藏一部分 EEG 信号,然后训练模型去预测被隐藏的部分。这样做的目的是让模型学习到 EEG 信号的内在结构和模式,从而获得更有效和更稳健的 EEG 表示。
🔗Twitter Post: twitter.com/xiaohuggg/status/1675127527290044416
💡关键词: #DreamDiffusion #EEG 图像生成

8️⃣
🔬科学家们首次呈现了一个成年大脑的神经连线图,这个大脑来自一只雌性果蝇。这个连线图包含了大约 130,000 个神经元之间的 5x10^7 个化学突触。他们演示了如何追踪突触路径和信息流,从输入(感觉和上行神经元)到输出(运动、内分泌和下行神经元),跨越两个半球,以及在中央大脑和视觉叶之间。
🔗Twitter Post: twitter.com/xiaohuggg/status/1675115971147890694
💡关键词: #神经连线图 #果蝇大脑

7 月 1 日

🌗 ### 🔔 小互的 7 月 1 日推特更新 🔔

✨✨✨✨✨✨✨✨✨✨

🔔小互的推特 7 月 1 日更新

1️⃣
💡Anther AI:利用你的知识和记忆创建个人定制 LLM。这些模型可以存储你的知识和记忆🧠。你可以通过聊天💬和日记📖训练你的 AI。其目标是捕捉和保存人类的经验,以便将来的后代可以访问,也就是数字永生的概念。同时它还能记录你的声音🔊,可以像你一样发声。上传你的照片📸还能创建一个和你相似度的动画化身。
🔗Twitter Post: twitter.com/xiaohuggg/status/1675091491159699456
💡关键词: #AntherAI #个人定制 LLM

2️⃣
🖼️Any Image to 3D:可以将复杂 2D 图像转换为 3D 模型的量产 AI 系统。你可以将你的想法、画面(比如一件家具或一个奇特的生物)记录下来。再使用像 Midjourney、stable diffusion 或 Dall-E 这样的工具将你的概念转化为实体图像。然后无需高级的技术知识,无需高级的 3D 建模技能,通过该工具即可创造出 3D 模型!
🔗Twitter Post: twitter.com/xiaohuggg/status/1675062623111618561
💡关键词: #AnyImageto3D #2D 转 3D

3️⃣
🤖苏黎世联邦理工学院机械工程学生开发了一种名为 "Belle" 的自主水下机器鱼🐠,它能够在不干扰其探索的微妙生态系统的情况下收集 DNA 样本并进行水下摄影📷。Belle 像真正的鱼一样移动和行为,使其能够无缝地导航水下环境,同时收集重要的生物多样性数据。
🔗Twitter Post: twitter.com/xiaohuggg/status/1675058995239993344
💡关键词: #自主水下机器鱼 #生物多样性数据收集

4️⃣
🗣️ChatPDF 是一个开源项目,允许用户通过私有的 OpenAI 密钥与 PDF 文件进行对话。总结和分析论文、学术文章,报告总结、分析和针对细节的提问。回答任何 PDF 中的任何问题。项目地址:github.com/austin2035/chatpdf
🔗Twitter Post: twitter.com/xiaohuggg/status/1674976372094300160
💡关键词: #ChatPDF #对话式 PDF 阅读

5️⃣
🍏以色列公司开发了一种"飞行自主机器人"。机器人由最先进的人工智能和计算机视觉算法驱动,使它们能够精细地收获果实。这些机器人能够在农场上执行多种任务。它们能收获各种不同的果实,包括苹果和核果。机器人还能收集和报告摘的每个果实的信息,如单个果实大小、重量、成熟度、疾病等的综合数据。
🔗Twitter Post: twitter.com/xiaohuggg/status/1674969368005062656
💡关键词: #飞行自主机器人 #精细果实收获

6️⃣
💬当 token 超过一定长度后,GPT 忘记了之前的内容。通过每 5 条消息创建一个摘要,摘要以 JSON 格式保存,通过将摘要保存为 JSON 格式,可以确保即使 GPT 忘记了之前的对话,我们仍然能够追溯到先前的对话内容。这种方法有效地扩展了对话长度,让我们能够更长时间地与 GPT 进行交互,从而获得更多有用的回答。
🔗Twitter Post: twitter.com/xiaohuggg/status/1674961916303933440
💡关键词: #GPT 对话长度扩展 #JSON 格式摘要

6 月 30 日

🌗 🔔 小互的 6⃣️ 月 3⃣️0⃣️日推特更新 🔔

✨✨✨✨✨✨✨✨✨✨

1️⃣🐦 Twitter 关上了大门 🚪🔒
Twitter 网页版不再允许用户未登录的情况下浏览内容。所有网址都被重定向到注册页面。
这被认为是一种防止抓取工具获取 Twitter 数据的措施。早在四月份,Twitter 就取消了未注册用户使用搜索功能。
🔗 https://twitter.com/xiaohuggg/status/1674782589805293583?s=20

2️⃣ 🔢 One-2-3-45:45 秒内将任何单一的 2D 图像转化为 3D 效果 🖼️➡️🏞️
首先,使用一个特殊的模型来从原始的 2D 图片生成多个不同角度的 2D 图像。这就像是从不同的角度看同一个物体。
然后,使用一个基于 SDF 的神经网络模型,将这些不同角度的 2D 图像"堆叠"起来,形成一个完整的 3D 形状。
🔗 https://twitter.com/xiaohuggg/status/1674746125616807936?s=20

3️⃣🤖 加州理工学院开发出了一款名为”M4”(Multi-Modal Mobility Morphobot)的能跑能飞的新型智能机器人 🚀
M4 可以实现 8 种不同运动方式,使用人工智能自主决定自己应该做什么,它可以自行决定何时行走、站立、滚动或飞行。 而且还可根据周围的环境条件进行调整。
🔗 https://twitter.com/xiaohuggg/status/1674686529971830784?s=20

4️⃣📊 Character.ai 上个月网络访问量达到 2.8 亿次,环比增长 60%,平均会话时长接近 30 分钟 ⏳
而相比之下:
ChatGPT 平均 7 分钟 ⏳
http://Jasper.ai 平均 4 分钟 ⏳
http://You.com 平均 5 分钟 ⏳
http://Replika.ai平均 2 分钟 ⏳
可见角色扮演类型的市场还是很大!
🔗 https://twitter.com/xiaohuggg/status/1674650996948217856?s=20

5️⃣💰 Inflection AI 宣布在最新一轮融资中获得 1.3B 美元后首席执行官兼联合创始人 @mustafasuleymn 谈论公司的下一步发展 💡
🔗 https://twitter.com/xiaohuggg/status/1674614280816320512?s=20

6️⃣🎮 将 AI 接入到虚拟伴侣模拟游戏 🐕
Proxima 公司开发的一个名为 Lumari 的原型,这是一个可以感知、解释和从周围环境中实时学习的虚拟伴侣。
他们以此原型开发了一个 Nemo AI 的虚拟狗,并将它接入到游戏。Nemo 是独立于游戏世界构建的。可以实时感知、解释周围环境并从环境中进行学习进化,就像真正的玩家一样。
🔗 https://twitter.com/xiaohuggg/status/1674605563957886978?s=20

7️⃣🎬 Wonder Studio 结束内测,向所有人开放了 🎉
Wonder Studio 可以自动化将现实场景中的人物转换替代成 CG 角色,还可以进行动画、灯光和合成。
使用该工具不需要复杂的 3D 软件和昂贵硬件,只需要一台相机拍摄视频,然后使用该工具即可将人物替换成 CG 角色。传送门:http://wonderdynamics.com
🔗 https://twitter.com/xiaohuggg/status/1674583399795920896?s=20

8️⃣🎥 Webcam Motion Capture:通过你的电脑或智能手机的摄像头即可完全控制和制作你专属的 3D 虚拟形象 👥
只需要网络摄像头,无需购买 Leap Motion 或任何特殊设备。它就可对你进行头部追踪、眼球追踪、眨眼检测、唇形同步和上半身追踪,用来制作动态的虚拟形象!
还可以将捕捉到的运动数据保存为 FBX 文件。
🔗 https://twitter.com/xiaohuggg/status/1674402628288266240?s=20

6 月 29 日

🙋 🐦 小互 6 月 29 日推特更新 📆

✨✨✨✨✨✨✨✨✨✨

1️⃣ Webcam Motion Capture 🎥🎭

这是一种革新的技术,可以通过你的电脑或智能手机的摄像头,实现对你专属 3D 虚拟形象的全面控制和定制。最多可以设置 20 个子动画,无需购买 Leap Motion 或任何特殊设备,非常实用并且方便。

👉 关键词:电脑摄像头、3D 虚拟形象、动画制作 https://twitter.com/xiaohuggg/status/1674402628288266240?s=20

2️⃣ WebPilot 的 Chrome 插件 🌐🧩

强力推荐 WebPilot 的 Chrome 插件,现在你不需要 ChatGPT Plus 就可以体验到 WebPilot 的强大功能。虽然免费额度有些少,但是其独特的功能确实值得一试。

👉 关键词:WebPilot、Chrome 插件、ChatGPT Plus https://twitter.com/xiaohuggg/status/1674394865915002881?s=20

3️⃣ 关于美团收购光年之外的观点 📝🔭

小互发表了一份关于美团收购光年之外的观点,提供了深入的见解和独到的角度,值得一读。

👉 关键词:美团、光年之外、并购观点 https://twitter.com/xiaohuggg/status/1674355454221352960?s=20

4️⃣ 微软迁移到云端 💻☁️

微软计划将 Windows 完全迁移到云端并融入 AI 功能,这可能会重新定义我们对操作系统的理解和使用方式,值得关注。

👉 关键词:微软、Windows、云端迁移 https://twitter.com/xiaohuggg/status/1674352649666441221?s=20

5️⃣ MVDiffusion 📷🔄

这是一种简单而有效的多视图图像生成方法。该系统能够从多个不同的视角生成图像,且视觉上是一致的,如能从文本提示生成全景图像等,显示了 AI 在图像生成领域的巨大潜力。

👉 关键词:多视图图像生成、AI、全景图像 https://twitter.com/xiaohuggg/status/1674329142811303936?s=20

6️⃣ Paste 🖥️📋

Paste 是一款强大的剪贴板增强工具,它会自动将您复制的所有内容保存到剪贴板历史记录中,确保您永远不会丢失任何重要内容,大大提高了工作效率。适用于 Mac 和 iOS

👉 关键词:剪贴板增强、Mac/iOS、生产力应用 https://twitter.com/xiaohuggg/status/1674310361259057152?s=20

7️⃣ 人工智能聊天机器人的新用途 🤖💬

根据媒体研究组织 NewsGuard 与《麻省理工科技评论》一份新报告,人们正在利用人工智能聊天机器人填充垃圾网站,并吸引付费广告商。超过 140 个主要品牌在这些人工智能生成的新闻网站上投放广告,其中 90%的广告由谷歌提供。这种做法可能加剧垃圾信息的传播,并浪费大量广告资金

👉关键词:AI 聊天机器人、垃圾网站、广告商 https://twitter.com/xiaohuggg/status/1674300744344932353?s=20

8️⃣ 用 AI Face Swap 马斯克大战扎克伯格的视频 🎬🤩

这是一段用 AI Face Swap 技术制作的视频,非常有趣和引人注目,可以看到 AI 技术在娱乐领域的巨大潜力。

👉 关键词:AI Face Swap、马斯克、扎克伯格 https://twitter.com/xiaohuggg/status/1674287208612892676?s=20

9️⃣ The Midjourney Cheat Sheet V5.2 📑🚀

这是一个全面而详细的 Midjourney 项目的功能和参数清单图表,可以打印出来放在工作区,帮助你更好地理解和使用 Midjourney 项目的各种功能和参数。 包括了所有的基本设置和提示参数

👉 关键词:Midjourney 项目、功能参数、高级概念 https://twitter.com/xiaohuggg/status/1674250674182438912?s=20

🔟 Playground AI 的重大更新 🎨🔬

这次更新引入了混合图像编辑功能,允许用户将真实和合成图像结合起来,创作出令人惊叹的作品和逼真的图像,创作出令人惊叹的作品和逼真的图像。同时强大的协作 Canvas 编辑器,可以在其上叠加多个编辑层。

👉 关键词:Playground AI、混合图像编辑、AI 图像创作 https://twitter.com/xiaohuggg/status/1674239691506450432?s=20

1️⃣1️⃣ 一个新颖的游戏 🎮😂

这是一款新颖但是令人抓狂的游戏,要求你必须不断输入密码,以达到规则要求,无疑会带给玩家独特的游戏体验。

👉 关键词:沙雕,无聊 https://twitter.com/xiaohuggg/status/1674225123296153600?s=20

1️⃣2️⃣ Zing Coach 📸🏋️‍♂️

只需 2 张自拍照,就能获得你身体的健康扫描报告,帮助你制定健身和营养计划,小互做了亲测体验,结果让人惊喜。

👉 关键词:Zing Coach、自拍照、健康扫描报告 https://twitter.com/xiaohuggg/status/1674064760374022144?s=20

6 月 28 日

🐙 🐦 小互 6 月 28 日推特更新 📆

✨✨✨✨✨✨✨✨✨✨

1️⃣ FableForge 🖌️📖

  • 免费 AI 生成绘本,展示了如何利用新的 AI 工具和方法来克服难题。通过利用 LangChain、OpenAI 的函数调用特性、Stable Diffusion 的图像生成能力,以及 Deep Lake 的多模态数据集存储和分析能力,创建了一个开启儿童图画书创作新前沿的应用。
    👉 https://twitter.com/xiaohuggg/status/1671009581710069767?s=20

2️⃣ 转发了宝玉老师的翻译课程📚🌐

3️⃣ 利用 ChatGPT 规划山地骑行路线 🗺️🚵♀️
👉 https://twitter.com/xiaohuggg/status/1673943717227667458?s=20

4️⃣ SnapCalorie 🍲🔍

5️⃣ 有趣的 AR 互动 🥊📱

6️⃣ Movie Screencap 🎥🌈

7️⃣ Inflection AI 💻🌐

8️⃣ Unity 公司的新产品:Unity Muse 和 Unity Sentis 🎮🤖

9️⃣ ChatGPT 客户端更新 💬🔄

🔟 LayerDivider 🖼️➗


6 月 27 日

🎉 🐦 小互的 6 月 27 日推特更新 📆

✨✨✨✨✨✨✨✨✨✨✨✨

1️⃣ MotionGPT 💃🏻🕺

  • 统一、多功能的运动语言模型,能够将语言指令转换为 3D 人体运动!如"踢腿"或"跳舞"等。

👉 https://twitter.com/xiaohuggg/status/1673580457118797824?s=20

2️⃣ http://elevenlabs.io 🗣️🎙️

3️⃣ LangTale Playground 👨💻👩💻

4️⃣ Photoshop 画笔工具 🎨🖌️

5️⃣ Databricks 与 MosaicML 🤝💼

6️⃣ OpenAI 的 ChatGPT 💬🤖

7️⃣ QuestEnvSim 👓🎮

8️⃣ RealityScan 📸🏞️