小互的每日动态
🙋 ### **请关注小互的推特 𝕏:**https://twitter.com/xiaohuggg
每日大概晚上11点后在群里发送(群二维码在首页)
以下内容使用群友Arthur等的prompt最佳实践 # Role: 文字排版大师 排版
小互是「互联网的那点事」微博博主,内容经本人授权
如果你想找某个项目可以用control+F,快速定位
短链接直达:http://xiaohu.ai/
11月18日
📣 🔔 Xiaohu.AI日报「11月18日」
✨✨✨✨✨✨✨✨
1⃣️
🔮 Meta Quest3展现混合虚拟现实技术:
混合虚拟现实技术预计明年将大幅增长。
预示虚拟与现实界限的日益模糊。
🔗 https://x.com/xiaohuggg/status/1725850463785074731?s=20
2⃣️
🎬 德国电信广告突显隐私风险:
广告展示数据滥用和AI风险。
着重于网上分享儿童信息的危害。
🔗 https://x.com/xiaohuggg/status/1725810572657357210?s=20
3⃣️
🤖 瑞士研究者与Inkbit合作开发新3D打印法:
创新3D打印技术一次性打印多种材料。
可直接打印功能完整的机器人手。
研究成果发表在Nature杂志。
🔗 https://x.com/xiaohuggg/status/1725801030162723086?s=20
4⃣️
👗 三维扫描技术捕捉衣物细节:
技术增强电脑模拟真实衣物的能力。
专注于褶皱和变形衣服的精确模拟。
对电影、游戏及虚拟试衣应用有重大影响。
🔗 https://x.com/xiaohuggg/status/1725787462382084523?s=20
5⃣️
🚪 OpenAI高级研究员集体辞职:
包括研究总监和AI风险团队负责人。
跟随CEO Sam Altman和总裁Greg Brockman的离职。
🔗 https://x.com/xiaohuggg/status/1725772118091334130?s=20
6⃣️
😂 面部追踪系统演示引起关注:
演示视频显示沙雕风格。
相关代码已发布在GitHub。
🔗 https://github.com/rizkydermawan1992/face-detection
🔗 https://x.com/xiaohuggg/status/1725746727532249483?s=20
7⃣️
🌐 Wikidata发布庞大知识库:
超过120亿个事实数据的免费知识库。
有助于提高LLMs的事实性。
支持多语言,优化信息检索和数据分析。
🔗 https://x.com/xiaohuggg/status/1725726053212312046?s=20
8⃣️
🏛️ OpenAI非盈利组织董事会审查:
董事会成员无公司股份,微软似乎无干预权。
OpenAI以非盈利组织起步,后发展为“有限盈利”公司。
11月17日
📣 🔔 Xiaohu.AI日报「11月17日」
✨✨✨✨✨✨✨✨
1⃣️
🤖 DeepMind的Mirasol3B模型:
更有效地理解和分析视频中发生的事情,即使视频很长。
独特的多媒体处理:同步和非同步文本分析。
视听与文本关系理解:提高长视频分析效率。
🔗 https://x.com/xiaohuggg/status/1725514650840903914?s=20
2⃣️
🎥 Meta AI的Emu Video和Emu Edit:
Emu Video:文本到视频的生成,高质量视频制作。
Emu Edit:图像编辑的指令驱动模型,精确像素修改。
技术创新:两个扩散模型生成高分辨率视频。
🔗 https://x.com/xiaohuggg/status/1725470552318718046?s=20
3⃣️
🌐 screenshot-to-code项目:
- GPT-4V驱动:将屏幕截图转化为HTML网页。
🔗 https://x.com/dotey/status/1725333564470812773?s=20
4⃣️
👤 微软的Deepfakes Creator:
仅需文本输入就可生成逼真的会说话的真人视频
支持多种语言,还可进行实时问答互动
🔗 https://x.com/xiaohuggg/status/1725363740974236000?s=20
5⃣️
🎶 Deepmind与YouTube的Lyria音乐生成模型:
只要哼唱或者吹口哨就能帮你自动生成交响乐
歌词创作和风格控制:艺术家风格模仿。
特色:生成音频带AI水印。
https://deepmind.google/discover/blog/transforming-the-future-of-music-creation/
🔗 https://x.com/xiaohuggg/status/1725330887318044830?s=20
6️⃣
🏪 GPTs Store界面曝光:GTPs导航站可能会被取代?
精选GPT:展示本周精选GPTs。
热门GPT:社区中受欢迎的GPTs。
特色和趋势:当前列表为空
https://x.com/xiaohuggg/status/1725521961420472757?s=20
7️⃣
🎨 Meshy-1:3D模型生成AI工具:
多样输入:文本和图像到3D模型转换。
风格多样:现实、动漫、卡通等风格选择。
格式支持:多种文件格式,包括Unity插件。
高清纹理:提供4K分辨率PBR纹理。
🔗 https://meshy.ai
🔗 https://x.com/xiaohuggg/status/1725525234412097774?s=20
11月16日
📣 🔔 Xiaohu.AI日报「11月16日」
✨✨✨✨✨✨✨✨
1⃣️
💡 Sam·奥特曼的产品观:
强调优秀产品的重要性。
提出用户对产品的热爱是衡量成功的关键指标。
讨论两种用户群体策略:深度且专注 vs. 广泛且浅层。
🔗 https://x.com/xiaohuggg/status/1725131257699537085?s=20
2⃣️
🛠️ AI视频转录与翻译工具推荐:
高效的转录和翻译速度。
支持OpenAI TTS,多种语言翻译模型。
非广告,基于用户实际体验。
🔗 https://x.com/xiaohuggg/status/1725106873593143721?s=20
3⃣️
🤖 ChatGPT新功能:
利用对话进行学习和自我提升。
永久记忆用户信息。
🔗 https://x.com/xiaohuggg/status/1725084220782235871?s=20
4⃣️
🔊 微软Personal Voice新功能:
1分钟语音样本克隆,支持100种语言。
保障隐私安全,水印安全认证。
首先在西欧、美国东部和东南亚上线。
🔗 https://x.com/xiaohuggg/status/1725070328135832041?s=20
5⃣️
📸 Polycam 3D建模工具:
基于图片或视频快速创建3D模型。
支持多种格式导出,兼容流行3D软件。
无人机图像转换3D模型功能。
🔗 https://x.com/xiaohuggg/status/1725030753749315768?s=20
6⃣️
🔊 Distil-Whisper在线体验:
速度是Whisper的6倍。
更小模型大小,接近Whisper的词错误率。
强大抗噪声能力和减少幻听。
🔗 https://x.com/xiaohuggg/status/1725016340745073136?s=20
7⃣️
🌐 NVIDIA介绍RAG技术:
NVIDIA发布关于RAG(检索增强生成)技术的文章。
RAG技术通过外部信息提升AI模型准确性和可靠性。
NVIDIA为RAG开发了参考架构,简化技术集成。
🔗https://x.com/xiaohuggg/status/1724995873309090071?s=20
8⃣️
💻 LLaMA-Factory:简化大语言模型微调:
提供易用的Web界面,直接进行模型训练、评估和推理。
预集成多种大型语言模型,如LLaMA、BLOOM等。
降低技术门槛,适合非专业用户。
🔗https://t.co/FubJxjHlJf
🔗https://x.com/xiaohuggg/status/1724980497934409783?s=20
9⃣️
📚 DeepMind和Raspberry Pi推出AI课程:
为11至14岁学生设计基础人工智能课程。
内容涉及搜索引擎、自动驾驶等多个AI应用。
提供全套教学资源,包括挑战项目。
🔗https://experience-ai.org
🔗https://x.com/xiaohuggg/status/1724969696217399486?s=20
🔟
🚀 中国开发世界最快互联网FITI:
网络速度1.2Tbps,可秒传150部4K电影。
依托自主研发的路由器、交换机和光纤技术。
连接全国多个城市,展现中国技术实力。
🔗https://x.com/xiaohuggg/status/1724961447011328255?s=20
1⃣1⃣️
💡 ChatGPT Team Plan即将上线:
出现在ChatGPT 3.5页面。
支持2个用户,新的Gizmo UI。
可能针 对账号共享,影响OpenAI收入和服务。
🔗https://x.com/xiaohuggg/status/1724955699602771975?s=20
1⃣2⃣️
🔧 微软推出AI芯片但不出售:
Azure Maia AI芯片和Azure Cobalt CPU。
Maia AI专为云端AI工作,Cobalt CPU支持一般云服务。
🔗https://x.com/xiaohuggg/status/1724950322442035478?s=20
1⃣3⃣️
📈 腾讯应对芯片禁令:
针对美国芯片领域禁令,腾讯表示库存充足。
现有库存能支持几代大模型更新,云能力不受影响。
🔗https://x.com/xiaohuggg/status/1724804784375607429?s=20
11月15日
🔔 Xiaohu.AI日报「11月15日」
✨✨✨✨✨✨✨✨
1⃣️
🍏 Apple Vision Pro 用户教学视频:
展示了Apple VisionOS beta 6的新手入门视频。
通过眼睛注视和手指轻捏操作,简化用户体验。
🔗 https://x.com/xiaohuggg/status/1724712023009984763?s=20
2⃣️
🤖 Story-to-Motion 动画生成:
由商汤科技研究院开发,将文本故事转换成连续动画。
能生成无限长的角色动画,实现连续的动作和行为表现。
🔗 https://x.com/xiaohuggg/status/1724706784332664998?s=20
3⃣️
🌐 Spline 支持高斯泼溅技术:
允许用户从手机上捕捉3D物体,导入Spline进行处理。
3D高斯溅射技术突出了易用性、快速渲染和高质量3D图像生成。
🔗 https://x.com/xiaohuggg/status/1724685982996500786?s=20
4⃣️
☁️ DeepMind的GraphCast天气预报模型:
能在不到一分钟完成10天的天气预报,准确性超过欧洲中期天气预报中心标准。
已开源,能预测极端天气事件如飓风、洪水。
🔗 https://x.com/xiaohuggg/status/1724643055532413310?s=20
5⃣️
🔒 ChatGPT Plus会员注册暂停:
奥特曼宣布由于服务压力,暂停ChatGPT Plus会员注册。
持续时间尚未确定。
🔗 https://x.com/xiaohuggg/status/1724631012259557686?s=20
6⃣️
🎭 ChatAnything视频聊天:
字节跳动开发,通过文本描述生成独特虚拟角色。
角色拥有独特外观、声音和个性,可进行语音和视频聊天。
🔗 https://x.com/xiaohuggg/status/1724597996225232906?s=20
7⃣️
🔍 Endless Zoom 无限放大图像:
利用潜在一致性模型实现图像无限扩充。
可以不断放大或缩小图像,内 容持续生成,无重复或结束。
🔗 https://x.com/xiaohuggg/status/1724591088961507622?s=20
🌐 在线体验:https://endless-zoom.vercel.app
8⃣️
🔊 不可描述声音网站:
收录用户上传的100%真实声音。
网站提供了丰富的声音资源,用户也可上传分享。
🔗 https://x.com/xiaohuggg/status/1724441907273597151?s=20
👂 听听看:https://orgasmsoundlibrary.com
11月14日
🔔 Xiaohu.AI日报「11月14日」
✨✨✨✨✨✨✨✨
1⃣️
🎶 Music ControlNet:
可精确控制音乐元素如旋律、音量和节奏。
允许细致调整音乐的每个细节。
结合全局属性和时间变化属性的高级音乐生成。
🔗 https://x.com/xiaohuggg/status/1724430161574027280?s=20
2⃣️
📚 学习GPTs调用外部API:
- 提供了如何在GPTs中利用外部API的指南。
🔗 https://x.com/xiaohuggg/status/1724317866013704384?s=20
3⃣️
📱 MM-Navigator: