CloneRobotics：人形骨骼机器人

不只是人形，骨骼也是仿照人类做的。

我们正处于一个见证人形双足机器人快速进化的时代。挑战在于尝试复制运动的流畅性。这不仅是为了外观，也是为了能量优化。

OpenAI 12Days 第一天：o1 pro与天价订阅

昨天是 OpenAI 12Days 的第一天，主要更新包括：

完整版 o1（暂无 API 支持）
o1 pro 模型
每月 200 美元（约合 1450 人民币）的 ChatGPT Pro 订阅服务

ChatGPT Pro 贵是真的贵，但它提供了无限制访问高级语音模式、o1、4o 以及全新的 o1 pro 模型的特权。

但是O1 的 SWE-bench 编程测试结果和 O1-Perview 没有区别。而且都没有超过 Claude 3.5 Sonnet 的 49%。

Fish Speech 1.5：TTS-Arena 排名第二开源技术

Fish Speech 1.5 正式发布，这是一项在 TTS-Arena 排名第二的开源语音合成技术，支持 13 种语言，并提供 150 毫秒以内的低延迟高质量即时语音克隆。新版本使用 1 百万小时的多语种语音训练，其中中文和英文的效果尤为出色。用户可以直接在 Fish Audio 上体验这一技术。

跨语言能力展示，多语言保持音色、语调语气

在线体验: http://fish.audio

腾讯开源 13B 混元文生视频模型

腾讯开源了 13B 参数的混元视频模型，其能力和效果媲美商业模型。

该模型支持艺术镜头、语音驱动、视频配音，并能轻松实现 LivePortrait 的表情驱动和类似 Animate Anyone 的动作驱动。你们可以在官网查看完整介绍，你可以在这里预约体验。

GianMattya 发布 AI 线稿上色与自动分层技术演示

GianMattya 最近发布了一个 AI 线稿上色并自动分层的演示。首先，可以用 AI 生成一个线稿，然后利用这个工具可以完成上色，并自动分层背景、肤色、眼睛、头发等。目前只放出了演示视频，有相关需求的可以关注下。

海螺发布 I2V-01-Live：多种艺术风格的视频模型

Live 是 I2V 系列的最新成员，旨在彻底改变 2D 插画的呈现方式。该模型具有增强的流畅度和生动的动作，可让您的人物以前所未有的方式移动、说话和发光。 Hailuo I2V-01-Live 针对稳定性和微妙的表达进行了优化，支持多种艺术风格，使您能够扩展您的创造性表达，并以无与伦比的流畅度和技巧将您的艺术变为现实。

2025-06-04 15:21:09