科技周刊#7
2025-06-04 15:21:09

这是第七期周刊,每周五发布!

CloneRobotics:人形骨骼机器人

不只是人形,骨骼也是仿照人类做的。

我们正处于一个见证人形双足机器人快速进化的时代。挑战在于尝试复制运动的流畅性。这不仅是为了外观,也是为了能量优化。

OpenAI 12Days 第一天:o1 pro与天价订阅

昨天是 OpenAI 12Days 的第一天,主要更新包括:

  1. 完整版 o1(暂无 API 支持)
  2. o1 pro 模型
  3. 每月 200 美元(约合 1450 人民币)的 ChatGPT Pro 订阅服务

ChatGPT Pro 贵是真的贵,但它提供了无限制访问高级语音模式、o1、4o 以及全新的 o1 pro 模型的特权。

image-20241206161543180

但是O1 的 SWE-bench 编程测试结果和 O1-Perview 没有区别。 而且都没有超过 Claude 3.5 Sonnet 的 49%。

image-20241206161723646

Fish Speech 1.5:TTS-Arena 排名第二开源技术

Fish Speech 1.5 正式发布,这是一项在 TTS-Arena 排名第二的开源语音合成技术,支持 13 种语言,并提供 150 毫秒以内的低延迟高质量即时语音克隆。新版本使用 1 百万小时的多语种语音训练,其中中文和英文的效果尤为出色。用户可以直接在 Fish Audio 上体验这一技术。

跨语言能力展示,多语言保持音色、语调语气

在线体验: http://fish.audio

腾讯开源 13B 混元文生视频模型

腾讯开源了 13B 参数的混元视频模型,其能力和效果媲美商业模型。

该模型支持艺术镜头、语音驱动、视频配音,并能轻松实现 LivePortrait 的表情驱动和类似 Animate Anyone 的动作驱动。你们可以在官网查看完整介绍,你可以在这里预约体验。

GianMattya 发布 AI 线稿上色与自动分层技术演示

GianMattya 最近发布了一个 AI 线稿上色并自动分层的演示。首先,可以用 AI 生成一个线稿,然后利用这个工具可以完成上色,并自动分层背景、肤色、眼睛、头发等。目前只放出了演示视频,有相关需求的可以关注下。

海螺发布 I2V-01-Live:多种艺术风格的视频模型

Live 是 I2V 系列的最新成员,旨在彻底改变 2D 插画的呈现方式。该模型具有增强的流畅度和生动的动作,可让您的人物以前所未有的方式移动、说话和发光。 Hailuo I2V-01-Live 针对稳定性和微妙的表达进行了优化,支持多种艺术风格,使您能够扩展您的创造性表达,并以无与伦比的流畅度和技巧将您的艺术变为现实。

Prev
2025-06-04 15:21:09
Next