科技周刊#2

2025-06-04 15:21:09

这是第二期周刊，每周五发布！

Vue 的动效 UI 组件库

Vue 的动效 UI 组件库也开始丰富起来了

对标 Magic UI 的 Spark UI https://404.li/spark-ui
对标 Aceternity UI 的 Inspira UI https://404.li/inspira-ui

还有国内开发者的 Stunning UI
https://www.stunningui.design/

用于人形机器人的多功能神经网络全身控制器

英伟达等刚刚推出了用于人形机器人的多功能神经网络全身控制器：HOVER

它首次实现了用统一控制器来处理，像机器人的导航、步行操控和桌面操控等多种不同类型任务，还能模仿人类动作，它模拟一年的训练量，只需50分钟

它可以完成导航行走、物体操作、桌面作业、复杂动作的协调、人机交互任务等

可以无缝切换不同控制模式，支持全身运动模仿学习项目：https://hover-versatile-humanoid.github.io
论文：https://arxiv.org/abs/2410.21229

一款轻量级、能在移动设备上实时运行的数字人模型

一款轻量级、能在移动设备上实时运行的数字人模型：Ultralight-Digital-Human

需要准备一段3到5分钟的视频，视频中的人物需要全程露脸，声音清晰无噪音

项目提供了一个康辉老师的口播示例，整体看起来流畅自然，没有明显的卡顿

github：https://github.com/anliyuan/Ultralight-Digital-Human

小熊猫模型来了：最强生图模型，支持矢量图生成

生图模型竞技场榜一 red_panda 模型今天正式公布——Recraft V3，世界上唯一可以生成长文本图像的模型，而不仅仅是一两个单词，当然手指、手、腿和身体比例也不在话下。在设计上还引入了更多的控制能力，包括指定文本位置和大小，结合其他图片，风格控制等，此外它还提供了一个支持样式一致性和矢量图生成的API。

这个模型并不是开源的，只能在 Recraft Canvas 上使用，不过免费用户每天也能生成 50 次，官方也提供了接口。

OpenAI ChatGPT 上线新 Web 搜索工具

ChatGPT 现在可以根据提示词或手动启动新的搜索功能，当搜索天气、股票、体育、新闻和地图时，用户界面将更加友好。

这一新功能将上线 Web 和全端客户端，并已向 Plus 和 Team 订阅用户推出。新的搜索模型是 GPT-4o 的微调版本，搜索接口直接对接 OpenAI 合作的数据提供方。未来还将推出搜索购物、旅行计划等功能，白嫖用户也不用急，未来几个月内将向所有免费用户开放。

X Grok 推出视觉理解功能

Grok 最近推出了视觉理解功能，用户现在可以上传图片进行对话，但这一功能目前仅限于 X 的 Premium 订阅用户。

Grok 官方发布这个功能就只有两句话，而且还没有看到相关的基准测试。不过，似乎不如 ChatGPT。

智谱 GLM-4.Voice：开源语音模型支持多语言实时对话

GLM-4.Voice 是智谱开源的端到端语音模型，能够直接理解和生成中英文语音，支持实时语音对话，并可根据用户指令调整语音的情感、语调、语速和方言等属性。目前，除了自行部署体验外，用户还可以在智谱的清言 app 中使用，有兴趣的可以尝试一下。

谷歌 Unbounded：AI 驱动的无限角色养成游戏

Unbounded 是由谷歌退出的基于生成式 AI 的角色养成游戏系统，用户可以通过自然语言创建任意角色和环境，并直接与虚拟角色进行互动。每个角色都具备体力、饥饿和心情等属性，它们会像真人一样生活、探索和成长。由于没有固定的剧情和玩法限制，一切都是生成式的，俺猜 R18 领域将会有大突破。

稚晖君开源人形机器人全套图纸+代码

开发指南链接：https://zhiyuan-robot.com/DOCS/OS/X1-PDG

结构设计资料百度云盘：https://pan.baidu.com/share/init?surl=UEdeDBTJiXRmIqMKwmO5RA&pwd=1234

结构设计资料谷歌云盘：https://drive.google.com/drive/folders/1MECbyKRJbnc_XKWsdUbn-70xmYFmw9FW

推理代码：https://github.com/AgibotTech/agibot_x1_infer

训练代码：https://github.com/AgibotTech/agibot_x1_train

相关硬件模块（立创开源平台，陆续上传中）： https://oshwhub.com/pengzhihui/agibot-x1

MaskGCT：一个新的零样本文本到语音（TTS）模型

2025-06-04 15:21:09