这是第二期周刊,每
周五发布!
Vue 的动效 UI 组件库
Vue 的动效 UI 组件库也开始丰富起来了
对标 Magic UI 的 Spark UI https://404.li/spark-ui
对标 Aceternity UI 的 Inspira UI https://404.li/inspira-ui
还有国内开发者的 Stunning UI
https://www.stunningui.design/
用于人形机器人的多功能神经网络全身控制器
英伟达等刚刚推出了用于人形机器人的多功能神经网络全身控制器:HOVER
它首次实现了用统一控制器来处理,像机器人的导航、步行操控和桌面操控等多种不同类型任务,还能模仿人类动作,它模拟一年的训练量,只需50分钟
它可以完成导航行走、物体操作、桌面作业、复杂动作的协调、人机交互任务等
可以无缝切换不同控制模式,支持全身运动模仿学习项目:https://hover-versatile-humanoid.github.io
论文:https://arxiv.org/abs/2410.21229
一款轻量级、能在移动设备上实时运行的数字人模型
一款轻量级、能在移动设备上实时运行的数字人模型:Ultralight-Digital-Human
需要准备一段3到5分钟的视频,视频中的人物需要全程露脸,声音清晰无噪音
项目提供了一个康辉老师的口播示例,整体看起来流畅自然,没有明显的卡顿
github:https://github.com/anliyuan/Ultralight-Digital-Human
小熊猫模型来了:最强生图模型,支持矢量图生成
生图模型竞技场榜一 red_panda 模型今天正式公布——Recraft V3,世界上唯一可以生成长文本图像的模型,而不仅仅是一两个单词,当然手指、手、腿和身体比例也不在话下。在设计上还引入了更多的控制能力,包括指定文本位置和大小,结合其他图片,风格控制等,此外它还提供了一个支持样式一致性和矢量图生成的API。
这个模型并不是开源的,只能在 Recraft Canvas 上使用,不过免费用户每天也能生成 50 次,官方也提供了接口。
OpenAI ChatGPT 上线新 Web 搜索工具
ChatGPT 现在可以根据提示词或手动启动新的搜索功能,当搜索天气、股票、体育、新闻和地图时,用户界面将更加友好。
这一新功能将上线 Web 和全端客户端,并已向 Plus 和 Team 订阅用户推出。新的搜索模型是 GPT-4o 的微调版本,搜索接口直接对接 OpenAI 合作的数据提供方。未来还将推出搜索购物、旅行计划等功能,白嫖用户也不用急,未来几个月内将向所有免费用户开放。
X Grok 推出视觉理解功能

Grok 最近推出了视觉理解功能,用户现在可以上传图片进行对话,但这一功能目前仅限于 X 的 Premium 订阅用户。
Grok 官方发布这个功能就只有两句话,而且还没有看到相关的基准测试。不过,似乎不如 ChatGPT。
智谱 GLM-4.Voice:开源语音模型支持多语言实时对话

GLM-4.Voice 是智谱开源的端到端语音模型,能够直接理解和生成中英文语音,支持实时语音对话,并可根据用户指令调整语音的情感、语调、语速和方言等属性。目前,除了自行部署体验外,用户还可以在智谱的清言 app 中使用,有兴趣的可以尝试一下。
谷歌 Unbounded:AI 驱动的无限角色养成游戏
Unbounded 是由谷歌退出的基于生成式 AI 的角色养成游戏系统,用户可以通过自然语言创建任意角色和环境,并直接与虚拟角色进行互动。 每个角色都具备体力、饥饿和心情等属性,它们会像真人一样生活、探索和成长。由于没有固定的剧情和玩法限制,一切都是生成式的,俺猜 R18 领域将会有大突破。
稚晖君开源人形机器人全套图纸+代码
开发指南链接:https://zhiyuan-robot.com/DOCS/OS/X1-PDG
结构设计资料百度云盘:https://pan.baidu.com/share/init?surl=UEdeDBTJiXRmIqMKwmO5RA&pwd=1234
结构设计资料谷歌云盘:https://drive.google.com/drive/folders/1MECbyKRJbnc_XKWsdUbn-70xmYFmw9FW
推理代码:https://github.com/AgibotTech/agibot_x1_infer
训练代码:https://github.com/AgibotTech/agibot_x1_train
相关硬件模块(立创开源平台,陆续上传中): https://oshwhub.com/pengzhihui/agibot-x1