科技周刊#3
2025-06-04 15:21:09

Rive Animation for Flutter:轻松构建令人惊叹的动画的初学者指南!

Rive 是一款功能强大且用户友好的动画工具和运行时引擎,使开发人员和设计人员能够为各种平台(包括移动应用程序、Web 应用程序和游戏)创建令人惊叹的交互式动画。

Rive 发布 Layouts 新功能
只需设计一次 图像动画会自动适应屏幕大小和各种布局
你设计的菜单和 UI 组件可以根据屏幕尺寸自动调整。
Layouts 可以让图形随屏幕大小缩放、拉伸或重新排列,而不会失去动画效果或流畅性。
Layouts 支持图形在不同设备之间平滑过渡。无需频繁调整,只需一次设计适应各种设备

hertz-dev:斯坦福开源的音频模型

音频端到端基础模型,延迟120ms。

Github:https://github.com/Standard-Intelligence/hertz-dev

官方介绍:https://si.inc/hertz-dev/

Midjourney 图像重纹理模式(retexture)的妙用

image-20241108170521468

通过 Zbrush配合 Midjourney 实现3D建模,直接输出3D纹理和物体细节。 让创意变得更具视觉冲击力。 Midjourney的图像重纹理模式:可以自动估算场景形状并重新定义光照、材料和完善表面细节。 例如,如果图像中有一座山,AI 能够准确地估算出其轮廓、坡度和相对距离。然后通过提示信息进一步细化细节和光照效果。

表格组件

很全能,很强。

https://handsontable.com/docs/react-data-grid/

几乎全框架支持,支持 SSR 服务端渲染。

一个可以从普通视频中还原出人物真实3D动作的项目:GVHMR,还原的动作自然流畅,非常接近现实中真实动作

速度很快,45秒视频0.28秒就能处理完,基本可以实时处理,像运动分析、虚拟试衣等的场景 这是浙大等开源的一个基于重力-视角坐标系的人体运动恢复方法,可以从单目视频中恢复出真实世界坐标系下的人体运动,重点是它能还原出整个运动轨迹 支持批量处理整个文件夹的视频 支持各种人体动作,比如走、跑、跳等,适合处理长视频

github:https://github.com/zju3dv/GVHMR

Claude 视觉助手: 让 AI 为你自动检测和标注图像物体

作者 @skirano开源的项目, 利用 Claude 3.5 Sonnet 的视觉 API 来进行物体检测和可视化的 Python 工具, 现在已经可以做物体坐标检测和标注, 如果再能进一步标记物体轮廓, 就可以取代很多 CV 物体检测模型了。

※ 核心功能 ※

图像处理能力:

  • 可以处理单张图片或整个文件夹的图片
  • 支持 JPEG、PNG、GIF、WebP 等主流格式 检测功能: - 自动检测图片中的物体
  • 为检测到的物体绘制边界框(bounding boxes)
  • 显示置信度分数
  • 为不同物体使用不同的颜色标注

输出处理:

  • 自动创建 output 目录保存处理结果
  • 处理后的图片会添加 “detected_” 前缀

项目地址:https://github.com/Doriandarko/Claude-Vision-Object-Detection

X-Portrait 2:由字节跳动开发 可将任意视频角色的表情和动作转移到任意对象的技术

只需一张你的照片和一个带有表情和动作的视频即可。 还没有进行正式发布!

腾讯混元:开源大语言模型与3D模型生成的新突破

image-20241108165143133

腾讯混元昨天开源了 Hunyuan-Large 大语言模型,超越了包括 DeepSeekv2、LLama3.1-405B 在内的一流开源模型。

此外,腾讯还推出了一个同时支持文生和图生 3D 的模型:腾讯混元-3D,能够重建各类尺度物体。

腾讯旗下的元宝 APP 也进行了能力更新,得益于微信生态的数据,元宝的 AI 搜索能力现在更强了,具备了推理和深度搜索。

Anthropic 发布 Claude 3.5 Haiku:价格与能力双提升

image-20241108163115320

Claude 3.5 Haiku 现已发布,主要改进如下:

  • 在编程和代理任务上超越所有以前的 Claude 模型(除了新的 3.5 Sonnet)
  • 速度提升,长上下文处理能力增强,并新增 prompt 缓存功能
  • 知识库更新至 2024 年 7 月

然而,3.5 不再支持图像输入,有需要的用户还得继续使用 3。此外,3.5 Haiku 的价格也有所上涨,每百万 token 输入 1 美元,输出 5 美元,比起 3 来说贵了不少。

Runway 推出高级运镜功能

Runway为 Gen-3 Alpha Turbo 新增了高级运镜能力,包括移动、绕拍、缩放等,生成的效果非常丝滑。这一功能支持任意角度和速度,操作体验如同操控真实相机,比之前 Luma Dream Machine 1.6 的运镜能力强不少。

Prev
2025-06-04 15:21:09
Next