科技周刊2025第4期
2025-06-04 15:21:09

这是2025第4期周刊

DeepSeek发布并开源 R1 模型

性能对标 OpenAI o1

正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

DeepSeek开源了DeepSeek-R1 和 DeepSeek-R1-Zero两个模型,660B 参数。 并通过模型蒸馏,开源 6 个小模型,其中 32B 和 70B 模型在多项能力上超越 OpenAI o1-mini。

image-20250124170855885

Google 发布 Gemini 2.0 Flash Thinking 新模型 EXP-01-21

AIME(数学)测试中得分 73.3%,在 GPQA Diamond(科学)测试中得分 74.2%, LLM 竞技场除风格控制外,所有领域(硬件、编码、创造力)均排名第一

image-20250124171004682

具身智能和 AI 智能体论文分享

对具身智能和 AI 智能体研究有兴趣的可以关注这个paper list,里面记录和跟踪了各种具身智能体和在线任务智能体的论文

链接:https://github.com/cheryyunl/awesome-generalist-agents?tab=readme-ov-file

image-20250124172016672

OpenAI 正式推出了其首款 AI 智能体 Operator

OpenAI 表示,“它目前处于研究预览阶段,这意味着它存在局限性,并将根据用户反馈不断变化。Operator 是我们的第一批智能体(Agent)之一,它们是能够独立为你工作的 AI,你给它一个任务,它就会执行。”

Operator 将首先向美国的 ChatGPT Pro 订阅用户推出。OpenAI 表示,它计划最终将此功能推广给其 Plus、Team 和 Enterprise 级别的更多用户群体。作为一项研究预览工作,它目前可通过独立网站访问,OpenAI 表示,希望很快将 Operator 集成到其所有 ChatGPT 应用中。

i

澳网公开赛正在澳大利亚举行,组委会为国际观众准备了 3D 动画直播

它将真实的运动员和比赛场面转成了实时的 3D 动画,配上球场原声和评论,逼真地还原了比赛。

该技术使用12台摄像机追踪29个骨骼点,通过实时计算,在两分钟的延迟内生成动画。

image-20250124172738619

Prev
2025-06-04 15:21:09
Next