这是2025第4期周刊
DeepSeek发布并开源 R1 模型
性能对标 OpenAI o1
正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
DeepSeek开源了DeepSeek-R1 和 DeepSeek-R1-Zero两个模型,660B 参数。 并通过模型蒸馏,开源 6 个小模型,其中 32B 和 70B 模型在多项能力上超越 OpenAI o1-mini。

Google 发布 Gemini 2.0 Flash Thinking 新模型 EXP-01-21
AIME(数学)测试中得分 73.3%,在 GPQA Diamond(科学)测试中得分 74.2%, LLM 竞技场除风格控制外,所有领域(硬件、编码、创造力)均排名第一
- 支持 100万 token 上下文窗口,增加对原生代码执行的支持
- 输出 token 生成更长,减少模型矛盾的发生频率
- 🔗 在线体验:https://aistudio.google.com/prompts/new_chat

具身智能和 AI 智能体论文分享
对具身智能和 AI 智能体研究有兴趣的可以关注这个paper list,里面记录和跟踪了各种具身智能体和在线任务智能体的论文
链接:https://github.com/cheryyunl/awesome-generalist-agents?tab=readme-ov-file

OpenAI 正式推出了其首款 AI 智能体 Operator
OpenAI 表示,“它目前处于研究预览阶段,这意味着它存在局限性,并将根据用户反馈不断变化。Operator 是我们的第一批智能体(Agent)之一,它们是能够独立为你工作的 AI,你给它一个任务,它就会执行。”
Operator 将首先向美国的 ChatGPT Pro 订阅用户推出。OpenAI 表示,它计划最终将此功能推广给其 Plus、Team 和 Enterprise 级别的更多用户群体。作为一项研究预览工作,它目前可通过独立网站访问,OpenAI 表示,希望很快将 Operator 集成到其所有 ChatGPT 应用中。

澳网公开赛正在澳大利亚举行,组委会为国际观众准备了 3D 动画直播
它将真实的运动员和比赛场面转成了实时的 3D 动画,配上球场原声和评论,逼真地还原了比赛。
该技术使用12台摄像机追踪29个骨骼点,通过实时计算,在两分钟的延迟内生成动画。
