DeepSeek发布并开源 R1 模型

性能对标 OpenAI o1

正式版 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

DeepSeek开源了DeepSeek-R1 和 DeepSeek-R1-Zero两个模型，660B 参数。并通过模型蒸馏，开源 6 个小模型，其中 32B 和 70B 模型在多项能力上超越 OpenAI o1-mini。

Google 发布 Gemini 2.0 Flash Thinking 新模型 EXP-01-21

AIME（数学）测试中得分 73.3%，在 GPQA Diamond（科学）测试中得分 74.2%， LLM 竞技场除风格控制外，所有领域（硬件、编码、创造力）均排名第一

支持 100万 token 上下文窗口，增加对原生代码执行的支持
输出 token 生成更长，减少模型矛盾的发生频率
🔗 在线体验：https://aistudio.google.com/prompts/new_chat

具身智能和 AI 智能体论文分享

对具身智能和 AI 智能体研究有兴趣的可以关注这个paper list，里面记录和跟踪了各种具身智能体和在线任务智能体的论文

链接：https://github.com/cheryyunl/awesome-generalist-agents?tab=readme-ov-file

OpenAI 正式推出了其首款 AI 智能体 Operator

OpenAI 表示，“它目前处于研究预览阶段，这意味着它存在局限性，并将根据用户反馈不断变化。Operator 是我们的第一批智能体（Agent）之一，它们是能够独立为你工作的 AI，你给它一个任务，它就会执行。”

Operator 将首先向美国的 ChatGPT Pro 订阅用户推出。OpenAI 表示，它计划最终将此功能推广给其 Plus、Team 和 Enterprise 级别的更多用户群体。作为一项研究预览工作，它目前可通过独立网站访问，OpenAI 表示，希望很快将 Operator 集成到其所有 ChatGPT 应用中。

澳网公开赛正在澳大利亚举行，组委会为国际观众准备了 3D 动画直播

它将真实的运动员和比赛场面转成了实时的 3D 动画，配上球场原声和评论，逼真地还原了比赛。

该技术使用12台摄像机追踪29个骨骼点，通过实时计算，在两分钟的延迟内生成动画。

2025-06-04 15:21:09