AI 设计Agent-Lovart

官方 Sloga：The world’s first design agent for all design purposes
世界上第一个设计Agent（智能体），适用于所有设计用途

主要特性：

通过自然语言对话，Agent 拆解用户需求。
生成任务计划，调用专业知识库或素材参考。
最后调用顶级图像生成模型如GPT、Flux生成图片。甚至会用一些专业Lora，解决更垂直的风格设计需求。

这款产品，并没有被 AI 对话产品形态束缚住。如点图片后出的各个图片编辑功能，Tab对话修改。

我的例子

生成一套基于中国古代知名戏曲片段的塔罗牌设计。

内容要求

场景选取：从中国古代知名戏曲片段中提取具代表性的场景画面

场景而非人物像：画面需表现完整戏剧场景，而非单个人物肖像

服饰真实性：画面中人物必须穿着对应戏曲的正确服饰

视觉风格呈现以下风格特点：

融合巴洛克戏剧性与抽象流动感,整体呈现黑暗、扭曲、诡异的视觉氛围

运用强烈的阴影对比与复杂细腻的烟雾纹理,营造极具张力与表现力的构图

这里是它给我出的一组图

视频（左边）：生成内容支持二次手工编辑，还将相关的编辑功能放在了一起，能够支持添加文字、形状、路径，这样在一个工具里就能完成最终的内容了

图片（右边）：这是一个盲盒里的公仔，我想制作一个闪卡放在盲盒中，这一招是太极中的云手，这个公仔的名字是臣走兔；为我设计一个适配这个风格的

现阶段还是处于内测阶段，我放几个邀请码供大家体验

链接：https://www.lovart.ai

邀请码（一行一个）：

JFMhEyJ

MCWWq4u

PnQfLME

QpYD7qh

Google Veo 3 发布-视频和声音一起生成

Veo 3具备强大的文本和图像转视频能力，首次实现了视频与音频的同步生成，包括口型同步。
Veo 3能够生成逼真的视频，例如战场士兵、车展视频和ASMR视频，视觉和音频效果都达到了极高的逼真度。
Veo 3在生成复杂动作和场景转换时存在局限性，例如体操类视频和篮球视频的生成效果不佳。

视频1来自官方视频2来自网络（Veo3 已经可以用来做游戏美术的原型参考）

视频3实测（我想要一个像素风人物在沙土满天飞的沙漠中前行的视频，看到一只九色鹿说看快看；场景需要敦煌那样的色彩）

Rick Rubin《The Timeless Art of Vibe Coding》与《道德经》的哲学共鸣

每一章节都有对应；

“道”与“代码”的哲学类比
Rick Rubin 在《The Timeless Art of Vibe Coding》中将《道德经》的“道”与编程中的“代码”巧妙类比，提出真正的代码之美超越具体形式，指向无形的真理。文章引用《道德经》开篇：“道可道，非常道。名可名，非常名。”并改编为：“The code that can be named is not the eternal code. The function that can be defined is not the limitless function.”
无名之妙：完美代码的本质是“无名”，即超越具体功能、类或脚本的抽象理念。

有名之形：具体代码只是“道”的表现形式，程序员应追求背后永恒的和谐与自然。

波士顿动力公司分享了其 Atlas 机器人的感知系统和视觉能力构建方法

Atlas现在能够有效处理遮挡和不确定性。精准的校准确保了精准的手眼协调，从而实现可靠的操控。
波士顿动力公司的人工智能团队解释了他们如何让 Atlas 人形机器人感知世界并与世界互动。
这是一个融合了图像识别、三维几何理解、实时控制、错误恢复、与任务规划的复杂感知-决策系统。

giphy (1)

新一代多模态图像生成与编辑模型：FLUX.1 Kontext

可以实现GPT 4o图像生成和编辑能力

主要特点：

角色一致性：可在多个场景中保持人物或元素的一致性
局部编辑：只编辑图像的特定部分，不影响其他区域
风格参考：可在指定风格下生成新场景
交互速度快：推理速度高达当前主流模型的 8 倍

下面两个图是我让他拿手办效果图做的手绘稿子

pl-kpntext_00001_moent_1749113455 臣走兔

05-29 DeepSeek发布新版R1模型DeepSeek-R1-0528，并公开模型及权重

DeepSeek-R1-0528在数学、编程和逻辑推理方面表现优于前版本，且减少了“幻觉”现象。
DeepSeek-R1-0528参数量高达6850亿，开源但大多数人只能围观，如果「满血版」不进行蒸馏，是肯定无法在消费级硬件上本地运行的。
新版R1在LiveCodeBench上的表现接近OpenAI o3-high。新R1能够解决一些之前被顶级模型，如o3、Gemini 2.5 pro、Claude 4等难住的难题。
DeepSeek R1采用MIT许可证，可用于商业用途。
实测DeepSeek-R1-0528代码能力大幅提升

OpenAI 将企业或者你的内部知识与 ChatGPT 深度融合

Connectors（连接器）：将企业内部知识源（如GitHub、Dropbox、SharePoint等）可以连接至 ChatGPT，实现私域知识的智能检索与分析。
Record Mode（记录模式）：ChatGPT可以自动记录、转录、摘要你会议内容。通过全新的连接器系统，用户可以让 ChatGPT 接入如 Outlook、Google Drive、Gmail 等关键工具，并在权限范围内获取实时上下文信息。对于企业级用户，还支持接入 SharePoint、Dropbox、Box 等服务。

谷歌开源了一套Deep Research应用

使用 React 前端和 LangGraph 驱动的后端代理的全栈应用程序。该代理旨在通过动态生成搜索词、使用 Google 搜索进行网页查询、反思搜索结果以识别知识缺口，并不断优化搜索，直到能够提供包含引文的、支持充分的答案，从而对用户查询进行全面的研究。此应用程序是使用 LangGraph 和 Google Gemini 模型构建研究增强型对话式 AI 的示例。

2025-06-07 12:15:30