Craig Wattrus：面向新 AI 同事的形态设计 (Flatfile)

内容概要

本次演讲探讨了如何为人工智能（AI）设计用户体验（UX），主张超越传统界面，将与 AI 的交互重新想象为与新“同事”的合作。内容涵盖了 Flatfile 公司已实施和正在研究的新颖 UX 模式，例如 AI 光标和前瞻性的聊天范式，并结合了行业中涌现的设计模式。演讲强调，设计师的实践需要扩展到哲学、伦理和编码领域，并通过实际的产品案例和前瞻性的演示，为 AI UX 的未来提供了一个清晰的愿景。

设计工程：为你的新 AI 同事设计形态因子
AI 技术栈的四大类别：不可见、环境感知、嵌入式与对话式
不可见的 AI：个性化演示
环境感知的 AI：分析数据以发现机会
嵌入式的 AI：直接进行数据操作
从“直升机父母”到“角色教练”的转变
“聊天调谐器”工具
感受 AI 这种“材料”
在 AI 设计中找到纹理
拥抱“涌现”
“涌现”案例：合并数据集并生成报告
“涌现”案例：建议人工介入
着眼未来
为数据转换打造的“自动完成”功能

设计工程：为你的新 AI 同事设计形态因子

大家可能都注意到了，像 V0 这样的工具在生成式 UI (generative UI) 方面已经做得相当出色，能够创造出美观的界面。同时，Clawed Code 让我们能够在本地运行更复杂的程序并在此基础上进行构建。我认为，由此带来的趋势是设计师、产品经理和工程师将共同进行创造。我对此感到非常兴奋，因为我一直不喜欢这些角色之间的隔阂。

这种新的合作方式让我们能够摆脱我心目中的模型图 (mock-ups) 和仅能点击的原型 (click-through prototypes)，也无需再反复纠结我们正在构建的东西是否值得投入工程资源。因此，我们是时候该投身其中，亲身感受我们正在使用的“材料”，看看会涌现出什么新的可能性。

AI 技术栈的四大类别：不可见、环境感知、嵌入式与对话式

我先快速介绍一下 Flatfile 的 AI 技术栈。这不是一张官方图表，只是我个人对它的理解。我们的核心业务是数据迁移，如果你需要频繁地在系统间迁移大量数据，就会用到我们的开发者平台。由于我们是一个开发者平台，而大语言模型 (LLM) 又擅长编写代码，这使得我们的平台成为应用 AI 的绝佳场所。

技术栈的底层是我们客户部署在基础设施上的 Flatfile 应用程序。中间层是实时上下文，包括数据和验证结果，例如脏数据中的错误和警告。再往上是我们的 AI 智能体 (agents)、它们拥有的工具以及可以执行的任务。最顶层则是最终呈现给用户的内容。

我将这些交互形式分为四个主要类别：

不可见 (Invisible)：它就像机器中的幽灵，在后台默默工作。
环境感知 (Ambient)：它存在于你的工作空间中，但你并不直接与它互动。
嵌入式 (Inline)：它直接嵌入在你的工作流程中。
对话式 (Conversational)：也就是我们现在热议的各种对话机器人。

不可见的 AI：个性化演示

举一个“不可见” AI 的例子：当你注册 Flatfile 时，系统会在后台获取你的电子邮件地址，找到你所在的公司并进行查询。同时，AI 智能体 (agents) 会自动编写一个 Flatfile 应用程序，为你量身打造一个最适合你使用场景的演示。比如，如果你来自一家人力资源公司，你就会得到一个 HR 场景的演示。在这个过程中，你完全不需要知道 AI 正在幕后为你工作。

环境感知的 AI：分析数据以发现机会

接下来是“环境感知” AI 的一个初步应用。你可以看到，有一个智能体 (agent) 正在后台分析数据。这是我领导的 AI 转型团队开发的一个工具，当它在数据列中发现可以优化的机会时，相应的位置就会弹出闪烁的标记。这就是环境感知。

嵌入式的 AI：直接进行数据操作

“嵌入式” AI 意味着你可以在处理数据的过程中，直接调用 AI 来修复问题。这些智能体 (agents) 会编写代码，并将其应用于当前的数据集。无论你有百万行数据还是五十列字段，这些代码都能极速运行，非常高效。

从“直升机父母”到“角色教练”的转变

最后是大家都很熟悉的“对话式” AI。这是我们的构建模式 (build mode)，一个能编写 Flatfile 应用程序的无代码/低代码 (no-code/low-code) 智能体系统。以前，你可能需要公司里的工程师来构建这些应用，但现在这一切都可以自动完成，非常方便。

我曾听过 Anthropic 公司的 Amanda Askell 与 Lex Fridman 讨论如何塑造 Claude 的“性格”。那一刻，我意识到自己过去的做法有点傻。我总是向工程师反馈我们的智能体 (agents)：“它不应该这么说”、“它不该用这些词”等等。我发现自己完全是按照设计文案的思路在行事，这是一种本能反应。听了那次谈话后，我明白了，我需要从一个试图控制一切的“直升джи helicopter parent）”，转变为一个引导其发展的“角色教练 (character coach)”，去真正构建我期望它拥有的特质。

“聊天调谐器”工具

这是一个我用 V0 构建的早期工具，我称之为“聊天调谐器 (chat tuner)”。虽然它看起来很简单，但这并非重点。它的核心功能是，我可以将我们构建模式 (build mode) 中 AI 协调器的系统提示 (system prompt) 放入其中，然后进行修改。

例如，我可以测试：“如果我让 Claude 表现得更友好、更平衡或更简洁，效果会怎样？对于这个模型来说，‘更谨慎’又意味着什么？” 我展示这个工具的目的是想说明，我们很容易陷入只设计最终产品外观的诱惑中，但现在，我们完全可以先构建一个工具来帮助我们更好地进行设计。

感受 AI 这种“材料”

这引出了我的三个核心主题。第一个是“感受材料 (feeling the material)”。我是一个木工爱好者，所以请原谅我使用物理材料的比喻。如果你要用一种物理材料来设计东西，你必须先去感受它，了解它的特性。过去，我们的设计工作仿佛隔着好几层，比如模型图和原型，我们只能猜测最终效果。

而现在，我们必须亲身去感受 AI 这种“材料”，理解这些模型的工作方式。我新的工作信条是：为这些大语言模型 (LLM) 创造一个能让它们大放异彩的环境。什么样的形态因子 (form factor) 能帮助它们出色地完成任务，保持目标一致，并随着模型的进步而成长？这就是我追求的目标。

我们用 LLM 做的任何事，感觉都像是在把它放进一个盒子里。人们常说 LLM 就像一个“拥有博士学位的实习生”。那么，如果你要把一个博士实习生放进盒子里，这个盒子最好足够好。我们需要在这方面投入精力。

我们曾讨论过，当这个新的 AI 同事“入职”时，我们该给它什么工具？我当时对“光标 (cursors)”这个想法很着迷。如果它只有一个鼠标或触控板会怎么样？于是我创建了一个 V0 演示，把这个想法变成了现实。因为我经常使用设计工具，而不是迁移数据，所以这是我感受这种“材料”的最佳方式。

我创建了一个画布，然后可以向它下达指令。说实话，最初几秒钟我非常兴奋，感觉自己仿佛触摸到了通用人工智能 (AGI) 的边缘。但很快，我就感觉自己像是在让一个 F1 赛车手去开一辆普锐斯，处处受限。它一次只能移动一个物体，限制太大了。

从这次经验中学习后，我们又用 Clawed Code 做了一个 V0 演示，并最终发展成一个新产品。这个产品将我们所有关于数据迁移的经验带给普通消费者，让他们能处理自己的数据。你可以看到，AI 在这个空间中自由操作，它拥有自己的“存在感”，能够同时读取多个文件并向另一个文件写入内容。它不像我，一次只能专注于一件事。这标志着我们正从确定性 (determinism) 走向推理性 (inference)，并在这个过程中不断探索这种新“材料”的真实感受。

在 AI 设计中找到纹理

“感受材料”意味着你需要与模型一起工作，将它融入你的工作空间，理解与它并肩工作的感觉，了解它的能力。然后，你为它设计的形态因子 (form factors) 就可以被实际构建出来，让你去体验和感受。

下一个比喻是“找到纹理 (finding the grain)”。当你了解了材料的特性后，你会发现每一块具体的材料都有其独特的个性。因此，在创造形态因子时，“找到纹理”就是要去感知它的平滑与粗糙，它的强项与弱点。

我们必须保持谦逊，因为技术变化太快，我们今天构建的一切很可能明天就需要重构。比如，之前提到的构建模式 (build mode) 智能体，我让它启用一个可以自动匹配源数据和目标数据映射关系的插件，结果它返回了一大段文字。虽然这为我节省了大概一周的工作量——无需产品经理写需求文档 (PRD)、无需排期、无需工程师开发和测试 (QA)，代码全部自动生成——但这些冗长的信息干扰了用户体验。

于是，我们用 V0 重新思考了工具的用户体验 (Tool UX)。我的思路是，如果你要向一位同事解释一件复杂的事情，你会精心措辞，用视觉化的方式沟通，并且会停下来确认对方是否理解。我希望 AI 的交互也能有类似的感觉。

所以，在新设计中，当 AI 执行“拆分个人信息”这类操作时，它会直观地展示它正在做什么，并询问“这样做对吗？” 接着，它会告知用户：“我已经对齐了数据，并创建了快照，你可以随时回滚。你批准了此项操作，我会记录下来。”最后，它还会提示下一步可以做什么。

我们还希望它能表达情感。如果出错了，它会像人一样“摇摇头”，表现出一点沮丧，这可能也正是用户此刻的感受。最后，当它无法解决问题时，它会主动后退，说：“好的，现在控制权交还给你。” 这种交互感觉好多了，我们仿佛找到了这种“材料”的正确“纹理”和最佳应用方式。

这个设计的妙处在于，在实施过程中，我们发现它不仅适用于对话流程，还能嵌入到其他地方，比如我们的嵌入式数据转换功能中。

拥抱“涌现”

当我们发现并使用一项新技术时，很容易陷入仅仅用它来自动化繁琐任务的误区。我之所以对前两个演讲感到兴奋，是因为它们都提到了某种“涌现 (emergence)”——那些我们以前无法做到的有趣事情。我最期待的正是这些：在探索和“玩耍”中会涌现出什么？

我们已经有好几年没有真正“玩耍”了。互联网刚兴起时，我们很兴奋，CSS3 和 HTML5 的出现让我们玩得不亦乐乎。现在，我觉得我们又重新开始“玩耍”了，这让我非常激动。

“涌现”案例：合并数据集并生成报告

这是一个我“玩耍”的例子。我创建了一个 V0 演示，当时我们正在寻找一种具有“前瞻性 (forward-leaning)”特质的智能体 (agent)。我所说的“前瞻性”是指，这个智能体既有好奇心和热情，又非常务实、专注，喜欢把事情搞定，但又不会做得太过火——我们都见过 LLM 在执行任务时走得太远，那种感觉很不好。

在这个演示中，我上传了一个 JSON 文件和一个 CSV 文件。智能体发现这两个文件的数据看起来很相似，于是它主动决定将它们合并。它不需要我下达指令，自己就识别并完成了这个有益的操作。

完成合并后，它还写了一份报告，说明了它做了什么，并指出：“我发现了一些重复数据，你接下来可能需要处理这些。” 通过这个过程，它自己构建了上下文。其实我当时只是想试试 Claude 4，感受一下这种“材料”，却意外地发现了我们一直在追求的那种特质。

它还提出了一些建议，并按我的要求生成了一份幻灯片。仅仅通过上传两个文件，就涌现出了意想不到的结果。现在，我们正在将这个特性融入我们即将推出的新产品 Obvious 中。

“涌现”案例：建议人工介入

另一个例子是，我们曾想为智能体 (agents) 提供一个知识库，其中包含了我们与客户的所有通话录音和文字记录，以及客户提供的文档。当智能体分析完所有客户数据后，它会根据知识库的内容给出建议。

我原本期待它能提供更好、更多的建议，它也确实做到了。但出乎意料的是，智能体在面对一个它无法解决的问题时，判断出“我虽然修不好，但我知道怎么修”，于是它告诉用户该怎么做。它建议用户去联系人力资源部门 (HR)，让他们生成缺失的员工 ID。

在这里，“涌现”出的是我完全没想到的结果。也许你会觉得这很理所当然，但在当时，我没想到它竟能指导人类去完成它自己无法完成的工作。如果没有这种好奇和探索的心态，我想我永远也发现不了这一点。

着眼未来

最后，我想谈谈“着眼未来 (eyes on the future)”。我们都着眼于未来，因为在这个时代，你别无选择，模型和技术总在不断更新。

为数据转换打造的“自动完成”功能

我喜欢用一个比喻：“你骑在自行车上的鹈鹕是什么？” 意思是你那个看起来有点疯狂但又让你充满激情的想法是什么。我的一个“鹈鹕”就是“自动完成 (autocomplete)”功能。

我对此超级兴奋，虽然用 LLM 来做这件事可能不是个好主意。但我就是想做一个由 LLM 驱动的自动完成功能。比如，在一个演示中，它能为修复数据提供 100 种建议，让不同的方案进行一场“烘焙大赛 (bake-off)”。

至今，我还没找到一个既快又好地解决这个问题的模型。但这已经成为了我个人的一个基准测试，用来感受我们接触到的各种新“材料”。

我现在也会用这种方式来思考我的设计实践：我关心的是什么？我能否为未来而设计，开始构思我想要的形态因子 (form factors)，然后构建一个应用来实际测试它们？

这就是我今天分享的全部内容。我非常期待看到大家利用这些新工具，创造出更多全新的形态因子。谢谢大家。

{{userData.name}}已认证

Craig Wattrus：面向新 AI 同事的形态设计 (Flatfile)

内容概要

目录

设计工程：为你的新 AI 同事设计形态因子

AI 技术栈的四大类别：不可见、环境感知、嵌入式与对话式

不可见的 AI：个性化演示

环境感知的 AI：分析数据以发现机会

嵌入式的 AI：直接进行数据操作

从“直升机父母”到“角色教练”的转变

“聊天调谐器”工具

感受 AI 这种“材料”

在 AI 设计中找到纹理

拥抱“涌现”

“涌现”案例：合并数据集并生成报告

“涌现”案例：建议人工介入

着眼未来

为数据转换打造的“自动完成”功能

2026 年 AI Agent 的未来 | a16z 的三大预测

用 AI 构建生成式网络：Vercel CEO Guillermo Rauch 访谈

实战指南｜手把手教您在 TPU 上免费使用 JAX 训练 GPT-2 模型

本地推理服务

具身导航：感知推理是上帝，还是执行控制是命门？| GAIR Live 023 期预告

E39 孟岩对话重轻：创作过于重要，以至于不能认真对待

从 Prompt Engineering 到 Context Engineering

新瓶旧酒 or 涅槃重生？操作系统的 AI 进化终将走向何方？