内容概要
本次演讲探讨了如何为人工智能(AI)设计用户体验(UX),主张超越传统界面,将与 AI 的交互重新想象为与新“同事”的合作。内容涵盖了 Flatfile 公司已实施和正在研究的新颖 UX 模式,例如 AI 光标和前瞻性的聊天范式,并结合了行业中涌现的设计模式。演讲强调,设计师的实践需要扩展到哲学、伦理和编码领域,并通过实际的产品案例和前瞻性的演示,为 AI UX 的未来提供了一个清晰的愿景。
目录
-
设计工程:为你的新 AI 同事设计形态因子
-
AI 技术栈的四大类别:不可见、环境感知、嵌入式与对话式
-
不可见的 AI:个性化演示
-
环境感知的 AI:分析数据以发现机会
-
嵌入式的 AI:直接进行数据操作
-
从“直升机父母”到“角色教练”的转变
-
“聊天调谐器”工具
-
感受 AI 这种“材料”
-
在 AI 设计中找到纹理
-
拥抱“涌现”
-
“涌现”案例:合并数据集并生成报告
-
“涌现”案例:建议人工介入
-
着眼未来
-
为数据转换打造的“自动完成”功能
设计工程:为你的新 AI 同事设计形态因子
大家可能都注意到了,像 V0 这样的工具在生成式 UI (generative UI) 方面已经做得相当出色,能够创造出美观的界面。同时,Clawed Code 让我们能够在本地运行更复杂的程序并在此基础上进行构建。我认为,由此带来的趋势是设计师、产品经理和工程师将共同进行创造。我对此感到非常兴奋,因为我一直不喜欢这些角色之间的隔阂。
这种新的合作方式让我们能够摆脱我心目中的模型图 (mock-ups) 和仅能点击的原型 (click-through prototypes),也无需再反复纠结我们正在构建的东西是否值得投入工程资源。因此,我们是时候该投身其中,亲身感受我们正在使用的“材料”,看看会涌现出什么新的可能性。
AI 技术栈的四大类别:不可见、环境感知、嵌入式与对话式
我先快速介绍一下 Flatfile 的 AI 技术栈。这不是一张官方图表,只是我个人对它的理解。我们的核心业务是数据迁移,如果你需要频繁地在系统间迁移大量数据,就会用到我们的开发者平台。由于我们是一个开发者平台,而大语言模型 (LLM) 又擅长编写代码,这使得我们的平台成为应用 AI 的绝佳场所。
技术栈的底层是我们客户部署在基础设施上的 Flatfile 应用程序。中间层是实时上下文,包括数据和验证结果,例如脏数据中的错误和警告。再往上是我们的 AI 智能体 (agents)、它们拥有的工具以及可以执行的任务。最顶层则是最终呈现给用户的内容。
我将这些交互形式分为四个主要类别:
-
不可见 (Invisible):它就像机器中的幽灵,在后台默默工作。
-
环境感知 (Ambient):它存在于你的工作空间中,但你并不直接与它互动。
-
嵌入式 (Inline):它直接嵌入在你的工作流程中。
-
对话式 (Conversational):也就是我们现在热议的各种对话机器人。
不可见的 AI:个性化演示
举一个“不可见” AI 的例子:当你注册 Flatfile 时,系统会在后台获取你的电子邮件地址,找到你所在的公司并进行查询。同时,AI 智能体 (agents) 会自动编写一个 Flatfile 应用程序,为你量身打造一个最适合你使用场景的演示。比如,如果你来自一家人力资源公司,你就会得到一个 HR 场景的演示。在这个过程中,你完全不需要知道 AI 正在幕后为你工作。
环境感知的 AI:分析数据以发现机会
接下来是“环境感知” AI 的一个初步应用。你可以看到,有一个智能体 (agent) 正在后台分析数据。这是我领导的 AI 转型团队开发的一个工具,当它在数据列中发现可以优化的机会时,相应的位置就会弹出闪烁的标记。这就是环境感知。
嵌入式的 AI:直接进行数据操作
“嵌入式” AI 意味着你可以在处理数据的过程中,直接调用 AI 来修复问题。这些智能体 (agents) 会编写代码,并将其应用于当前的数据集。无论你有百万行数据还是五十列字段,这些代码都能极速运行,非常高效。
从“直升机父母”到“角色教练”的转变
最后是大家都很熟悉的“对话式” AI。这是我们的构建模式 (build mode),一个能编写 Flatfile 应用程序的无代码/低代码 (no-code/low-code) 智能体系统。以前,你可能需要公司里的工程师来构建这些应用,但现在这一切都可以自动完成,非常方便。
我曾听过 Anthropic 公司的 Amanda Askell 与 Lex Fridman 讨论如何塑造 Claude 的“性格”。那一刻,我意识到自己过去的做法有点傻。我总是向工程师反馈我们的智能体 (agents):“它不应该这么说”、“它不该用这些词”等等。我发现自己完全是按照设计文案的思路在行事,这是一种本能反应。听了那次谈话后,我明白了,我需要从一个试图控制一切的“直升джи helicopter parent)”,转变为一个引导其发展的“角色教练 (character coach)”,去真正构建我期望它拥有的特质。
“聊天调谐器”工具
这是一个我用 V0 构建的早期工具,我称之为“聊天调谐器 (chat tuner)”。虽然它看起来很简单,但这并非重点。它的核心功能是,我可以将我们构建模式 (build mode) 中 AI 协调器的系统提示 (system prompt) 放入其中,然后进行修改。
例如,我可以测试:“如果我让 Claude 表现得更友好、更平衡或更简洁,效果会怎样?对于这个模型来说,‘更谨慎’又意味着什么?” 我展示这个工具的目的是想说明,我们很容易陷入只设计最终产品外观的诱惑中,但现在,我们完全可以先构建一个工具来帮助我们更好地进行设计。
感受 AI 这种“材料”
这引出了我的三个核心主题。第一个是“感受材料 (feeling the material)”。我是一个木工爱好者,所以请原谅我使用物理材料的比喻。如果你要用一种物理材料来设计东西,你必须先去感受它,了解它的特性。过去,我们的设计工作仿佛隔着好几层,比如模型图和原型,我们只能猜测最终效果。
而现在,我们必须亲身去感受 AI 这种“材料”,理解这些模型的工作方式。我新的工作信条是:为这些大语言模型 (LLM) 创造一个能让它们大放异彩的环境。什么样的形态因子 (form factor) 能帮助它们出色地完成任务,保持目标一致,并随着模型的进步而成长?这就是我追求的目标。
我们用 LLM 做的任何事,感觉都像是在把它放进一个盒子里。人们常说 LLM 就像一个“拥有博士学位的实习生”。那么,如果你要把一个博士实习生放进盒子里,这个盒子最好足够好。我们需要在这方面投入精力。
我们曾讨论过,当这个新的 AI 同事“入职”时,我们该给它什么工具?我当时对“光标 (cursors)”这个想法很着迷。如果它只有一个鼠标或触控板会怎么样?于是我创建了一个 V0 演示,把这个想法变成了现实。因为我经常使用设计工具,而不是迁移数据,所以这是我感受这种“材料”的最佳方式。
我创建了一个画布,然后可以向它下达指令。说实话,最初几秒钟我非常兴奋,感觉自己仿佛触摸到了通用人工智能 (AGI) 的边缘。但很快,我就感觉自己像是在让一个 F1 赛车手去开一辆普锐斯,处处受限。它一次只能移动一个物体,限制太大了。
从这次经验中学习后,我们又用 Clawed Code 做了一个 V0 演示,并最终发展成一个新产品。这个产品将我们所有关于数据迁移的经验带给普通消费者,让他们能处理自己的数据。你可以看到,AI 在这个空间中自由操作,它拥有自己的“存在感”,能够同时读取多个文件并向另一个文件写入内容。它不像我,一次只能专注于一件事。这标志着我们正从确定性 (determinism) 走向推理性 (inference),并在这个过程中不断探索这种新“材料”的真实感受。
在 AI 设计中找到纹理
“感受材料”意味着你需要与模型一起工作,将它融入你的工作空间,理解与它并肩工作的感觉,了解它的能力。然后,你为它设计的形态因子 (form factors) 就可以被实际构建出来,让你去体验和感受。
下一个比喻是“找到纹理 (finding the grain)”。当你了解了材料的特性后,你会发现每一块具体的材料都有其独特的个性。因此,在创造形态因子时,“找到纹理”就是要去感知它的平滑与粗糙,它的强项与弱点。
我们必须保持谦逊,因为技术变化太快,我们今天构建的一切很可能明天就需要重构。比如,之前提到的构建模式 (build mode) 智能体,我让它启用一个可以自动匹配源数据和目标数据映射关系的插件,结果它返回了一大段文字。虽然这为我节省了大概一周的工作量——无需产品经理写需求文档 (PRD)、无需排期、无需工程师开发和测试 (QA),代码全部自动生成——但这些冗长的信息干扰了用户体验。
于是,我们用 V0 重新思考了工具的用户体验 (Tool UX)。我的思路是,如果你要向一位同事解释一件复杂的事情,你会精心措辞,用视觉化的方式沟通,并且会停下来确认对方是否理解。我希望 AI 的交互也能有类似的感觉。
所以,在新设计中,当 AI 执行“拆分个人信息”这类操作时,它会直观地展示它正在做什么,并询问“这样做对吗?” 接着,它会告知用户:“我已经对齐了数据,并创建了快照,你可以随时回滚。你批准了此项操作,我会记录下来。”最后,它还会提示下一步可以做什么。
我们还希望它能表达情感。如果出错了,它会像人一样“摇摇头”,表现出一点沮丧,这可能也正是用户此刻的感受。最后,当它无法解决问题时,它会主动后退,说:“好的,现在控制权交还给你。” 这种交互感觉好多了,我们仿佛找到了这种“材料”的正确“纹理”和最佳应用方式。
这个设计的妙处在于,在实施过程中,我们发现它不仅适用于对话流程,还能嵌入到其他地方,比如我们的嵌入式数据转换功能中。
拥抱“涌现”
当我们发现并使用一项新技术时,很容易陷入仅仅用它来自动化繁琐任务的误区。我之所以对前两个演讲感到兴奋,是因为它们都提到了某种“涌现 (emergence)”——那些我们以前无法做到的有趣事情。我最期待的正是这些:在探索和“玩耍”中会涌现出什么?
我们已经有好几年没有真正“玩耍”了。互联网刚兴起时,我们很兴奋,CSS3 和 HTML5 的出现让我们玩得不亦乐乎。现在,我觉得我们又重新开始“玩耍”了,这让我非常激动。
“涌现”案例:合并数据集并生成报告
这是一个我“玩耍”的例子。我创建了一个 V0 演示,当时我们正在寻找一种具有“前瞻性 (forward-leaning)”特质的智能体 (agent)。我所说的“前瞻性”是指,这个智能体既有好奇心和热情,又非常务实、专注,喜欢把事情搞定,但又不会做得太过火——我们都见过 LLM 在执行任务时走得太远,那种感觉很不好。
在这个演示中,我上传了一个 JSON 文件和一个 CSV 文件。智能体发现这两个文件的数据看起来很相似,于是它主动决定将它们合并。它不需要我下达指令,自己就识别并完成了这个有益的操作。
完成合并后,它还写了一份报告,说明了它做了什么,并指出:“我发现了一些重复数据,你接下来可能需要处理这些。” 通过这个过程,它自己构建了上下文。其实我当时只是想试试 Claude 4,感受一下这种“材料”,却意外地发现了我们一直在追求的那种特质。
它还提出了一些建议,并按我的要求生成了一份幻灯片。仅仅通过上传两个文件,就涌现出了意想不到的结果。现在,我们正在将这个特性融入我们即将推出的新产品 Obvious 中。
“涌现”案例:建议人工介入
另一个例子是,我们曾想为智能体 (agents) 提供一个知识库,其中包含了我们与客户的所有通话录音和文字记录,以及客户提供的文档。当智能体分析完所有客户数据后,它会根据知识库的内容给出建议。
我原本期待它能提供更好、更多的建议,它也确实做到了。但出乎意料的是,智能体在面对一个它无法解决的问题时,判断出“我虽然修不好,但我知道怎么修”,于是它告诉用户该怎么做。它建议用户去联系人力资源部门 (HR),让他们生成缺失的员工 ID。
在这里,“涌现”出的是我完全没想到的结果。也许你会觉得这很理所当然,但在当时,我没想到它竟能指导人类去完成它自己无法完成的工作。如果没有这种好奇和探索的心态,我想我永远也发现不了这一点。
着眼未来
最后,我想谈谈“着眼未来 (eyes on the future)”。我们都着眼于未来,因为在这个时代,你别无选择,模型和技术总在不断更新。
为数据转换打造的“自动完成”功能
我喜欢用一个比喻:“你骑在自行车上的鹈鹕是什么?” 意思是你那个看起来有点疯狂但又让你充满激情的想法是什么。我的一个“鹈鹕”就是“自动完成 (autocomplete)”功能。
我对此超级兴奋,虽然用 LLM 来做这件事可能不是个好主意。但我就是想做一个由 LLM 驱动的自动完成功能。比如,在一个演示中,它能为修复数据提供 100 种建议,让不同的方案进行一场“烘焙大赛 (bake-off)”。
至今,我还没找到一个既快又好地解决这个问题的模型。但这已经成为了我个人的一个基准测试,用来感受我们接触到的各种新“材料”。
我现在也会用这种方式来思考我的设计实践:我关心的是什么?我能否为未来而设计,开始构思我想要的形态因子 (form factors),然后构建一个应用来实际测试它们?
这就是我今天分享的全部内容。我非常期待看到大家利用这些新工具,创造出更多全新的形态因子。谢谢大家。
