文章详细评测了 Kimi K2.5 模型及其 Agent 能力在日常办公领域的实际表现。通过四个核心场景的实测:Excel 方面,Kimi 能理解复杂的股权结构逻辑并利用 Python 自动生成带公式的专业报表;Word 方面,它展现了法务助理级的素质,能精准对比法规变动并直接在合同中添加修订批注;PPT 方面,Kimi 实现了从文案调研到视觉排版的自动化,生成可编辑且具审美价值的演示文稿;PDF 方面,通过“先拆解再重印”的思路解决了复杂版式翻译难题。作者认为,Kimi 的进化标志着 AI 从“动嘴”转向“动手”,将人类从繁琐的工具操作中解放,转向更高维度的定义问题与判断决策。

Kimi K2.5 模型发布,关键升级就是将 Kimi Agent 能力扩展到日常办公领域,帮助用户直接交付准专业水平的办公文档。
在过去两年的 AI 热潮中,我们见证了无数大模型在对话框里展示才华,它们能写诗、能编程,甚至能通过图灵测试。然而,对于绝大多数伏案工作的知识劳动者而言,这种智能往往止步于 AI 聊天窗口里那个闪烁的光标。
是的,我可以在聊天框里获得一个不错的灵感、一段精彩的分析,但老板、客户、合作伙伴需要的,终究是一份格式严谨的文档、一张逻辑自洽的表格、一组设计精美的幻灯片。当我关掉对话窗口,面对依然是一片空白、哪怕只是微调字体也需要数次点击的 Office 界面时,一种断裂感便会油然而生。
这也正是当前 AI 办公应用的痛点所在:大多数 AI 仍停留在「动嘴」的阶段,而未能真正「动手」,进入职场人的工作流。
而昨天,Kimi 发布了 K2.5 模型,其中一项关键的升级,就是将 Kimi Agent 能力扩展到日常办公领域,开始掌握操作 Word、Excel、PPT、PDF 等常用办公文件格式的中高阶技能,帮助用户直接交付准专业水平的办公文档。

为了验证这次更新的含金量,我们在过去的一周里,将原本需要人工处理的大量真实办公需求抛给了 Kimi。它到底能不能让普通的职场人在面对繁杂的文档工作时,真的像拥有了一位专家坐镇?看完下面的测试,或许你就能获得想要的答案。
▍Excel 实测:超越填数,交付逻辑
在办公软件技能「天梯」的顶端,Excel 常常让人生畏。除了繁杂的数据录入,Excel 公式的编写和套用也是颇费时间和精力的难点。Kimi 在这方面的表现,也是我们此次测试的重头戏。
为此,我们构想了一个创投圈的经典场景:A 轮融资的股权结构表(cap table)测算。我们切换到 Agent 模式,向 Kimi 描述了天使轮的股权结构和 A 轮融资信息,要求制作包含公式、样式专业的 cap table。
几秒有趣的「开机动画」后,Kimi 背后的云端电脑便开始运行。

它的思路很清晰,先列出了一份待办清单:分析股权结构和融资条款、确定计算逻辑、设计表格结构、创建包含公式的 Excel 文件、验证正确性并交付。然后,它说明将会使用 Python 和 openpyxl 库来创建 Excel 文件。

紧接着,Kimi 进入了代码执行阶段。其实看到运行过程中的 Python 代码块,我们对效果就已经大致上放心了,因为它充分表明 Kimi 并不是先算好数据再填到表里,而是真正理解了计算逻辑,再用公式构建出来。

片刻之后,一个名为「A+轮融资 Captable 测算表.xlsx」的文件出现在了对话框中。下载并打开这份文件,第一眼的感觉是「专业」。不仅配色呈现出标准的商业报表风格,而且主动采用了中英双语表头,并将表格分为「融资基本信息」、「当前股权结构」和「融资后股权结构」三个清晰的区块。在表格底部,它专门开辟了一个「关键计算公式」区域,用文字解释了「投后估值 = 投前估值 + 融资金额」等计算逻辑。

点击股份数、每股价格、持股比例等单元格,可以看到其填写的都是标准的公式。因此,只要我们尝试修改估值条件,比如调整融资金额,这些数字都会相应地准确更新。
对于那些苦于记不住 VLOOKUP 函数或复杂嵌套公式的用户来说,Kimi 的这项新能力无异于是一种平权赋能,让任何有数据分析需求的人,都能用自然语言驾驭 Excel 强大逻辑功能。
▍Word 实测:从生成到审阅
在 Word 的进阶使用场景中,单纯的写作其实只占很小一部分,更多的高频痛点集中在文档的审阅、比对和合规性检查上。例如,对于律师、法务或行政人员来说,在一份长达百页的文档中寻找细微的改动,或者对一份合同排查风险,往往意味着通宵达旦的枯燥劳动。
例如,作为一个快速发展的领域,AI 相关政策是许多互联网从业者关注的话题。监管部门出台的政策往往「字字珠玑」,从征求意见稿到正式版,哪怕是几个字眼的变化,都体现着特定的政策导向,影响行业实践。在过去,这方面的专业解读往往依赖律所的专业文章,而在 Kimi 新能力的帮助下,任何人都可以随时获得一份专业的新规分析。
为了测试,我们将前不久正式出台的《人工智能生成合成内容标识办法》,连同其最初征求意见的版本输入给 Kimi,要求它识别出具体的条款变动,并分析这些变动对企业合规的影响。
从工作过程可以看到,Kimi 在分析文档结构的基础上,用 Python 编写了一段针对法规格式定制的代码,逐条提取并对比两个文档中的对应条款,将结果存储在字典结构中。然后,再对这些结构化的数据做分析和排版。

最终交付的「对比分析报告.docx」是一份结构严谨的文档,包含详细条款对比、条款对比总结、关键调整分析、对企业合规的整体影响及建议等几个层次清晰的部分。

细看对比内容,Kimi 不仅列出了「征求意见稿」与「正式版」的左右对照,还精准地捕捉到了语义层面的微小但关键的变化。例如,在第六条的对比中,它敏锐地注意到 AI 内容标识的提示对象从「用户」修改为了「公众」,进而指出「标识的目标受众从特定用户扩大到不特定的公众,要求标识更加显著和易于理解」,然后建议「企业在设计标识时,应考虑普通公众的理解能力,使用简洁明了的语言和符号,确保标识的显著性和易理解性。」这已经具备了法务助理的专业水准。
既然 Kimi 能读懂法规,那它能在法律实务中帮我们「避坑」吗?为了测试这一点,我们给了它一个更具挑战性的任务:最近,少数派正在和出版社签署协议,将一份付费教程以纸质方式出版。这当然是件好事,但考虑到出版社的标准合同一般不会兼顾到线上版,我们需要保证合同条款里允许我们继续线上发行这份教程。
于是,我们将出版社发来的模板合同交给 Kimi,让它关注相关条款,通过批注表达我们的诉求,并提议修订。
Kimi 的操作再次展示了 agent 的执行力。首先,它通过关键词检索,快速定位到了合同中与授权有关的条款,关注到其中可能影响我们继续发行线上教程的限制。随后,它通过 python-docx 库的 doc.add_comment 方法,将批注标记和详细修订建议写入到文件中。

下载生成的「出版合同_带批注版.docx」,效果非常直观,几乎是一份完全可以直接对接出版社法务的修订稿。可以看到,Kimi 不仅指出了目前部分条款与我们诉求存在的差异,分别提议了严谨的替代条款,而且在批注中附带了结构清晰的修订理由,从条款上界定了「纸质图书出版」与「在线版本」的边界。

这种将模糊的诉求转化为精确的合同条款,并直接缝合进文档批注流的能力,让 Kimi 真正成为了一个可以并肩作战的法律助手,将用户从反复的比对与修改中解放出来,专注于权益的讨论本身。
▍PowerPoint 实测:从文案搬运到视觉叙事
如果说 Excel 考验的是逻辑,Word 考验的是严谨,那么 PPT 则是对审美和叙事能力的双重挑战。制作 PPT 的痛苦之处在于,即使你手握详实的数据和精彩的观点,要将它们转化为视觉上美观、逻辑上通顺的幻灯片,依然需要耗费大量的时间在排版、配色和找图上。大多数 AI 工具在这个环节往往只能做到「把字填进模板」,而无法理解内容与其形式之间的深层联系。
为了测试 Kimi 是否能胜任「幻灯片设计师」的角色,我们交给了它一项少数派最近经常需要做的演示任务:向来办公室探访的朋友介绍我们的「共创模式」,也就是以少数派为平台,连接软硬件创造者和用户,共同打造创意产品。我们的输入非常简单,直接丢给它一个介绍该模式的官网链接以及部分的文字描述。
面对这个任务,Kimi 并没有立即开始生成页面,而是先像人类员工一样去「调研」。在运行日志中,我们看到它启动了浏览器,抓取了页面上的关键信息。随后,它开始思考视觉设计,主动提出采用深邃的暗色背景搭配科技感字体,以契合「共创」的未来感与协作精神。这种对色彩心理学的运用,显示出 Kimi 不仅是在排版,而且在主动思考品牌表达。

几分钟后,Kimi 交付了最终的 PPT 文件。打开文档的那一刻,就感到很强的视觉冲击力。原本零散的文字被重组为清晰的信息卡片。例如,在介绍「用户如何参与共创」的页面,Kimi 没有堆砌我们提供的描述文字,而是将「概念验证」「原型展示」、「试产众筹」「量产预售」这四个阶段,做了结构化的提炼和梳理。每个卡片中,不仅有简明的标题,还自动提炼了该阶段的核心价值(如「筛选最具市场潜力的创意」),逻辑流向一目了然。

而在展示「GameBaby 游戏手机壳」这个成功案例时,Kimi 在左侧展示产品的视觉形象,右侧则将「无需蓝牙」「物理按键」等核心卖点列为清单,并在下方用醒目的数字卡片展示了「228 位共创派友」「7000+ 兼容游戏」等两点信息。整个页面既保留了科技产品的硬核参数,又不失商业演示的精致感。

最重要的是,这是一份完全可编辑的 PPT 文档,所有的图文排版都是基于 PowerPoint 原生功能构建的,这意味着我们可以随时根据新的数据迭代。对于一份需要在几个小时内快速用上的演示文档来说,Kimi 所交付的质量已经超出合格线,只要略微调整就能使用。如果你也有和我们类似的需求,应该会很高兴终于能从「对齐像素」的苦海中脱身,真正专注于故事的讲述。
▍PDF 实测:破解「打印版」的编辑难题
完成了对 Office 三剑客的测试后,我们最后将目光投向了职场中最封闭、最难以编辑的格式——PDF。在日常工作中,PDF 往往被视为一种「最终格式」,一旦生成就难以改动。不巧的是,许多技术文档和专业教程都是 PDF 格式,而一般的翻译软件很难正确识别 PDF 页面中的代码和公式等复杂版式,导致翻译不全,阅读体验极差。
为了测试 Kimi 处理这种高难度格式的能力,我们从经典的计算机教材 Operating Systems: Three Easy Pieces (OSTEP) 中选择了关于「地址空间」的一个章节,要求 Kimi 将其翻译成中文版,同时保留其中的代码和原始版式。
Kimi 的处理过程让我们看到了 agentic 模式与传统翻译工具的本质区别。通过运行时的输出,我们发现它并没有试图在原 PDF 上「涂改」,而是先解析 PDF 内容,重构为一个中间态的 HTML 文件,利用 Paged.js 这样的排版引擎重新定义了页面布局,最后再通过无头浏览器生成全新的 PDF。这种「先拆解、再重印」的思路,从根本上规避了格式错乱的问题。
最终交付的中文版 PDF 很好地复刻了原书的「神韵」。在原文中,有一段关于打印内存地址的 C 语言代码。在 Kimi 生成的中文版中,这段代码被原封不动地保留了下来,依然使用等宽字体显示,连代码块的灰色背景都大致还原了与原文效果。

此外,原书中正文之间的灰色小框也得到了精准还原。Kimi 识别出了这是一个独立的版块,并将其正确地放置在了对应段落之间。

这种对文档结构(而非仅仅是文字内容)的理解能力,对于科研人员和技术工作者来说意义重大。有了 Kimi 的帮助,那些只有英文原版的硬核技术文档终于可以无缝转为中文版,而无需忍受混乱的格式。
▍结语
回顾这四个维度的实测,我们很欣慰地发现,基于 K2.5 模型的 Kimi Agent,确实已经进化为一个能直接交付可用文档的 Office 专家,为办公用户进一步消除了「想法」与「成品」之间的操作壁垒。与颇具竞争力的基础模型能力结合,可以不夸张地说,它已经能在某种程度上扮演各种专业领域资深的顾问,为你处理那些最枯燥、最耗时的专业工作,并交付直接可用的成品。
在过去,Office 套件的学习曲线是陡峭的。为了让表格动起来,我们需要学习 VLOOKUP 和数据透视表;为了让文档看起来规范,我们需要掌握样式和修订模式;为了让演示文稿不至于太丑,我们需要学习配色原理和排版构图。在很长一段时间里,这些技能被视为职场的核心竞争力。
然而,这些都是工具性的技能,它们是手段而非目的。真正的技能,应该是财务分析背后的商业洞察,是合同条款背后的权益博弈,是演示文稿背后的说服逻辑。
因此,Kimi 此次更新的一大启示意义在于,它用实际效果表明:这些「繁文缛节」的操作,完全可以交给 AI 来做。未来,「精通 Office」不应再是一个写在简历上的加分项,而变成一种不需要人类去刻意习得的基础设施。
Kimi 对于 Office 场景的深度参与,或许只是一个开始。过去,我们的工作流是「思考—操作—交付」,其中「操作」占据了大量时间。未来,随着以 Kimi 为代表的 agentic(智能体)工具的成熟,我们的工作流将转变为「思考—指令—审核」。AI 接管了鼠标,成为不知疲倦、精通格式的执行者,而人类则回归到了知识工作的本质——定义问题与做出判断。
这种变化,对于知识工作者来说,无疑是一种巨大的解放。我们终于可以从容地说一声:「剩下的交给你了。」而它交付给我们的,将不再仅仅是一句回答,而是一份完美的工作成果。这,或许才是 AI 时代办公应有的样子。

