文章详细评测了 Kimi 最新发布的 K2.5 模型在“Vibe Coding”(氛围编程)领域的实战表现。作者通过复刻《星露谷物语》风格网页、构建 JARVIS 交互系统、开发音频可视化工具以及设计高质感品牌落地页等多个维度,验证了 Kimi 在原生多模态理解、Agent 协作、全栈代码生成与部署方面的能力。文章重点强调了 Kimi 在审美设计上的突破,认为其能够精准理解复杂的视觉风格并将其转化为高质量的前端代码,极大地缩短了从创意到落地的距离,降低了非专业开发者的技术门槛。
原创 阿真 2026-01-30 19:33 广东

持续进步的上进小K正在接受严苛考官的刁钻考验🐶
嗨大家好!我是阿真!
Kimi 前两天发布并开源了最新的 K2.5 模型,简单说,这个模型最大的变化是:原生多模态能力安排上了,可以直接贴图、贴视频、甚至贴网站链接,让它去参考去做,加上视觉深度理解了,一眼能看懂你想干啥。而且还有一个Agent智能体集群,一次调动几十个专家来帮你一起干活。

外加,这个视觉设计+代码实现能力(简单来说就是审美能力),还登顶了全球榜单 Design Arena ,和 Gemini 的并列第一...
那今天我必须要检测检测了。
就来看看 kimi 在vibe coding 方面前端视觉理解 ,看看它到底能不能一帧帧“看懂”我上传的参考,并交付出全新的效果。所以我当时看了一泽用Kimi做的网页后,也来直接给Kimi上难度,1:1 复刻一个属于我自己的星露谷物语游戏!
而且还要春天和冬天两个季节两版,上传参考视频就直接让它干🤔
Let's Coding ! 上链接:
请你搜索星露谷的设计风格,然后根据两个视频内容,帮我制作星露谷游戏。
有一说一,我感觉就我这个大白话 + 极简风提示词,原来只有人类游戏设计师才能理解吧哈哈哈。(不对,可能对方做的第一件事是打我)
突然回想起了作为 ai 老玩家,我之前 vibe coding 出来的那些烂效果,以前都不好意思拿出来,给大家来个对比。这个紫这个渐变和 emoji 都是老三样了,默认设定了一样,十次有八九次是这些风格,交互和图片也不用说了,主打一个几乎没有👇
但 Kimi 出来的效果明显不一样,视觉完成度真的高,而且很多是一次输出后效果就很好,给网页加的交互也很好。这里我放一个沉浸式交互的网页,大家看看效果。很丝滑很流畅👇
它不光是做了一个静态页面,交互逻辑也写进去了。球体展开的时候就像进入到这个 3d 世界的内部去观看一样, 完全是我想要的效果~!鼠标移动时球体会跟随轻微旋转,悬停时自转会暂停,有真实的空间感。这种 3D 效果以前要自己写代码还挺麻烦的,现在和 Kimi 描述这个需求,它就能帮忙实现。
从“我想要”到“我做到”的距离,正在被 Kimi 大幅缩短。
落地页也是有始有终效果很不错,本人喜欢的小清新风格完成度也很高!
上面的链接:
https://x7wmlkgzog3jo.ok.kimi.link
https://w7oqh5wbtiddk.ok.kimi.link/
还有一些案例我待会儿单独讲。
简单来说,Kimi 的 Vibe Coding 现在是钮祜禄版本了,它整合了多个重要能力。
首先是全栈构建,它会自己规划任务,自己写代码,自己部署上线,完全从0到1把东西做出来。
其次是图像生成,视觉上面的冲击感首先就是AI生图带来的,这次 Kimi 直接自己把图生成好了,什么地方配什么图,效果很好。而且它加上了深度视觉理解, 如果觉得自己生的图不吻合你要求呢,他就会用搜索来替代生成。我说原来ai怎么做的那么差,可能就是没有更好的视觉理解,完全只顾着对照“提示词”的最表面意思来干活。
而这些能力组合起来之后,我们只要给它一个想法,它会先自己去看参考、再去网上查资料比对理解我要什么,自己规划怎么做,自己设计界面。最后写好代码还能直接部署上线,做好了拿给谁炫耀都很方便。制作的整个过程,发完要求我们啥也不干,等它一鼓作气干完就行。
纯国产自研的 Agent ,畅通无阻,丝滑上号!
使用方法
打开 Kimi 网页端,点击对话框里的 Agent 按钮,接下来就直接在对话框里描述想做什么就可以了👇
接下来直接看我几个灵感迸发的尝试。
1. 声音的旅程
人抽象了果然什么都能做出来,比如说这个,我直接发起音攻。别笑,你笑你也过不了第二关🐶👇
这个游戏的核心就是把麦克风变成了采集器。它的后台跑着一套复杂的频谱分析算法,能把你的每一声咳嗽、每一段音乐都拆成频率数据,直接指挥像素世界里的草长莺飞。
这是一个音频可视化的小网页,这个直接提示词文字输出忘了放参考图了嘿。简单说就是,只要我对着麦克风发出声音,屏幕上就会跟着产生各种动态的光影效果。打开网页后,它会请求麦克风权限,点允许就行。然后就可以对着它说话、唱歌,或者直接外放音乐,画面就会随着声音的节奏和高低起伏变化。低音重的时候可能是一种效果,高音尖的时候又是另一种感觉,整体看起来像是跟着声音去旅行
纯粹是个好玩的东西,这个也没做调整,就是Kimi一键直出的效果。
2. JARVIS交互系统
交互效果网页,谁能拒绝贾维斯哈哈哈。这个案例是难度最高的:我让它做一个钢铁侠 JARVIS 风格的交互效果网页。
给 Kimi 上强度哈哈哈👇,做出来感觉就是从美剧变成了很上头的游戏👇
链接:https://www.kimi.com/share/19bfed3b-7342-8d63-8000-0000c02e6a19
我想做一个 Iron Man 里 JARVIS 的交互效果网页,你可以去搜索 JARVIS 在电影里的效果是什么样子的。我想要实现 HUD 视觉 + 实时手势控制 + 声音唤醒 + 卫星地图 + 天气扫描,全部做成「浏览器可直接运行的 HUD 系统」。具体要求:实时摄像头 + 实时 HUD 画面(球形色透镜)、手势追踪(握合拍/手势模拟地图)、语音指令("enhance image","go to Tokyo")、卫星地图切换 + 仿全息扫描
它调用了手势识别,摄像头捕捉到我们的手部动作后,可以用手势来控制界面上的元素。
语音唤醒也做进去了,说“ go to Tokyo ”可以切换地图显示东京的位置,说“enhance image”可以触发图像增强效果。整体 HUD 的视觉风格还原度挺高的。全息感、扫描线动画、数据面板、雷达图这些元素都有。界面分了好几个功能区:左边是实时摄像头画面叠加 HUD 滤镜,右边是手势追踪的可视化,下方是地图和天气模块。
当然没到电影里 JARVIS 那个夸张程度,毕竟那是好莱坞特效。但作为一个在浏览器里就能跑的 demo,这个完成度已经超出我预期了。
3. 品牌网站
然后我想尝试一个设计方向的案例。想试试它能不能做出一些质感特别高级的网站,不是那种模板感很重的,是做出那种品牌调性的、有设计感的。
下面这就是通过1张参考图+1轮直出的效果👇
根据我这个风格,复刻并扩展一个高级黑白风网页设计的网站。整体采用严格的瑞士网格系统,高密度信息排布与模块化区块结构。网站划分为活动介绍、设计理念、议程时间线、嘉宾信息,网站内容由你自行生成,页面语言为英文。
继续,再换一个风格:我让它参考油画作品,设计一个珠宝品牌页面。
看到这个油画首图的时候我狠狠心动了,尤其它还自己加了一束光,可以说是很有氛围感了。看看完整页面👇
用这张图来参考,给高端珠宝品牌设计一个故事型落地页。整体走文艺复兴油画路线:纯黑背景,单束光打在珠宝上像祭坛上的圣物,丝绒衬布的褶皱若隐若现。文字用古典衬线体,叙事节奏慢,留足呼吸感。
整体是油画的效果。另外,产品展示区的排版很细节很干净,就像我提示词中要求的一样, 是光打在珠宝上像圣物、丝绒衬布 + 褶皱也做出来了,整整齐齐也没有过度堆砌。
这里的图片也全都是它自行生成的。字体选择也不错,衬线体配合大量留白,高级感出来了,很舒适的观感,这个审美水平放在一众 AI 里确实算Top的那一档了。
以前觉得遥不可及的东西,现在只要描述清楚需求就能看到雏形,这种感觉真的很奇妙。
一些小经验
1. 提示词可以写详细,简单提示描述清晰也可以。它的理解能力不错,但我们描述得越清楚,出来的效果肯定是越接近预期。可以写风格要求、功能要求、参考案例这些。也可以在制作之前先和 Kimi 对话确认还有哪些不足或者需要补充道需求里一次说完的。
2. 有参考图、参考视频效果会更好。可以多找一些自己喜欢的风格的素材作为参考图给到 Kimi ,它的理解和还原能力很强。
3. 善用它的搜索能力。不要忘了 Kimi 自带的这种深度搜索的能力。比如让它先搜索某个风格、某个产品的特点,再基于搜索结果来设计,效果会更好。像星露谷那个案例,我让它先搜再做,出来的还原度就很高。
4. 复杂项目可以分步来。如果项目比较复杂,建议可以先让它做整体规划,确认方向没问题了再继续,避免做完发现方向不对要重来,浪费时间。
5. 这里所有文件都可以在线修改+下载。有一些小细节不满意可以直接在网页上圈选出来发给 Kimi ,让它局部去做细节修改, 还能保持整体的效果不变。
小结
整体来说,Kimi 这次的升级我觉得挺值得一试。尤其是审美这块,没想到我曾经最宠爱的 Gemini 老师已遇到对手……
说几点我觉得很好的地方:
1. 审美很在线。这是我最惊喜的一点。以前 AI 做网页,配色、排版、总感觉AI味好重。Kimi 这次出来的效果,视觉完成度明显更高更细腻,不需要再去大改。
2. 全流程体验顺畅。描述完需求,Kimi自己规划、搜索、设计、写代码、部署,整个流程一气呵成。中间可以看到它的思考过程,知道它在干什么。
3. 复杂交互也能实现。像 JARVIS 那个案例,涉及到摄像头、手势识别、语音控制这些,以前自己想实现一个两个都挺不容易,要都实现更难。现在描述清楚需求,它可以搞定大部分工作。
不过,还是需要微调的。实打实说,也不是每次都能一步到位,有时候临时想修改或者补充些细节可能要再沟通几轮。
如果大家之前想 Vibe Coding 但被各种门槛劝退过,现在可以去 Kimi 试试。不用折腾,国内直接能用,就这样想做什么做什么,用自然语言做网站、做游戏的感觉。工具在持续进化,我们的想象力才是真正的天花板了。
好了,今天的分享就到这里啦,如果大家有什么有趣的案例和想法分享,欢迎评论区一起交流讨论,也期待大家猛猛三连鼓励阿真~
下期见喽!

