全部标签

数字人技术

AI「视觉图灵」时代来了！字节 OmniHuman，一张图配上音频，就能直接生成视频

文章介绍了字节跳动数字人团队推出的 OmniHuman 技术方案，该方案基于单张图片和音频生成高质量的人像动画视频。OmniHuman 采用多模态混合训练策略（Omni-Conditions Training），结合扩散 Transformer 架构，能够处理不同人物占比、图片尺寸及风格的输入，并生成自然度高、动作匹配精准的视频内容。相比现有方法，OmniHuman 解决了高质量数据稀缺的问题，克…
AI 前线
- 0
- 0
勇敢牛牛25年12月31日
淘宝直播数字人：形象技术

文章详细介绍了淘宝直播数字人形象技术的实践与优化过程。首先分析了电商数字人行业的现状和挑战，指出现有方案依赖高质量素材录制，难以规模化。随后提出了一套自动化链路解决方案，通过简化用户素材录制要求、自动化审核、轻量化模型训练与推理等技术手段，将开播时间从数天缩短至 6 小时内。文章展示了多项技术突破：通用唇驱技术使单数字人生产周期从 1 周缩减到 1 小时；轻量化模型计算量下降 90%，在 4070…
AI 前线
- 0
- 0
勇敢牛牛25年12月23日
从「对口型」到「会表演」，刚进化的可灵 AI 数字人，技术公开了｜机器之心

文章详细介绍了快手可灵团队最新发布的数字人技术 Kling-Avatar，该技术旨在将数字人从简单的语音对口型提升到能够根据用户意图进行生动表演的水平。Kling-Avatar 的核心是一个由多模态大语言模型赋能的两阶段生成框架。首先，一个多模态导演模块（MLLM Director）将音频、图像和文本提示整合为结构化的故事线，生成一段全局一致的蓝图视频。其次，基于蓝图视频的关键帧，系统采用并行合成…
AI 前线
- 2
- 0
勇敢牛牛25年12月23日

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_✈_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部