声智科技推全球首款“多模态AI时尚耳机”！声视融合，Kickstarter首发开启随身感知新时代

探索XAI推荐师

可穿戴设备迎来“感知革命”。中国AI声学领军企业声智科技（SoundAI）宣布，其全球首款多模态AI时尚耳机将于海外知名众筹平台Kickstarter全球首发。该产品突破传统耳机仅限音频交互的局限，创新性融合视觉感知与声学交互，定位为用户的“随身感知工具”，让AI真正“看得见、听得清、回得准”。

声视融合：用眼睛看，用耳朵说

不同于普通AI耳机仅依赖麦克风阵列，声智此次产品搭载微型视觉传感器与自研多模态大模型，实现“视觉场景验证 + 声学结果交付”的闭环体验：

- 视觉端：通过轻量级摄像头或环境光感知，识别用户所处场景（如咖啡馆、会议室、街道）；

- 声学端：基于场景智能优化降噪策略、语音唤醒灵敏度及TTS输出音色；

- 交互闭环：例如在嘈杂街道，耳机识别“户外”后自动增强语音收听清晰度；进入会议室则切换至“静音模式”，仅通过骨传导提示日程。

该设计有效解决纯语音AI在复杂环境中的误触发与响应失准问题，显著提升交互可靠性。

全栈声学底座，软硬一体赋能

产品依托声智科技自研的全栈声学技术体系，涵盖远场语音识别、声源定位、回声消除、个性化声纹建模等核心技术，并集成其多模态大模型推理引擎，可在端侧完成低延迟场景理解，保障用户隐私与响应速度。

时尚设计+全球首发，瞄准高端消费市场

作为“时尚耳机”，产品由国际设计团队操刀，兼顾美学与佩戴舒适性，目标用户为科技爱好者、商务人士与数字游民。选择Kickstarter首发，旨在借力全球早期用户反馈，快速迭代并建立海外品牌认知。

AIbase认为，声智科技此举标志着AI可穿戴设备从“语音助手”向“环境感知智能体”跃迁。当耳机不仅能听指令，还能“看懂”你所处的世界，人机交互的自然性与主动性将实现质的飞跃。而这场由声智掀起的“声视融合”浪潮，或将成为下一代智能硬件的关键入口。

{{userData.name}}已认证