声智科技推全球首款“多模态AI时尚耳机”!声视融合,Kickstarter首发开启随身感知新时代

声视融合:用眼睛看,用耳朵说

不同于普通AI耳机仅依赖麦克风阵列,声智此次产品搭载微型视觉传感器与自研多模态大模型,实现“视觉场景验证 + 声学结果交付”的闭环体验:  

- 视觉端:通过轻量级摄像头或环境光感知,识别用户所处场景(如咖啡馆、会议室、街道);  

- 声学端:基于场景智能优化降噪策略、语音唤醒灵敏度及TTS输出音色;  

- 交互闭环:例如在嘈杂街道,耳机识别“户外”后自动增强语音收听清晰度;进入会议室则切换至“静音模式”,仅通过骨传导提示日程。

该设计有效解决纯语音AI在复杂环境中的误触发与响应失准问题,显著提升交互可靠性。

全栈声学底座,软硬一体赋能

产品依托声智科技自研的全栈声学技术体系,涵盖远场语音识别、声源定位、回声消除、个性化声纹建模等核心技术,并集成其多模态大模型推理引擎,可在端侧完成低延迟场景理解,保障用户隐私与响应速度。

时尚设计+全球首发,瞄准高端消费市场

作为“时尚耳机”,产品由国际设计团队操刀,兼顾美学与佩戴舒适性,目标用户为科技爱好者、商务人士与数字游民。选择Kickstarter首发,旨在借力全球早期用户反馈,快速迭代并建立海外品牌认知。

AIbase认为,声智科技此举标志着AI可穿戴设备从“语音助手”向“环境感知智能体”跃迁。当耳机不仅能听指令,还能“看懂”你所处的世界,人机交互的自然性与主动性将实现质的飞跃。而这场由声智掀起的“声视融合”浪潮,或将成为下一代智能硬件的关键入口。

AI 前线

生存还是毁灭?剑桥报告揭秘:半数英国小说家担心被 AI “抢饭碗”

2025-12-29 9:46:09

AI 前线

腾讯混元推出 ETC 领域首款 AI 智能体 助力用户畅行无阻

2025-12-29 9:46:09

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索