-
102. 和张祥雨聊,多模态研究的挣扎史和未来两年的 2 个“GPT-4 时刻”
本期播客由李广密对话阶跃星辰首席科学家张祥雨,深度剖析多模态人工智能的十年发展与未来趋势。张祥雨分享了个人在深度学习、模型 scaling 等方面的学术经历,并着重探讨了当前大型语言模型(LLM)在训练中遇到的“怪现象”:通用能力增强的同时,推理(特别是数学)能力反而可能下降。他分析了这与 Next Token Prediction 范式的本质缺陷相关,并介绍了 O 系列模型如何通过引入思维链(C…- 0
- 0
-
Redis 之父 Salvatore Sanfilippo 的年终 AI 反思
文章回顾了 Redis 之父 Salvatore Sanfilippo 在 2025 年末提出的八条 AI 反思。Sanfilippo 作为一位资深程序员,对 AI 的看法兼具技术深度和实用性。他指出,“随机鹦鹉”的说法已不再站得住脚,因为大模型在各种测试中表现出色并形成内部概念表征。他认为“思维链”是一个被低估的突破,它通过内部表征采样和结合强化学习实现了模型自我提升。此外,他指出“可验证奖励”…- 0
- 0
-
上海交大张拳石:思维链只是表象,DeepSeek 凭什么更强 | 智者访谈
本文是对上海交通大学张拳石教授的访谈,重点讨论了 AI 可解释性问题。张教授提出了 “等效与或交互” 的神经网络可解释性理论,旨在通过数学符号化的方式解释深度神经网络的内在表征逻辑。他认为,当前大模型的 “思维链” 只是对人类认知的一种拟合,并非真正的推理机制。张教授强调,需要构建自顶向下的 AI 系统,通过可解释性研究来发现问题,从而提升 AI 的可靠性和安全性。该理论在法律判决和自动驾驶等场景…- 0
- 0
思维链
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!




