全部标签

技术原理

从 o1-mini 到 DeepSeek-R1，万字长文带你读懂推理模型的历史与技术

文章详细梳理了推理模型从 OpenAI 的 o1-mini 到 DeepSeek-R1 的发展历程，并深入探讨了其背后的技术原理。首先介绍了推理模型与标准 LLM 的区别，强调了长思维链在推理过程中的重要作用。接着，文章深入分析了如何通过强化学习训练推理模型，特别是利用可验证奖励进行训练的方法。此外，还探讨了推理时间策略，如思维链和解码技术，以及并行解码和自我优化等方法。文章重点介绍了 DeepS…
AI 前线
- 0
- 0
勇敢牛牛25年12月31日
万字长文｜大语言模型结构化输出（Structured Output）的技术原理和实现

文章全面而深入地探讨了大语言模型（LLM）结构化输出的技术演进、核心方法与未来趋势。首先阐明了结构化输出对于解决 LLM 自由文本的非确定性、幻觉及机器解析难题的根本价值，并将其定位为模型工程与传统软件工程的关键交互接口。随后，文章沿着技术从“软”到“硬”的演进路线，详细介绍了模式引导生成（Prompt 工程）、验证与修复框架（如 Guardrails）、约束解码（包括黑盒 LLM 的 Sketc…
AI 前线
- 0
- 0
勇敢牛牛25年12月31日
一文读懂向量数据库，原理到应用全解析！

文章系统性地介绍了向量数据库的技术原理与应用场景。首先从向量化表示的历史演进切入，详细阐述了文本、图像和音频等不同模态数据的向量化方法及其技术发展脉络，包括 Word2Vec、CLIP 等多模态对齐技术。然后深入分析了向量数据库的核心技术，包括索引构建方法（如 HNSW、IVF-PQ 等）、相似度度量指标以及前后处理流程。文章还对比了 Faiss、Chroma 等主流向量数据库系统的特点与适用场景…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_✈_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部