-
全球 OCR 最强模型仅 0.9B!百度文心衍生模型刚刚横扫 4 项 SOTA
文章详细介绍了百度最新发布的自研多模态文档解析模型 PaddleOCR-VL,该模型 Day 1 就开源。它以仅 0.9B 的参数量,在 OmniDocBench V1.5 榜单上取得了 92.6 分的综合性能全球第一,并在文本识别、公式识别、表格理解、阅读顺序四大核心能力上全面刷新了 SOTA。PaddleOCR-VL 作为文心大模型的衍生产品,专为复杂文档结构解析设计,具备人类级理解能力,能处…- 0
- 0
-
AI 算法开源|Logics-Parsing:攻克 PDF 复杂文档端到端结构化处理
文章详细介绍了阿里巴巴自主研发并开源的 Logics-Parsing 模型,旨在解决传统 OCR 和现有视觉语言模型在处理复杂 PDF 文档(如多栏排版、图文混排、专业公式、手写字)时存在的理解和阅读顺序不足的问题。Logics-Parsing 基于 Qwen2.5-VL 架构,采用“SFT-then-RL”两阶段训练策略,核心创新在于引入了以布局为中心的强化学习(LC-RL),通过精心挖掘标注的…- 0
- 0
文档解析
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!



