-
AI 算法开源|Logics-Parsing:攻克 PDF 复杂文档端到端结构化处理
文章详细介绍了阿里巴巴自主研发并开源的 Logics-Parsing 模型,旨在解决传统 OCR 和现有视觉语言模型在处理复杂 PDF 文档(如多栏排版、图文混排、专业公式、手写字)时存在的理解和阅读顺序不足的问题。Logics-Parsing 基于 Qwen2.5-VL 架构,采用“SFT-then-RL”两阶段训练策略,核心创新在于引入了以布局为中心的强化学习(LC-RL),通过精心挖掘标注的…- 0
- 0
-
攻守易形:当开源变成中国主场|赛博月刊 2508
本文作为一份月度技术观察报告,全面回顾了 2025 年 7 月全球人工智能领域的最新进展。在“趋势观察”部分,文章重点指出国产大模型如 K2、GLM-4.5 等在编程、Agent 及多模态能力上已完全不输海外第一梯队,且大量以开源形式发布,凭借开源生态和性价比优势,显著巩固了中国在 AI 竞争中的“主场”地位,宣告中美在语言模型领域进入同等水平竞争。同时,文章也观察到图像、视频、音频领域正向“理解…- 0
- 0
-
杭州领跑 AI 开源!阿里 Qwen 除夕开源视觉理解新旗舰,全系列 3 尺寸,7B 模型超 GPT-4o-mini
文章介绍了阿里巴巴通义千问团队最新开源的旗舰视觉语言模型 Qwen2.5-VL,包含 3B、7B 和 72B 三个尺寸版本。Qwen2.5-VL 在多项基准测试中表现出色,尤其在视觉定位、通用图像识别、文档解析(QwenVL HTML 格式)、视觉 Agent 操作、视频理解和 OCR 识别等六个关键能力上获得显著提升。评测数据显示,Qwen2.5-VL-7B-Instruct 在视觉定位和图像识…- 0
- 0
AI开源
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


