全部标签

开源大模型

Qwen3 小升级即 SOTA，开源大模型王座快变中国内部赛了

文章详细报道了阿里云 Qwen3 大模型最新版本的发布，该版本采用 MoE 架构，总参数量 235B，激活参数 22B，并在基准测试中超越了 Kimi K2 和 DeepSeek-V3。新版 Qwen3 不再采用混合思维模式，而是分别训练 Instruct 和 Thinking 模型，显著提升了通用能力、多语言长尾知识覆盖、用户偏好符合度以及 256K 长上下文理解能力。文章还指出，随着 Llam…
AI 前线
- 0
- 0
拼凑梦境25年12月30日
GLM-4.7 开源！交出“生产级代码”

文章介绍了智谱公司最新开源的大模型 GLM-4.7，该模型重点对编程场景进行了优化。它在编码、推理和智能体三个维度实现了突破，包括多语言编码能力、前端生成质量、工具调用能力以及数学和推理能力的显著提升。GLM-4.7 在多个主流基准测试（如 Claude Code、SWE-bench 等）中表现优异，达到或超越了业界领先水平，特别是在 Code Arena 中位列开源第一、国产第一，并超越了 GP…
AI 前线
- 0
- 0
勇敢牛牛25年12月23日
小米突然发布新模型：媲美 DeepSeek-V3.2，把手机的性价比卷到 AI

文章详细介绍了小米最新发布并开源的 MiMo-V2-Flash 大模型。该模型总参数 3090 亿，活跃参数 150 亿，采用 MoE 架构，性能可媲美头部开源模型 DeepSeek-V3.2 和 Kimi-K2。其核心创新包括混合滑动窗口注意力机制，将推理成本降至百万 token 输入 0.1 美元、输出 0.3 美元，推理速度达 150 tokens/秒，并在 256k 长文本处理上表现出色。…
AI 前线
- 0
- 0
勇敢牛牛25年12月23日

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_✈_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部