-
Gemma 3 270M:一款超高效 AI 紧凑模型
本文宣布推出 Gemma 3 270M,这是谷歌 Gemma 系列中的一款新型 2.7 亿参数模型,专为高效且特定领域的 AI 应用而设计。其关键特性包括:具有大词汇量的紧凑架构、极高的能源效率(例如,在 Pixel 9 Pro 上进行 25 次对话仅使用 0.75% 的电池)、强大的指令遵循能力,以及可用于生产的 INT4 感知量化训练 (QAT) 检查点。其核心理念是提倡使用“合适的工具来完成…- 0
- 0
-
Gemma 3 270M:小身材,大能量,打造超高效 AI
本文介绍了 Gemma 3 270M,这是 Google Gemma 系列中的一款新型紧凑型模型,专为超高效、特定任务的微调而设计。它具有 2.7 亿个参数和 256K tokens 的大词汇表,提升了模型对特定领域和语言的适应性。一个显著的优势是其极高的能源效率,在 Pixel 9 Pro SoC 上的内部测试中,电池消耗极低。该模型还具备出色的指令遵循能力,并附带可用于生产的量化感知训练 (Q…- 0
- 0
-
Gemma 3:新特性解析
这篇来自谷歌开发者博客的文章详细介绍了 Gemma 3 的新特性和架构改进。关键增强在于引入视觉语言能力,模型可通过自定义的 SigLIP 视觉编码器解读视觉信息。架构经过修改,通过采用 5 比 1 的交错注意力机制,降低了 KV 缓存的内存占用。KV 缓存内存通常会随着上下文长度的增加而增长。Gemma 3 支持更长的上下文长度,大型模型可处理高达 128k 个 tokens。此外,Gemma …- 0
- 0
-
LLM 认知跃迁:从“死记硬背”到“活学活用”
文章首先介绍了 Andrej Karpathy 提出的'LLM 认知核心'概念,即打造参数量在几十亿级别、专注于推理能力而非百科知识的模型。随后详细分析了 Google 最新发布的 Gemma 3n 模型的技术特点,包括其原生多模态能力、MatFormer 架构、PLE 技术等创新。文章进一步深入探讨了从'死记硬背'到'活学活用'的认知跃…- 0
- 0
-
Gemma 3 介绍:可在单 GPU 或 TPU 上运行的最具能力的模型
谷歌 DeepMind 推出 Gemma 3,这是基于 Gemini 2.0 构建的最新开放模型,它不仅为超过 140 种语言提供多语言支持,更提升了性能。Gemma 3 具备强大的多模态能力,可以分析图像、文本和短视频;同时,它还配备了扩展的 128k-token 上下文窗口,并支持函数调用以实现任务自动化。Gemma 3 性能卓越,超越 Llama-405B 等模型,且可在单个图形处理器或张量…- 0
- 0
-
Gemma 3n 开发者指南:全新发布
谷歌 Gemma 3n 实现了设备端 AI 的重大突破,支持图像、音频、视频和文本的多模态输入,提供两种内存高效版本(E2B 和 E4B)。该模型通过 MatFormer 架构达成灵活推理能力,分层嵌入(Per-Layer Embeddings, PLE)提升内存效率,KV 缓存共享加速处理,并配备先进的 MobileNet-V5 视觉编码器和 USM 音频编码器。E4B 版本在 LMArena …- 0
- 0
Gemma
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!





