-
本地搭建“类ChatGPT”AI对话系统:图文详解指南
前言:我们能搭建什么? 首先需要明确:我们无法直接搭建OpenAI官方的ChatGPT,因为那是闭源商业服务。但我们可以搭建功能类似的本地AI对话系统,使用开源大语言模型(LLMs),如Meta的Llama 3、Mistral等。本文将带您一步步完成搭建。 准备工作 硬件要求 最低配置:16GB RAM + 10GB可用存储空间 推荐配置:32GB RAM + NVIDIA显卡(8GB+显存)+ …- 0
- 0
-
Gemini 2.5:我们的思维模型系列更新
本文详细介绍了 Google Gemini 2.5 模型系列的最新更新。文章宣布 Gemini 2.5 Pro 和 Gemini 2.5 Flash 已全面可用且稳定,并指出与最近的预览版相比没有变化。新模型 Gemini 2.5 Flash-Lite 以预览版形式推出,提供最低延迟和成本,专为分类和摘要等高吞吐量任务设计。文章解释了将 Gemini 2.5 模型视为具有可调思维预算的“思维模型”…- 0
- 0
-
Andrej Karpathy:AGI 仍需十年,长期挑战犹存
在本次深度访谈中,人工智能专家 Andrej Karpathy 对通用人工智能 (AGI) 即将到来的观点提出质疑,并断言 AGI 仍需十年才能实现。他强调,当前的大语言模型 (LLM) 存在关键的认知缺陷,例如缺乏持续学习能力、多模态交互不足以及计算机交互能力较弱,这些缺陷使其无法胜任复杂的任务。Karpathy 严厉批评强化学习 (RL),认为其效果“糟糕”,因为它存在稀疏且嘈杂的监督机制。他…- 0
- 0
-
Next.js 自部署
该视频提供了一份全面的指南,介绍了如何使用 Docker 在低成本 Linux 虚拟专用服务器 (VPS) 上自部署 Next.js 应用、PostgreSQL 数据库和 Nginx 反向代理。它逐步介绍了 VPS 的设置,使用详细的 Bash 脚本部署应用,以及配置基本的 Next.js 功能,如图像优化、服务端组件流式传输、使用自定义缓存处理器的 ISR (增量静态再生)、中间件和环境变量处理…- 0
- 0
-
124. 年终回顾【站在 2025 年之外】和戴雨森聊 2026 年预期、The Year of R、回调、我们如何下注
本期播客中,真格基金管理合伙人戴雨森对 2025 年 AI 和创投领域进行了深入复盘,并对 2026 年做出展望。他认为 2025 年 AI 行业发展符合预期,模型能力显著提升(如 Thinking Time Scaling、多模态融合),中国模型公司在开源生态中展现出强劲追赶态势。应用方面,AI Agent 落地初见成效,但仍处于早期市场,效率提升型 C 端应用表现抢眼。戴雨森强调 2026 年…- 0
- 0
-
2025 年 Python 发展现状 | PyCharm 博客
Michael Kennedy 基于第八次年度 Python 开发者调查,分析了超过 30,000 份回复,旨在为 Python 开发者揭示重要趋势和实用见解。 主要发现显示,86% 的受访者以 Python 作为主要语言,且令人惊讶的是,50% 的人专业编码经验不足两年,突显了 Python 对新手的友好性,并促使内容创作者和工具供应商调整策略。 数据科学目前占据 Python 应用的半壁江山,…- 0
- 0
-
Genie 3:世界模型的突破
Google DeepMind 发布了 Genie 3,这是一种突破性的通用世界模型,能够生成高度多样化和交互式的环境。它允许以每秒 24 帧 的帧率进行实时导航,并在几分钟内以 720p 分辨率保持令人印象深刻的一致性。在之前的 Genie 模型的基础上,Genie 3 通过使 AI 代理能够预测环境演变及其在丰富的模拟环境中行为的影响,标志着迈向 AGI 的重要一步。其主要功能包括对物理属性进…- 0
- 0
-
谷歌 nano banana 正式上线:单图成本不到 3 毛钱,比 OpenAI 便宜 95%
文章详细介绍了谷歌最新发布的图像生成与编辑模型 Gemini 2.5 Flash Image Preview。该模型以其卓越的图像生成与编辑能力、惊人的角色一致性以及极快的处理速度为主要亮点。文章指出,该模型已在 Google AI Studio 和 Gemini API 中提供免费预览,并强调其每张图像生成成本远低于 OpenAI 同类产品,具有显著的成本效益。功能上,Gemini 2.5 Fl…- 0
- 0
-
和杨植麟时隔一年的独家对话:“站在无限的开端”
文章是张小珺对月之暗面创始人杨植麟的独家访谈。杨植麟分享了在 Kimi K2 模型发布后,对大模型领域“无限攀登”的哲学思考,引用《无穷的开始》强调问题解决与知识拓展的循环。他指出过去一年大模型最重要的范式级变化是长思考推理模型和基于多轮交互的 Agent 模型。K2 模型的关键技术创新在于通过 Muon 优化器提升 token efficiency,并在 Agentic 能力上寻求突破,以解决泛…- 0
- 0
-
EmbeddingGemma 介绍:一流的端侧嵌入开放模型
本文介绍了 EmbeddingGemma,这是 Google 推出的一个开放的、具有 3.08 亿 参数的嵌入模型,专为高性能设备端人工智能而设计。它在 MTEB 基准测试中实现了相同规模下的最先进结果,支持 100 多种语言。主要功能包括通过 Matryoshka 表示实现的灵活输出维度、2K 令牌的上下文窗口以及通过量化实现的低于 200MB 的 RAM 使用量,从而可以在各种设备上进行离线操…- 0
- 0
-
AIME'25 满分炸场!Qwen 一波七连发,全家桶大更新
文章详细介绍了在云栖大会上阿里云通义千问系列模型的重大更新,包括新一代旗舰大模型 Qwen3-Max,其分为指令版和思考版,思考版在 AIME25 和 HMMT 数学榜单上首次获得满分,指令版在 SWE-Bench 编程和 Agent 工具调用评测中表现卓越。同时,开源视觉理解模型 Qwen3-VL 展现了超越 Gemini 2.5 Pro 的性能,支持带图推理、HTML/CSS 生成和视频理解,…- 0
- 0
-
为什么人类是人工智能最大的瓶颈(以及 2026 年将迎来什么) | Alexander Embiricos (OpenAI)
OpenAI Codex 的产品负责人 Alexander Embiricos 讨论了其快速演进和愿景。自 8 月以来,Codex 增长了 20 倍,每周处理数万亿个 token,成为 OpenAI 服务最多的编程模型。Embiricos 设想 Codex 成为一个积极主动的“软件工程队友”,参与到整个软件开发生命周期中,超越了单纯的代码生成。他解释说,将 Codex 集成到熟悉的集成开发环境(I…- 0
- 0
-
Qwen3-Coder:480B 参数的超强“代码特工”
文章详细介绍了通义大模型最新开源的 Qwen3-Coder,特别是其旗舰版本 Qwen3-Coder-480B-A35B-Instruct。该模型是拥有 480B 参数、35B 有效参数的 MoE(混合专家)模型,在代理式编程、浏览器智能操作和基础编码任务上均达到开源模型 SOTA。文章深入阐述了模型在预训练阶段的数据扩展(7.5T 高质量代码)、上下文扩展(原生 256K,最高 1M)以及合成数…- 0
- 0
-
MiniMax 创始人闫俊杰×罗永浩!大山并非无法翻越
本期《罗永浩的十字路口》邀请 MiniMax 创始人闫俊杰,分享其 AI 创业历程与对技术变革的深刻洞察。对话涵盖 MiniMax 在多模态 AI (语音、视频、文本、音乐) 领域的国际领先地位,分析中国 AI 创业公司在人才和创新机制驱动下,如何以较少资源取得与国际巨头媲美的成果。闫俊杰详细阐述了 AI 模型研发的"第一性原理"方法论,以及多模态融合实现 AGI 的愿景。同时…- 0
- 0
-
淘宝直播数字人:服务端工程技术
本文系统介绍了淘宝直播数字人服务端工程的三阶段演进:从人工保障阶段依赖手动配置,到产品化阶段建立标准化流程,最终实现智能化阶段的 AI 深度应用。文章详细解析了 Java 服务端+TPP Python 的混合架构设计,重点阐述了任务调度分发、算法升级迭代等核心工程实践。通过构建 FaceID 人脸库、自动化审核链路等智能化措施,显著提升了数字人直播效率。服务端工程通过统一资源管理、抽象任务策略(模…- 0
- 0
-
React 中的共享状态复杂性 – 开发者完整手册
本文是 React 开发者关于有效管理共享状态的详尽手册,共享状态是不断增长的应用程序中常见的挑战。文章首先解释了 Props 的基本概念以及由 Prop Drilling 引起的问题,阐述了数据如何在无需使用的中间组件中传递。然后,本指南深入研究了各种解决方案,包括对 React Context API(使用 `useContext` 和 `useReducer` 处理复杂逻辑)以及像 Redu…- 2
- 0
-
GPT-5 被批过度炒作、性能落后,OpenAI 联创揭秘其中原因:我们把它关在 “象牙塔”,和现实世界接触不够
文章围绕 OpenAI 最新模型 GPT-5 的发布争议展开,指出其在企业级复杂任务(如编码、长篇推理)上表现卓越,尽管在消费级应用中因任务“饱和效应”导致提升感知不明显。OpenAI 联创 Greg Brockman 在访谈中深入阐述了公司从“下一词预测”到“推理范式”的演进,强调强化学习在提升模型可靠性与泛化能力中的关键作用。他指出算力是 AI 发展的永恒瓶颈,但模型成本已实现惊人下降,并展望…- 0
- 0
-
DeepSeek-V3.1 发布,迈向 Agent 时代的第一步
DeepSeek 正式发布 V3.1 模型,核心亮点包括创新的混合推理架构,使其能同时支持“思考模式”与“非思考模式”,并能自由切换。新模型通过 Post-Training 优化,大幅增强了在编程智能体(SWE、Terminal-Bench)和搜索智能体(browsecomp、HLE)任务中的表现。在思考效率方面,V3.1-Think 模式在保持性能的同时,能将输出 token 数减少 20%-5…- 0
- 0
-
GLM-4.7 上线并开源:更强的编码
文章详细介绍了智谱 AI 新发布的 GLM-4.7 大模型,该模型在编程能力、长程任务规划与工具协同方面取得了显著提升。特别是,GLM-4.7 在多语言编码、前端代码生成质量以及工具调用能力上表现出色,并在 SWE-bench-Verified、LiveCodeBench V6 等主流基准测试中达到开源 SOTA,甚至超越了 GPT-5.2 和 Claude Sonnet 4.5。文章还介绍了 G…- 0
- 0
-
厉害了,智谱造了全球首个手机通用 Agent!人人免费,APP 甚至直接操控云电脑
文章详细介绍了智谱最新发布的全球首个手机通用 Agent——AutoGLM。其核心创新在于采用云端执行模式,为用户提供“云手机”或“云电脑”环境,从而解决传统本地 Agent 算力限制和资源占用问题,实现复杂任务的跨应用自动化处理,如点外卖、多平台比价、生成报告和 PPT 等。该产品基于纯国产的 GLM-4.5 和 GLM-4.5V 模型,免费向大众开放,并提供 API 支持开发者生态。AutoG…- 0
- 0
-
GitHub MCP 服务器实用指南
本文介绍 GitHub 托管的模型上下文协议 (MCP) 端点,它是本地运行 MCP 服务器的更优替代方案。它着重介绍了关键优势,如自动更新、简化的 OAuth 身份验证(代替手动 PAT 管理),以及从任何 IDE 或远程开发容器的广泛可访问性。托管服务消除了 Docker 维护等基础设施难题,使开发者能够专注于编码,并利用更丰富的 AI 工作流程。本指南提供了在 VS Code 和其他客户端上…- 0
- 0
-
微软下调 AI 销售目标,销售人员面临重大挑战
近日,科技行业对人工智能(AI)技术的热情持续高涨,各大企业纷纷推向市场以促进效率提升。然而,尽管许多企业积极尝试引入 AI 技术,但并非所有公司都愿意将其作为人力的替代品。根据《The Information》的报道,微软在企业级人工智能服务的销售中遭遇了重大的挫折,迫使公司将销售目标下调高达50%。主要负责 AI 服务推销的团队是微软 Azure 的销售人员。然而,由于业绩压力巨大,许多销售人…- 0
- 0
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!



















