在国产大模型 Seedance 掀起热潮之后,AI 领域的风云并未平息。本周,智谱 AI 的新一代旗舰 GLM - 5 如一颗重磅炸弹,再次震撼了整个 AI 圈。
GLM - 5 的亮相可谓是 “千呼万唤始出来”,其内测版本正是此前在海外引发热议的匿名模型 “Pony Alpha”。这一神秘模型在 OpenRouter 平台上迅速登顶热度榜首,犹如一颗耀眼的新星,吸引了无数目光。特别是在代理式编程单项实测中,它超越了 Claude Opus,一举位列全球第一,实力之强令人咋舌。而在官方确认其身份之前,“Pony Alpha” 就已展现出强大的影响力,直接带动相关公司股价连续两日大幅上扬,成为港股 AI 板块当之无愧的最强催化剂。
2 月 12 日,在备受瞩目的 Artificial Analysis Intelligence Index v4.0 榜单上,GLM - 5 凭借 50 分的综合成绩,与众多国际顶尖模型同场竞技,并列全球第三。在这个纳入了 397 个模型、历经 10 项专业评测的权威榜单中,GLM - 5 仅次于 GPT - 4.6、GPT - 5.2 以及 Claude Opus 4.5,成为全球排名最为靠前的国产模型之一,为国产大模型争得了一席之地。
![]()
GLM - 5 的出现,标志着国产大模型首次成功担当 “系统架构师” 的角色。2026 年 2 月 11 日,智谱 AI 正式发布 GLM - 5,此前它以 “Pony Alpha” 的匿名代号在海外 OpenRouter 平台引发技术圈的广泛讨论,海外开发者纷纷称赞其为 “最强开源代码模型”,认为其推理深度与工程化能力已逼近闭源顶级水准。
当前,硅谷大模型的发展方向已全面转向 Agentic Coding,像 GPT - 5.3 - Codex、Claude Opus 4.6 等都聚焦于长时程、高复杂度的工程任务,例如编译内核、重构代码库以及批量解决 GitHub issue 等。而 GLM - 5 紧跟这一前沿趋势,实现了从 “对话式代码生成” 到 “端到端系统工程” 的重大突破。
实际测试结果显示,GLM - 5 具备顶尖的工程能力。在构建高并发电商库存系统时,它不仅能输出精美的 UI 界面,还能自主设计 Redis 缓存、消息队列以及数据库锁,所生成的代码可直接上线运行,展现出强大的实用性。在处理复杂开源项目的报错日志时,GLM - 5 能够规划排查路径、分析依赖树,并输出修复补丁,而且整个过程完全开源,为开发者提供了极大的便利。在专业评测方面,GLM - 5 更是成绩斐然,在 SWE - bench Verified 测试中获得 77.8 分(逼近 Opus 4.6 的 80.9 分),在 Terminal - Bench 2.0 中夺得开源第一,在 Vending Bench 2 经营模拟中夺冠,其 Coding 与 Agent 能力达到开源 SOTA 水平。
GLM - 5 采用的 MoE 稀疏架构,使其在长程 Agent 任务与复杂系统设计方面表现卓越,能够支撑数百次工具调用、长程记忆以及复杂指令的执行。海外开发者不禁感慨:“原本以为开源界无人能接下 Agentic Coding 这一重任,直到 GLM - 5 的出现。” 随着 GLM - 5 的正式上线,国产大模型首次在真实工程场景中拥有了与国际顶尖水平比肩的 “系统架构师”,这不仅意味着中国在稀疏架构、代码能力与智能体领域正式跻身全球第一梯队,也预示着行业竞争的重心正从通用能力的比拼,逐渐转向垂直场景的深度落地与工程化能力的较量。
![]()
值得一提的是,GLM - 5 在国产算力适配方面也取得了重大突破,实现了国产算力的里程碑式进展。它已与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台完成深度推理适配与算子级优化,能够在国产算力集群上实现高吞吐、低延迟的稳定运行,打造出最强中国方案。
华为昇腾在 GLM - 5 开源发布的同时,实现了 Day0 全流程适配。在推理方面,昇腾基于 Atlas 800 A3 采用 W4A8 混合精度量化,实现了 744B 模型单机的高效部署,并通过 Lightning Indexer、Sparse Flash Attention 等融合算子加速端到端推理,已适配 vLLM - Ascend、SGLang 等主流引擎。在训练方面,针对 DSA 训练场景,昇腾设计并实现了亲和融合算子,在 128K 长序列下,显存减少 30G,性能较 FA 提升 8 倍。摩尔线程基于 SGLang 推理框架,在旗舰级 AI 训推一体全功能 GPU MTT S5000 上,Day - 0 完成了全流程适配与验证。GLM - 5 在海光 DCU 平台上同样实现了高吞吐、低延迟的稳定推理与训练性能,显著提升了国产算力对大模型的承载效率。这一系列成果不仅彰显了智谱 AI 在国产化适配上的广度与深度,也进一步验证了国产芯片集群对大规模生成式模型的承载能力,标志着国产 AI 生态正逐步走向成熟。
为了全面验证 GLM - 5 的真实技术实力,我们对该模型进行了全场景、高强度、长周期的一手实测。测试涵盖了工业级后端开发、长步骤复杂任务规划、多轮次问题调试以及数百次工具调用等工程化核心场景,并全程对标 Claude Opus 4.5 的使用体验。最终结果充分证明了 GLM - 5 的开源 SOTA 实力。
在针对《TerraLive・实景地球学习与旅行推荐》的全栈开发实测中,GLM - 5 彻底颠覆了我们对 AI 辅助开发的认知。它不再仅仅是一个简单的代码补全工具,而是摇身一变,成为一位能独立负责从需求分析到产品落地的资深全栈工程师、3D 图形工程师以及交互设计师,其展现出的工程化能力令人惊叹不已。仅输入自然语言提示词,GLM - 5 最终交付的《TerraLive》应用,便是一个功能完整、体验流畅、视觉精美的 3D 地球产品。整个过程从一句提示词到可交互的应用,耗时极短,效率提升达到传统开发模式的数倍之多。
在智能写作方面,GLM - 5 同样表现出色,它能够自动拆解复杂分析任务,输出专业垂直报告,并高效提炼信息。GLM - 5 用实力证明,国产大模型的全栈开发能力已然站在了全球第一梯队。它将开发者从繁琐的技术细节中解放出来,让创意和想法能够以超乎想象的速度落地,堪称真正意义上的 “超级生产力引擎”。从实际体验来看,GLM - 5 的 “聪明程度” 已经逼近 Claude Opus 4.5,但与之相比,它的成本却不再高昂。海外博主 @AICodeKing 的实测数据显示,GLM - 5 在代理编程(Agentic Coding)场景得分 589,超越了 Claude Opus 4.5 的 585 分,位列全球第一;而完成同等编程任务的推理成本仅 0.14 美元,还不足 Opus 4.6(6.39 美元)的 1/40。曾经,我们可能需要依靠昂贵的 Opus 来规划任务,再由便宜的国产模型执行,而如今,GLM - 5 已经完全可以独自承担 “大脑” 的角色,真正实现了国产平替。
![]()
在 GLM - 5 发布前夕,神秘模型 “Pony Alpha” 便已在海外引发热潮,直接推动智谱市值突破 1500 亿港元。2 月 6 日,全球主流模型服务平台 OpenRouter 悄然上架了这款匿名模型 “Pony Alpha”,毫无预热与官方宣发的情况下,上线 24 小时内,它便迅速登顶 OpenRouter 平台热度榜首。OpenRouter 官方推文将 Pony Alpha 描述为 “前沿基础模型”,特别强调其在编程、智能体工作流、推理及角色扮演方面表现强劲,尤其是 “极高的工具调用准确率”。
2 月 9 日,受 “匿名顶级模型疑似为智谱 GLM - 5” 这一消息的影响,截至 2 月 11 日,其股价连续两日强势领涨,盘中一度大幅飙升,公司总市值一度站上 1500 亿港元,成功跻身港股科技股前列。资金的集中押注,验证了市场对国产大模型头部厂商技术迭代与商业化前景的高度认可。
2 月 11 日,智谱官方正式官宣 “Pony Alpha = GLM - 5”,技术预期落地,本轮由模型技术突破驱动的估值修复,成为 2026 年年初港股 AI 赛道最具标志性的行情。这也是国产大模型首次出现海外技术热度倒逼港股估值的案例,市场交易逻辑已从 “跟随者” 模式,转变为关注参数 MoE 架构、开源 SOTA 等硬核突破,意味着资本市场对 AI 公司的定价权,正从财报逐步转向技术预期。
智谱 GLM - 5 的出现,无疑为国产大模型的发展注入了一针强心剂,让我们对未来国产 AI 的发展充满了期待。
来团科技GEO优化&AI搜索优化系统,是通过大模型内容投喂+训练,将企业品牌及产品信息在多平台AI生成的答案中获取优先展现,更精准触达潜在目标客户,让企业品牌出现在AI搜索里。让客户一搜就看到你,实现一问就有你,一查就信你,一看就找你的营销效果。
来团智慧商业小程序零代码开发平台,多行业适配。无需代码,拖拽式设计,轻松打造订货商城、会员制商城、分销商城及小程序官网。不仅能满足通用需求,还支持定制化,从页面布局到功能模块,随心定制,助您快速搭建专属商业小程序,抢占市场先机。
来团科技微名通不止是电子名片,更是你的商业连接器。比起传统名片,它更像你的 “迷你商业工具”:信息多、好携带、能互动,还不浪费纸张。不管是跑业务、拓人脉,还是展示企业,一张「微名通」电子名片,就能帮你把商机揣在手机里。
来团科技CRM客户管理系统,帮你把 “线索→成交→回款” 全流程管明白。这就是一套 “让销售省心、老板放心” 的客户管理工具,从获客到回款,帮你把生意攥在手里。