恒创科技

广告

hostinger

广告

UCloud星图AstraFlow和Coding Plan同步上线智谱GLM-5.2

美国云服务器推荐

UCloud星图AstraFlow和Coding Plan同步上线了智谱GLM-5.2,该模型是一款面向长任务时代的旗舰模型,支持真正可用的1M上下文,可承载项目级工程上下文,长程任务执行更稳定、工程规范遵循更可靠,一次任务即可完成从需求到多端部署的完整开发链路。

UCloud

在全球百万用户参与盲测的前端开发评估系统Code Arena上,GLM-5.2取得全球可用模型第一的表现。

UCloud

1、1M上下文与长程任务

支撑长程任务的第一步是GLM-5.2必须实现1M无损上下文。此前1M上下文大多数在超过数百K过后就开始劣化,主要问题在于不同时增强Coding Agent环境及数据的情况下单纯扩展到1M帮助有限。GLM-5.2真正扩展到了1M Coding Agent的训练环境,覆盖自动化研究、性能优化等多个领域,在1M上下文的solid表现有时甚至超过Opus。

1M上下文构成GLM-5.2的长程交付能力,多个长程任务基准表明GLM-5.2的表现介于Claude Opus 4.7与4.8之间,是排名最高的开源模型。在FrontierSWE(测试AI是否能够像软件工程师在数小时尺度上完成复杂技术项目的测试集)上仅比Opus 4.8低1%,超过GPT-5.5(1%)和Opus 4.7(11%);不过在SWE-Marathon(考察Agent自主完成超长软件工程的测试集)上确实还需要进一步提高,低于Opus 4.8不少(13%)。

在实际体验中,GLM-5.2完成开发、联调、测试到打包上线,完整交付一个覆盖Web、移动端与小程序的多端应用,累计处理88万tokens,几乎用满1M上下文窗口。过去,这样的大型工程需要一支团队协作数周,现在GLM-5.2能在一次长程任务中跑完。

2、更强的Coding能力

GLM-5.2在前端、后端、长程任务上的成功率相比前一代GLM-5.1都有提升,复杂系统工程与深度调试更稳。在主流编程基准上,GLM-5.2保持开源SOTA,与Claude Opus 4.8处于可比区间。例如在Terminal-Bench 2.1(评测AI Agent完成不同类型的计算机终端任务),GLM-5.2比Opus 4.8低4%,相比GLM-5.1提升了17.5%;在MCP-Atlas(大规模工具调研评测的数据集),GLM-5.2比Opus 4.8低0.8%。

GLM-5.2的最大提升集中在:

  • 项目级上下文承载更强,能把完整工程放进同一条推理链路里
  • 长程任务执行更稳定,复杂任务能持续推进,不容易中途跑偏
  • 生产级工程规范遵循更可靠,能守住团队研发流程里的硬约束
  • 客户端与移动端工程能力更扎实,不止写App,还能完成真机调试闭环

GLM-5.2还引入了effort level(思考档位)控制,可以在能力、速度、成本之间做出平衡。在相近的token预算下,GLM-5.2的Coding能力大致位于Claude Opus 4.7与Claude Opus 4.8之间。

3、极致Infra优化

GLM-5.2的进步来自模型架构、推理系统和训练基础设施的协同设计,提出了IndexShare,在每四层稀疏注意力层之间复用同一个索引器(indexer),在1M上下文长度下,将单位token的FLOPs降低至2.9倍。此外,改进了用于投机解码(speculative decoding)的MTP层,将接受长度(acceptance length)最多提升20%。训练侧则依赖自研Slime框架支撑大规模Agentic RL和OPD训练。

随着GLM系列的持续迭代与调用量的快速增长,线上服务的稳定性与效率愈发关键。GLM-5.2的线上推理依托多个国产算力平台,已在Day 0完成与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等国产算力平台的推理适配,在国产芯片集群上实现高吞吐、低延迟、大并发的稳定运行。

登录AstraFlow星图限时免费体验

优刻得AI开发平台星图AstraFlow构建了覆盖“模型供给—开发调度—安全运行—成本管理”的全链路能力体系,持续跟进最新优质模型动态,实现Day0级别极速上新。作为AI应用开发者,无需关注底层的算力资源调度、基础环境的模型部署,即可快速搭建专属AI应用。

登录星图平台:UCloud AstraFlow星图平台

步骤一:注册并登录AstraFlow星图

平台地址:https://astraflow.ucloud.cn/

步骤二:实名认证

使用服务前用户需要完成实名认证。

步骤三:创建API Key

进入模型服务平台-秘钥管理。

点击左上角创建一个Key,新用户注册免费50万tokens。

curl -X POST "https://api.modelverse.cn/v1/chat/completions" \-H "Content-Type: application/json" \-H "Authorization: Bearer your-api-key" \-d '{  "model""glm-5.2",  "messages": [    {      "role""system",      "content""你是一名资深的全栈软件工程师,擅长前端开发、后端架构设计以及现代 Web 技术栈"    },    {      "role""user",      "content""帮我设计并编写一个个人博客网站,包含首页、文章列表、文章详情页,使用 React + Node.js 技术栈"    }  ],  "thinking": {    "type""enabled"  },  "reasoning_effort""max",  "stream"true,  "max_tokens"65536,  "temperature"1.0}'

UCloud算力云平台优云智算Coding Plan订阅套餐也已同步上线GLM-5.2。

相关推荐:

UCloud AstraFlow星图大模型平台优势及使用教程

UCloud星图AstraFlow大模型平台常见问题解答

UCloud优云智算Coding Plan购买及使用指南

(本文由美国主机侦探原创,转载请注明出处“美国主机侦探”和原文地址!)

主机侦探企业微信

微信扫码加好友进群

主机优惠码及时掌握

主机侦探QQ群

QQ群号:164393063

主机优惠发布与交流

温馨提示:

1、本站部分图片来源于互联网,如有侵权请联系删除。邮箱:2942802716#qq.com(#改为@)

2、本文评论没有专人回复,如果您有问题请到美国主机侦探论坛提问!

3、美国主机侦探免费为您提供美国主机购买咨询。

RAKsmart美国服务器
返回顶部