Z.ai 发布 GLM-4.7-Flash 权重与 API：免费层 1 并发，另推 FlashX 高速版

AI资讯 • Admin • 2026/1/20 • 230 次浏览

Z.ai 相关账号在 X 发布信息，介绍新模型 GLM-4.7-Flash，定位为“本地 coding 与 agentic assistant”，强调在 30B 级别中兼顾高性能与高效率，适合作为轻量化部署选项。同步信息显示，模型权重已在 Hugging Face 提供，并支持通过 Z.ai 的 API 调用。

官方开发者文档将 GLM-4.7-Flash 描述为免费层模型，标注“1 并发”限制；同时提供 GLM-4.7-FlashX 作为“更高速且更经济”的可选版本。除编程外，公开介绍还建议其用于创意写作、翻译、长上下文任务与角色扮演等场景。

需要注意的是，“本地运行”的实际门槛仍取决于部署方式与硬件资源；此外，免费层并发与商业使用条件应以平台最新定价与条款页面为准，避免将演示口径误解为通用可用性承诺。

常见问题

Q：GLM-4.7-Flash 的核心定位是什么？

A：GLM-4.7-Flash 主打轻量部署，重点面向本地编码辅助与智能体工作流。

Q：GLM-4.7-Flash 是否提供模型权重下载？

A：GLM-4.7-Flash 权重已在 Hugging Face 的 zai-org 账号下提供。

Q：GLM-4.7-Flash 的 API 是否免费？

A：Z.ai 文档标注 GLM-4.7-Flash 为免费层，但默认限制为 1 并发。

Q：GLM-4.7-FlashX 与 GLM-4.7-Flash 有何区别？

A：公开说明称 GLM-4.7-FlashX 更偏向高速与性价比，面向更高频调用场景。

Q：GLM-4.7-Flash 适合哪些非编程用途？

A：公开介绍提到可用于创意写作、翻译、长上下文任务与角色扮演等。

Z.ai 发布 GLM-4.7-Flash 权重与 API：免费层 1 并发，另推 FlashX 高速版

相关文章

GPT-5.3“Garlic”传闻流出：被称为OpenAI下一代关键模型

安克 AI 录音豆功能解析：实时转写实时总结多语言翻译怎么用

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

推荐工具

Z.ai 发布 GLM-4.7-Flash 权重与 API：免费层 1 并发，另推 FlashX 高速版

相关文章

GPT-5.3“Garlic”传闻流出：被称为OpenAI下一代关键模型

安克 AI 录音豆功能解析：实时转写 实时总结 多语言翻译怎么用

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

推荐工具

提交AI工具

请确认提交信息

安克 AI 录音豆功能解析：实时转写实时总结多语言翻译怎么用