返回AI资讯
Z.ai 上线 GLM-4.6V 视觉推理模型,提供原生函数调用与免费 Flash 版

Z.ai 上线 GLM-4.6V 视觉推理模型,提供原生函数调用与免费 Flash 版

AI资讯 Admin 190 次浏览

Zhipu 旗下平台 Z.ai 宣布上线 GLM-4.6V 系列视觉语言模型,包括参数规模为 106B、面向云端与高性能集群场景的 GLM-4.6V,以及面向本地与低时延场景的轻量版 GLM-4.6V-Flash。官方介绍称,GLM-4.6V 在训练中支持最长 128K token 上下文,可同时处理图像、文本、文件等多模态输入,并在同尺寸模型中取得较高视觉理解能力。

在能力设计上,GLM-4.6V 系列首次在该家族视觉模型中集成原生函数调用能力,可在理解图像和长文档的基础上触发工具或业务接口,为多模态智能体应用提供基础设施。开发者可通过 Z.ai 提供的在线对话页面体验模型,也可使用 API 接口在自有业务中集成调用;同时,模型权重在 Hugging Face 对外开放,便于有算力条件的团队进行本地或私有化部署。

在费用方面,Z.ai 公布的 API 计费按百万 token 计价,GLM-4.6V 云端推理按输入与输出分别计费,Flash 版本当前标注为免费,适合对成本敏感、对时延要求较高的应用场景。具体价格、限时优惠及配额规则以开发者文档与控制台公示为准,用户在接入前需关注账号额度、安全合规及多模态数据上传的隐私保护问题。

常见问题

Q:GLM-4.6V 是什么模型?

A:GLM-4.6V 是 Z.ai 推出的多模态大模型,可同时处理图像、文本等输入,并支持长上下文与推理能力。

Q:GLM-4.6V-Flash 与 GLM-4.6V 有何区别?

A:GLM-4.6V-Flash 为轻量高速版本,更适合本地部署和低时延应用,而 GLM-4.6V 面向云端与高性能集群场景。

Q:如何体验 GLM-4.6V 系列模型?

A:普通用户可通过 Z.ai 的在线聊天页面体验,开发者可通过官方 API 集成到自有应用中。

Q:GLM-4.6V 是否支持函数调用?

A:GLM-4.6V 系列支持原生函数调用,可在解析图像和文档后调用外部工具或业务接口,便于构建多模态智能体。

Q:GLM-4.6V 和 GLM-4.6V-Flash 的价格如何?

A:GLM-4.6V 对 API 调用按百万 token 区分输入和输出计费,GLM-4.6V-Flash 当前标注为免费,具体以官方定价页面为准。

ZaiGLM46V多模态大模型解析 GLM46V视觉语言模型介绍 GLM46VFlash轻量版区别解读 106B参数规模云端推理能力 支持128Ktoken超长上下文解析 图像文本文件统一多模态输入 GLM46V原生函数调用功能说明 多模态智能体应用基础设施 Zai平台GLM46V在线体验入口 GLM46VAPI接入流程与示例 HuggingFace开源权重点下载 本地私有化部署GLM46V指南 本地低时延场景适配Flash版本 云端高性能集群部署实践经验 百万token计费模式详细说明 GLM46V输入输出分开计费规则 Flash版本免费额度与使用场景 成本敏感业务如何选择GLM46V 支持图像理解与视觉问答场景 复杂长文档解析与知识抽取 多模态数据上传安全与隐私合规 面向开发者的多模态API调用示例 多模态函数调用驱动业务工具链 GLM46V在企业智能客服中的应用 教育行业接入多模态大模型方案 电商图文内容理解与推荐应用 多模态智能体工作流设计思路 视觉语言模型选型与性能对比 国产大模型Zhipu多模态布局 Zai平台账号配额与调用限制 高并发多模态推理架构设计 对话页面体验GLM46V使用技巧 开发者如何评估多模态推理成本 GLM46V支持的典型多模态场景整理 开源权重二次微调与领域适配 自建GPU集群部署GLM46V实战 本地部署硬件配置与性能权衡 多模态企业数据隔离与安全方案 长上下文对代码与文档分析优势 工具调用增强多步骤自动化能力 AIGC产品中引入视觉理解模块 互联网企业多模态大模型落地经验 初创团队使用Zai多模态模型建议 国内多模态大模型生态与竞争格局 GLM46V在垂直行业应用案例盘点 多模态搜索与检索增强应用设计 文本图像联合问答与检索实践 Zai平台多模态开发者文档速览 GLM46V未来版本演进与功能展望 多模态大模型推动AI应用升级

推荐工具

更多