GLM-5.1发布:Z.ai押注开源代码模型与8小时长时代理任务
GLM-5.1 正式发布,Z.ai 将其定义为面向 agentic engineering 的新一代开源旗舰。官方资料显示,这款模型主打代码、工具调用与长时自主执行,在 SWE-Bench Pro、NL2Repo 和 Terminal-Bench 2.0 等任务上给出一组靠前成绩,同时把单任务连续自...
找到 17 篇相关文章 - 第3页
GLM-5.1 正式发布,Z.ai 将其定义为面向 agentic engineering 的新一代开源旗舰。官方资料显示,这款模型主打代码、工具调用与长时自主执行,在 SWE-Bench Pro、NL2Repo 和 Terminal-Bench 2.0 等任务上给出一组靠前成绩,同时把单任务连续自...
Manus 是什么?它不是那种只负责回答问题的聊天机器人,而更像一个会自己往下做事的 AI 代理工具。官方站点和帮助中心里,Manus 一直在强调 Sandbox、Connectors、Projects 这些能力,也就是让 AI 不是只说“我可以”,而是真的能在工作流里执行任务。官网是 https:...
工具调用是当下 AI 应用里最重要、也最容易被忽视的基础能力之一。很多人看到模型会查天气、读文件、搜网页、发请求,就以为它“突然变强了”,但背后真正起作用的,往往是工具调用。它的本质,是让模型在合适的时候,不只输出文字,而是选择去调用某个函数、接口或外部能力,再把结果带回来继续完成任务。 也正因为有...
MCP 这几年在 AI 工具圈里越来越常见,很多人第一次看到这个词时会把它和 API、插件、函数调用混在一起。其实 MCP 可以理解成一种让模型更稳定接入外部工具和数据源的协议层。它不是单个工具,也不是某一家平台的私有接口,而是一套更通用的连接方式,用来告诉模型“有哪些能力可以调用、参数怎么传、结果...
智谱正式发布 GLM-5V-Turbo,这是一款明显冲着视觉编程场景去的新模型。和传统代码模型相比,它不只是接收文字指令,而是可以直接理解图片、视频、设计稿和文档布局,再把这些信息接进代码生成和任务执行流程里。 原生支持多模态编程 GLM-5V-Turbo 最大的特点,是把“看懂内容”和“写出代码”...