返回文章列表

AI基础设施

找到 4 篇相关文章

vLLM 适合什么团队?它是高性能推理底座,不是“装上就能用”的聊天产品

vLLM 适合什么团队?它是高性能推理底座,不是“装上就能用”的聊天产品

vLLM 的热度一直很高,因为它踩中的不是“有没有聊天界面”这种上层需求,而是更底层、也更贵的那个问题:模型服务怎么跑得更快、更省显存、更能扛并发。只要你准备自己托管模型 API,而不是单纯本地玩玩,vLLM 基本都会进入候选名单。 官方仓库: https://github.com/vllm-pro...

Ai开源 Admin
52
LiteLLM 为什么越来越像多模型团队的标配网关?它解决的不是聊天界面,而是统一接入

LiteLLM 为什么越来越像多模型团队的标配网关?它解决的不是聊天界面,而是统一接入

LiteLLM 这两年越来越常出现在团队架构图里,不是因为它能替代 ChatGPT 或 Dify,而是因为它刚好卡在一个很现实的位置上:帮团队把一堆不同厂商、不同协议、不同计费口径的模型服务收进一个统一入口。你可以把它理解成大模型时代的“接入层”和“路由层”。 官方仓库: https://githu...

Ai开源 Admin
60

推荐工具

更多