面向 AI 模型服务化和推理部署的平台
BentoML 提供模型打包、服务编排、推理 API、容器化和云原生部署能力,适合把机器学习模型和大模型应用稳定发布到生产环境。
机器学习与生成式 AI 生命周期管理平台
基于 Kubernetes 的机器学习工作流平台
高吞吐大语言模型推理与服务框架