DeepEval

面向 LLM 应用的开源测试与评测框架

LLM 评测测试框架RAG

详细介绍

DeepEval 为 LLM 应用提供单元测试式的评测体验，支持 RAG、Agent、问答、幻觉、偏见和自定义指标的持续验证。

功能特性

评测用例
多维质量指标
CI 集成

相关公司

Confident AI

Related Tools

相关工具