首页Tool Intelligence / AI 工程化

DeepEval

面向 LLM 应用的开源测试与评测框架

LLM 评测测试框架RAG

详细介绍

DeepEval 为 LLM 应用提供单元测试式的评测体验,支持 RAG、Agent、问答、幻觉、偏见和自定义指标的持续验证。

功能特性

  • 评测用例
  • 多维质量指标
  • CI 集成

相关公司

Confident AI