开源LLMOps平台,集成了提示词工程、LLM评估和可观测性功能,帮助团队快速构建生产级LLM应用。
一个用于测试LLM提示词的开源测试套件,通过计算困惑度来评估提示词质量
DeepEval LLM评估平台基准保护改进AI应用。
AI治理平台评估可观察性ML/LLM系统自动化测试护栏。