Athina

协作AI平台构建测试监控AI功能数据集评估团队协作。

详细介绍

核心功能

  • 数据集50+预设评估如RAGAS忠实接地或自定义评估器LLM作为评判Python函数评估。
  • 数据集创建标注提示版本执行程序化响应评估实时LLM推理日志元数据如成本自定义属性。

适用人群/场景

适合数据科学家产品经理QA团队工程师技术非技术工作流提示链数据集SQL比较人类循环验证。

主要特色/优势

完整跟踪LLM流连续在线生产日志评估分段分析提示模型用户,无代码UI跨职能协作框架无关支持领先AI提供商企业级安全VPC部署SOC 2合规。