🏆 Trending #3

promptfoo

Test your prompts, agents, and RAGs. Red teaming/pentesting/vulnerability scanning for AI. Compare performance of GPT, Claude, Gemini, Llama, and more. Simple declarative configs with command line and CI/CD integration.

1,158 Forks
TypeScript
@promptfoo

项目概述

promptfoo 是一个LLM 测试和安全扫描工具,用于测试提示词、AI 代理和 RAG 系统。它提供 AI 红队测试、漏洞扫描功能,支持比较 GPT、Claude、Gemini、Llama 等多个模型的性能。

TypeScript
开发语言
LLM
测试对象
Red Team
安全测试
CI/CD
集成支持

核心功能

🧪 提示词测试

测试和比较不同提示词的效果,找到最优方案。

🛡️ 红队测试

自动检测 LLM 漏洞和安全隐患。

📊 模型对比

并行测试多个模型,比较输出质量和成本。

🔄 CI/CD 集成

命令行工具和 CI/CD 集成,自动化测试流程。

📝 RAG 测试

测试检索增强生成系统的准确性和相关性。

🤖 Agent 测试

测试 AI 代理的行为和决策逻辑。

开始使用

访问 GitHub 返回列表