🏆 Trending #3

promptfoo

Test your prompts, agents, and RAGs. Red teaming/pentesting/vulnerability scanning for AI. Compare performance of GPT, Claude, Gemini, Llama, and more. Simple declarative configs with command line and CI/CD integration.

1,158 Forks

TypeScript

@promptfoo

项目概述

promptfoo æ¯ä¸ä¸ªLLM æµè¯åå®å¨æ«æå·¥å·ï¼ç¨äºæµè¯æç¤ºè¯ãAI ä»£çå RAG ç³»ç»ãå®æä¾ AI çº¢éæµè¯ãæ¼æ´æ«æåè½ï¼æ¯ææ¯è¾ GPTãClaudeãGeminiãLlama çå¤ä¸ªæ¨¡åçæ§è½ã

TypeScript

å¼åè¯è¨

LLM

æµè¯å¯¹è±¡

Red Team

å®å¨æµè¯

CI/CD

éææ¯æ

核心功能

ð§ª æç¤ºè¯æµè¯

æµè¯åæ¯è¾ä¸åæç¤ºè¯çææï¼æ¾å°æä¼æ¹æ¡ã

ð¡ï¸ çº¢éæµè¯

èªå¨æ£æµ LLM æ¼æ´åå®å¨éæ£ã

ð æ¨¡åå¯¹æ¯

å¹¶è¡æµè¯å¤ä¸ªæ¨¡åï¼æ¯è¾è¾åºè´¨éåææ¬ã

ð CI/CD éæ

å½ä»¤è¡å·¥å·å CI/CD éæï¼èªå¨åæµè¯æµç¨ã

ð RAG æµè¯

æµè¯æ£ç´¢å¢å¼ºçæç³»ç»çåç¡®æ§åç¸å³æ§ã

ð¤ Agent æµè¯

æµè¯ AI ä»£ççè¡ä¸ºåå³çé»è¾ã

开始使用

访问 GitHub 返回列表