PaperBench
PaperBench
est un
LLM Benchmark
développé par
OpenAI
.
Page
LLM-Stats.com
:
https://llm-stats.com/benchmarks/paperbench
Papier de recherche :
PaperBench: Evaluating AI’s Ability to Replicate AI Research
Quitter le mode Zen