LLMEval是由复旦大学NLP实验...
由复旦大学NLP实验室推出的大模型评测基准
MagicArena是什么 MagicArena...
PubMedQA是什么 PubMedQA是专...
H2O EvalGPT 是 H2O.ai 用于...
MMBench是什么 MMBench是多模...
C-Eval是什么 C-Eval是适用于...
Open LLM Leaderboard是什么 ...