H2O EvalGPT 是 H2O.ai 用于...
H2O.ai推出的基于Elo评级方法的大模型评估系统
LMArena是什么 LMArena是加州...
OpenCompass是什么 OpenCompa...
LLMEval是由复旦大学NLP实验...
SuperCLUE是什么 SuperCLUE ...
CMMLU是什么 CMMLU是综合性的...
C-Eval是什么 C-Eval是适用于...