CMMLU是什么 CMMLU是综合性的...
一个综合性的大模型中文评估基准
H2O EvalGPT 是 H2O.ai 用于...
LLMEval是由复旦大学NLP实验...
MMBench是什么 MMBench是多模...
LMArena是什么 LMArena是加州...
MMLU 全称 Massive Multitask...
Open LLM Leaderboard是什么 ...