MMBench是什么 MMBench是多模...
全方位的多模态大模型能力评测体系
SuperCLUE是什么 SuperCLUE ...
CMMLU是什么 CMMLU是综合性的...
PubMedQA是什么 PubMedQA是专...
C-Eval是什么 C-Eval是适用于...
LLMEval是由复旦大学NLP实验...
AGI-Eval是什么 AGI-Eval是上...