J.Cling

是一位神秘生物,至今没有被发现其是人类的迹象,当然也没有证据表明网主不是人类,只是你通过在街上的游荡或是扫荡,多多少少会在这条街上感觉到始终有一种不一样的气息无处不在的在你身边所谓的'阴魂不散',那是一种新鲜的,青春的执着洋溢;激荡的,热血的汗水挥洒。你不要问他是什么人,你只需知道他有着敏锐的嗅觉,通晓软件的魅力,追逐的时代的步伐,关心的用户的需求,关注着这不平衡的中国互联网的发展....据调查自古英雄出少年这句话完全可以体现在该人物身上,但有关部门(“危机揭密”)分析说网主并不年轻但也不老,目前已经享尽了单身的苦奈....
AGI-Eval

AGI-Eval

通用智能评估体系,追踪多领域思维能力
30
LLMEval3

LLMEval3

LLM-EVAL
00
Chatbot Arena

Chatbot Arena

盲测对战平台,匿名模型对比用户实时评分
00
OpenCompass

OpenCompass

评测榜单旨在为大语言模型和多模态模型提供全面、客观且中立的得分与排名,同时提供多能力维度的评分参考,以便用户能够更全面地了解大模型的能力水平。
220
H2O EvalGPT

H2O EvalGPT

企业级评估系统,支持合规监测与成本优化
1950
PubMedQA

PubMedQA

PubMedQA Homepage生物医学问答评测,基于PubMed文献数据库
10
CMMLU

CMMLU

中文多学科综合测试,涵盖67个领域知识库
00
MMBench

MMBench

中文多模态测评基准,测试图文理解推理能力
20
HELM

HELM

斯坦福综合评估框架,覆盖安全性/鲁棒性/效率等维度
100
Google AI

Google AI

Google官方AI资源库,包含研究论文与技术文档
90
ShowMeAI

ShowMeAI

AI知识图谱社区,提供结构化学习路径
30
txyz.ai

txyz.ai

研究论文解读工具,智能生成文献摘要
20