东说念主类什么时辰能击败AI?北京大学的这场西宾里,本科生投诚了AI!

这场西宾里,北京大学的本科生击败了AI!北大团队打造硬核化学评测题库SUPERChem,174名化学学霸与GPT、Gemini、deeppseek等顶尖AI同场竞技,500说念防舞弊高难度化学试题,领略AI科学推理短板。

SUPERChem的出生,填补了化学范围多模态深度推理评测的空缺。

据悉,团队发布这项效果,并非为了证实AI的短板,而是为了鼓励它走得更远。现在,SUPERChem技俩已全面开源。团队但愿这套源自北大的“试卷”,能成为全球科学与东说念主工智能范围的大众金钱,去催化下一次时刻的爆发。简略在不久的昔日,当咱们再次掀开这张试卷时,AI能交出一份满分的答卷。