GPT-4o

全华人团队推出多模态大模型新基准,GPT-4o准确率仅为65.5%

还发现感知错误、推理错误是所有模型最常见的两大错误。