北京大学
无一大模型及格! 北大/通研院提出超难基准,专门评估长文本理解生成
像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。
2024-08-07
北大数学“黄金一代”今何在?
2022-04-04
清北毕业生5年来去向大数据:北大偏爱银行,清华更倾向国网,华为堪称最大黑洞
2020-10-17