首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
陈丹琦
陈丹琦团队揭Transformer内部原理:另辟蹊径,从构建初代聊天机器人入手
数据集/架构/训练全都新来一遍
一水
2024-07-18
Transformer
陈丹琦
陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存
任何仅解码器架构模型都适用
丰色
2024-02-29
大模型
陈丹琦
陈丹琦团队新作:数据量砍95%,大模型性能更强了!Less is More
数据选择算法LESS
白交
2024-02-10
大模型
陈丹琦
陈丹琦ACL学术报告来了!详解大模型「外挂」数据库7大方向3大挑战,3小时干货满满
突破大模型自身瓶颈
萧箫
2023-07-10
大模型
数据库
陈丹琦
陈丹琦带队全员女将发新论文!提出AI消除性别偏见新方法,适用于任何模型 | EMNLP 2022
方法已开源
Pine
2022-12-08
开源
陈丹琦
陈丹琦带着清华特奖学弟发布新成果:打破谷歌BERT提出的训练规律!这个庆祝方式太学神了吧
进一步挖掘NLP大模型潜力
萧箫
2022-02-17
人工智能
清华
陈丹琦
陈丹琦团队最新论文:受GPT-3启发,用小样本学习给语言模型做微调,性能最高提升30%
共同一作之一为清华特奖得主高天宇
鱼羊
2021-01-04
小样本学习
普林斯顿
陈丹琦
高天宇
加载更多
热门文章
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
2024-09-14
“最强开源模型”被打假,CEO下场致歉,英伟达科学家:现有测试基准已经不靠谱了
2024-09-13
AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O
2024-09-14
Mobileye也放弃激光雷达了
2024-09-13
实测OpenAI最强模型o1:会做大学数理化,但弱智吧依然难解
2024-09-13