首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
陈丹琦
陈丹琦团队揭Transformer内部原理:另辟蹊径,从构建初代聊天机器人入手
数据集/架构/训练全都新来一遍
一水
2024-07-18
Transformer
陈丹琦
陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存
任何仅解码器架构模型都适用
丰色
2024-02-29
大模型
陈丹琦
陈丹琦团队新作:数据量砍95%,大模型性能更强了!Less is More
数据选择算法LESS
白交
2024-02-10
大模型
陈丹琦
陈丹琦ACL学术报告来了!详解大模型「外挂」数据库7大方向3大挑战,3小时干货满满
突破大模型自身瓶颈
萧箫
2023-07-10
大模型
数据库
陈丹琦
陈丹琦带队全员女将发新论文!提出AI消除性别偏见新方法,适用于任何模型 | EMNLP 2022
方法已开源
Pine
2022-12-08
开源
陈丹琦
陈丹琦带着清华特奖学弟发布新成果:打破谷歌BERT提出的训练规律!这个庆祝方式太学神了吧
进一步挖掘NLP大模型潜力
萧箫
2022-02-17
人工智能
清华
陈丹琦
陈丹琦团队最新论文:受GPT-3启发,用小样本学习给语言模型做微调,性能最高提升30%
共同一作之一为清华特奖得主高天宇
鱼羊
2021-01-04
小样本学习
普林斯顿
陈丹琦
高天宇
加载更多
热门文章
DeepSeek V3获竞技场最强开源认证!与Claude 3.5 Sonnet实测来了
2024-12-31
豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o
2024-12-30
赛迪报告:金融行业分布式数据库OceanBase占据第一
2024-12-31
LeCun:对人工智能末日的担忧被夸大了,Meta正在构建超级智能助手
2024-12-30
10秒极速出片!还有超多特效模版,国产视频模型又整新活了
2025-01-01