首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
大模型架构
非Transformer架构新模型爆火,从第一性原理出发,MIT CSAIL衍生团队打造
基于液态神经网络
西风
2024-10-01
AI
大模型架构
多亏Transformer,Mamba更强了!仅用1%计算量达新SOTA
Mamba作者领衔
明敏
2024-08-22
Mamba
大模型架构
加载更多
热门文章
开源Llama版o1来了,3B小模型反超80B,逆向工程复现OpenAI新Scaling Law
2024-12-17
宇树机器人强化学习代码全面开源,训练到仿真和实操手把手教学
2024-12-17
Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法
2024-12-15
Kimi版o1实装上线,这里是我们的一手测试↑
2024-12-16
GPT-4o数学能力跑分直掉50%,上海AI Lab开始给大模型重新出题了
2024-12-18