首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
大模型推理
小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law
扩展模型测试时计算比扩展参数可能更有效
西风
2024-09-11
大模型推理
谷歌
Q*项目公开发布!研究团队并非OpenAI
百倍提升小模型推理能力
西风
2024-06-25
大模型推理
昆仑万维
小米大模型提效新框架:训练最高提速34%,推理最高提速52%!Kaldi之父合作出品
文本也能像语音一样下采样
西风
2024-06-24
大模型推理
小米大模型团队
运行LIama2得8400万元!最快AI推理芯片成本推算引热议
英伟达GPU成本只需30万美元
白交
2024-02-21
GPU
大模型
大模型推理
芯片
英伟达
400万token上下文、推理再加速46%!最新开源方案升级MIT成果
来自爆火大模型系统开源社区
明敏
2024-01-08
AI加速
大模型推理
开源社区
加载更多
热门文章
为什么要推荐您参赛 | 第九届中国航空创新创业大赛报名中
2024-09-11
AMD放弃旗舰游戏显卡,专注AI,新统一架构挑战英伟达CUDA生态
2024-09-10
机器人也会系鞋带了!斯坦福团队赋予机器人新技能丨已开源
2024-09-11
通用端到端OCR模型开源,拒绝多模态大模型降维打击
2024-09-10
上海AI芯片独角兽启动IPO上市辅导:哈佛高材生打造国产GPU,已融资50多亿
2024-09-12