首页
资讯
数码
智能车
智库
活动
MEET大会
AIGC
扫码关注量子位
大模型加速
推理效率提升超200%,易用性对齐vLLM,这款国产加速框架啥来头?
运营成本最高降低 64%
白交
2024-09-18
大模型加速
腾讯云
用上这个工具包,大模型推理性能加速达40倍
满足LLM更多场景应用需求
白交
2023-12-01
CPU
大模型
大模型加速
英特尔
PyTorch官方认可!斯坦福博士新作:长上下文LLM推理速度提8倍
已在64k CodeLlama上通过验证
丰色
2023-10-17
Transformer
大模型加速
加载更多
热门文章
开源Llama版o1来了,3B小模型反超80B,逆向工程复现OpenAI新Scaling Law
2024-12-17
GPT-4o数学能力跑分直掉50%,上海AI Lab开始给大模型重新出题了
2024-12-18
宇树机器人强化学习代码全面开源,训练到仿真和实操手把手教学
2024-12-17
大模型是新的数据库!蚂蚁开源负责人王旭:应用开发新范式,新一代LAMP正在形成 | MEET 2025
2024-12-18
Scaling Law不总是适用!尤其在文本分类任务中,vivo AI Lab提出数据质量提升解决方法
2024-12-15