扫码关注量子位
开始反着卷了
图像、点云和音视频都支持
莫非CNN是个近视眼?
ViT就是比ResNet更难
超越SwinTransformer与ConvNeXT
CNN跟踪软组织运动
LeCun直呼架构之争愈演愈烈,ViT、EffNet作者都来一较高下
人类视觉更倾向于通过形状而不是纹理给物品分类
打破2D到3D的壁垒
新架构RepVGG同时结合了多分支架构和单路架构的优点
速度更胜一筹
不光上了色,还将像素提高了6倍以上
网友:心疼电脑
火到让网友喊“快开源”
多种任务共享一个Transformer 模块。
还有7万块的AI电冰箱
卷积神经网络(CNN),从识别数字开始
还引入了物理场景图和对应的PSGNet网络架构。