扫码关注量子位
训练集甚至都不需要高精度标签了
论文登上Nature
没错,就是纯MLP架构
谷歌AI伦理研究员事件风波未平
预训练速度可达T5的7倍
论文数量太多以至于只有机器才能全部读完
极致利用1024个TPU