「进阶版」CS231n经典计算机视觉课来啦！李飞飞弟子出品，深度学习入门必备

萧箫 2020-08-12 14:23:44 来源：量子位

计算机视觉和深度学习领域的经典课程

萧萧发自凹非寺
量子位报道 | 公众号 QbitAI

教授CS231n的Justin Johnson，在密歇根大学推出了一套「进阶版」计算机视觉课。

斯坦福最经典的计算机视觉课程CS231n——全称是面向视觉识别的卷积神经网络。

作为计算机视觉和深度学习领域的经典课程，CS231n由李飞飞团队打造，从课程设计到内容选择，都以入门为导向。

然而，自从2017年后，这门课程的录制版就没再更新过，在李飞飞的社交媒体下面，不时能听见网友吐槽的声音：

我们很喜欢您的课程，但这个领域发展得非常快，为什么2017年后的视频课就不再上传了？

现在，这门课程的「进阶版」录制视频来了，不仅覆盖CS231n的相关知识点，内容上也包括了最新的AI应用。

想要入门计算机视觉的小伙伴，可以收藏学习~（文末附视频链接）

那么，这门课程都讲了些什么？

22节课，入门计算机视觉

作为一门视觉识别课程，这门课主要是在了解计算机视觉的基础上，理解深度学习在这个行业的应用。

计算机视觉是一门研究机器人如何「看」的领域，其应用范围非常广泛，像自动驾驶汽车识别行人、图像搜索引擎自动分类等等。

而深度学习的出现，极大地提高了计算机视觉的应用效果。

这门课从理论到实践一键通，学习后，不仅能实现、训练和调试神经网络，还能掌握计算机视觉的前沿研究。

课程的重点在于解决图像识别的问题，为了达成这个目标，将会讲授反向传播算法、训练和微调神经网络的实用技巧。

这次更新的录制课，在内容和形式上都紧跟AI领域新潮流。

从模式到内容紧跟潮流

2017年的CS231n录制课视频一共只有16讲的内容。

这次Johnson教授推出的「进阶版」22讲内容，不仅细化了目前比较热门的生成模型（如GAN）的介绍课程，将它从一课时变成了两课时，而且还更新了Transformers、3D、视频处理等近年兴起的行业热门。

例如，在17课的3D视觉课程中，就介绍了将神经网络应用于3D结构的方法。

在这门课程里，不仅有关于3D数据的不同表示形式的讨论，还有对深度图、隐函数、点云等理论知识的介绍。

除此之外，对于3D形状这个新领域，神经网络好坏的度量标准也有所体现。

△ 3D视觉课程PPT

至于第18课的视频处理，课时则主要介绍了CNN在视频分类中的应用方法，以及视频识别中的通用技术等。

△ 视频处理课程PPT

不仅如此，这次的录制视频也更贴合在线课程的形式。

2017年的录制版CS231n课程，只有PPT界面显示、或是偶尔出现教授讲课的界面：

虽然也有PPT和音频同步，但如果想找某个想看的部分，就只能在滚动条上反复拖拉。

这套“进阶版”计算机视觉视频课，具体画风是这样的：

不仅更有现场代入感了，而且在导师讲课时，也能通过他的手势跟上知识点所在的位置。

每一节课、每一页的PPT都会呈现在视频下方，具体对某个知识点感兴趣、或是想要听哪一节的PPT，都可以直接点击视频观看。

是不是已经有些跃跃欲试、准备好投身知识的海洋了？

来看看下面的课程表吧。

课程一览

这套进阶版计算机视觉的课程表如下，对里面的部分知识点感兴趣的话，可以戳下方传送门进行学习~

课时1：课程介绍
课时2：图像分类
课时3：线性分类器
课时4：优化算法
课时5：神经网络
课时6：反向传播
课时7：卷积结构
课时8：卷积神经网络（CNN）架构
课时9：硬件/软件知识
课时10：训练神经网络（1）
课时11：训练神经网络（2）
课时12：循环神经网络
课时13：注意力机制
嘉宾讲座：对抗性机器学习
课时14：可视化和理解
课时15：目标检测
课时16：图像分割
课时17：3D视觉
课时18：视频处理
课时19：生成模型（1）
课时20：生成模型（2）
课时21：强化学习课时
22：回顾/总结