「进阶版」CS231n经典计算机视觉课来啦!李飞飞弟子出品,深度学习入门必备
计算机视觉和深度学习领域的经典课程
萧萧 发自 凹非寺
量子位 报道 | 公众号 QbitAI教授CS231n的Justin Johnson,在密歇根大学推出了一套「进阶版」计算机视觉课。
斯坦福最经典的计算机视觉课程CS231n——全称是面向视觉识别的卷积神经网络。
作为计算机视觉和深度学习领域的经典课程,CS231n由李飞飞团队打造,从课程设计到内容选择,都以入门为导向。
然而,自从2017年后,这门课程的录制版就没再更新过,在李飞飞的社交媒体下面,不时能听见网友吐槽的声音:
我们很喜欢您的课程,但这个领域发展得非常快,为什么2017年后的视频课就不再上传了?
现在,这门课程的「进阶版」录制视频来了,不仅覆盖CS231n的相关知识点,内容上也包括了最新的AI应用。
想要入门计算机视觉的小伙伴,可以收藏学习~(文末附视频链接)
那么,这门课程都讲了些什么?
22节课,入门计算机视觉
作为一门视觉识别课程,这门课主要是在了解计算机视觉的基础上,理解深度学习在这个行业的应用。
计算机视觉是一门研究机器人如何「看」的领域,其应用范围非常广泛,像自动驾驶汽车识别行人、图像搜索引擎自动分类等等。
而深度学习的出现,极大地提高了计算机视觉的应用效果。
这门课从理论到实践一键通,学习后,不仅能实现、训练和调试神经网络,还能掌握计算机视觉的前沿研究。
课程的重点在于解决图像识别的问题,为了达成这个目标,将会讲授反向传播算法、训练和微调神经网络的实用技巧。
这次更新的录制课,在内容和形式上都紧跟AI领域新潮流。
从模式到内容紧跟潮流
2017年的CS231n录制课视频一共只有16讲的内容。
这次Johnson教授推出的「进阶版」22讲内容,不仅细化了目前比较热门的生成模型(如GAN)的介绍课程,将它从一课时变成了两课时,而且还更新了Transformers、3D、视频处理等近年兴起的行业热门。
例如,在17课的3D视觉课程中,就介绍了将神经网络应用于3D结构的方法。
在这门课程里,不仅有关于3D数据的不同表示形式的讨论,还有对深度图、隐函数、点云等理论知识的介绍。
除此之外,对于3D形状这个新领域,神经网络好坏的度量标准也有所体现。
△ 3D视觉课程PPT
至于第18课的视频处理,课时则主要介绍了CNN在视频分类中的应用方法,以及视频识别中的通用技术等。
△ 视频处理课程PPT
不仅如此,这次的录制视频也更贴合在线课程的形式。
2017年的录制版CS231n课程,只有PPT界面显示、或是偶尔出现教授讲课的界面:
虽然也有PPT和音频同步,但如果想找某个想看的部分,就只能在滚动条上反复拖拉。
这套“进阶版”计算机视觉视频课,具体画风是这样的:
不仅更有现场代入感了,而且在导师讲课时,也能通过他的手势跟上知识点所在的位置。
每一节课、每一页的PPT都会呈现在视频下方,具体对某个知识点感兴趣、或是想要听哪一节的PPT,都可以直接点击视频观看。
是不是已经有些跃跃欲试、准备好投身知识的海洋了?
来看看下面的课程表吧。
课程一览
这套进阶版计算机视觉的课程表如下,对里面的部分知识点感兴趣的话,可以戳下方传送门进行学习~
课时1:课程介绍
课时2:图像分类
课时3:线性分类器
课时4:优化算法
课时5:神经网络
课时6:反向传播
课时7:卷积结构
课时8:卷积神经网络(CNN)架构
课时9:硬件/软件知识
课时10:训练神经网络(1)
课时11:训练神经网络(2)
课时12:循环神经网络
课时13:注意力机制
嘉宾讲座:对抗性机器学习
课时14:可视化和理解
课时15:目标检测
课时16:图像分割
课时17:3D视觉
课时18:视频处理
课时19:生成模型(1)
课时20:生成模型(2)
课时21:强化学习课时
22:回顾/总结
传送门:
网课链接:http://leccap.engin.umich.edu/leccap/site/jhygcph151x25gjj1f0
PPT下载:https://www.youtube.com/playlist?list=PL5-TkQAfAZFbzxjBHtzdVCWE0Zbhomg7r
- 首个GPT-4驱动的人形机器人!无需编程+零样本学习,还可根据口头反馈调整行为2023-12-13
- IDC霍锦洁:AI PC将颠覆性变革PC产业2023-12-08
- AI视觉字谜爆火!梦露转180°秒变爱因斯坦,英伟达高级AI科学家:近期最酷的扩散模型2023-12-03
- 苹果大模型最大动作:开源M芯专用ML框架,能跑70亿大模型2023-12-07