Reddit大热,伯克利PPT带你入门机器学习:方法、知识点全面覆盖
有一份机器学习PPT,在Reddit论坛获得了墙裂欢迎,一日之间揽下400分。
这份PPT来自伯克利CS 189/289课程,从线性代数复习,到线性回归、随机森林、Boosting……各种方法与其中的知识要点全面覆盖,简洁明晰。
在这些词条里,任选一个往下划,都会发现许多宝藏。
比如,下面就是高斯判别分析 (GDA) 。里面讲到了生成模型,模型里的假设,以及不同方法之间的对比。
前往课程主页,就可以把课件与各种配套资料搭配食用;伯克利还把课件的源码放上了GitHub。
那么,一起来观赏一下这份入门佳品。
“给你指了条明路”
作为一门友好的基础课,当然要从零开始。
Introduction章节,先介绍了各式各样的机器学习任务:回归、分类、密度估计、降维……
又介绍了监督、半监督、无监督、强化学习,这些不同的学习方式。
然后,一张美好的地图在眼前展开,这是用scikit-learn玩转各种任务的路线图。
从原点出发,按图索骥,就能到达希望的终点。
比如分类任务上,可能用到支持向量机 (SVM) 。
这时候,翻一下支持向量机的词条:
它会告诉你,逻辑回归解决不了问题,支持向量机或许可以。
原理,用法,以及通常拿来做怎样的任务,都在这里了。
再比如,决策树/随机森林,也是分类方法。
方法背后的理论,用到的split函数,贪心算法等等,这里都会娓娓道来。
如果感觉PPT的介绍太简约,还可以搭配168页课程笔记食用。
笔记一共有23章,课件上的每个词条,几乎都能找到相应的章节。比如,最后一个词条Boosting,就对应笔记里的第24章。
打开这个章节,任意翻到一页:
文字详尽,人类易懂,插图优雅。
从权重初始化开始,Adaboost的每一步都有介绍。
另外,为什么要用Boosted Tree,也是条分缕析:一是快,二是不用搜索超参数,三是偏差方差权衡容易做……
这样一来,刚入坑的你,也可以愉快地学习了。
去吧,皮卡丘
除了PPT和笔记之外,课程主页上还有作业和考卷,可以用来检测你的学习成果。
那么,现在就开始学习吧。
PPT传送门:
https://csinva.github.io/pres/189/#/
CS 189/289课程笔记:
https://people.eecs.berkeley.edu/~jrs/papers/machlearn.pdf
CS 189/289课程主页:
https://people.eecs.berkeley.edu/~jrs/189/
GitHub传送门:
https://github.com/csinva/csinva.github.io/blob/master/_notes/ref/ml_slides/slides.md
— 完 —
- 马云正式卸任后,阿里巴巴开盘跌0.87%2019-09-10
- AI独角兽云知声,已完成一期科创板IPO辅导2019-10-17
- 亚马逊在华拓展云计算团队,挑战阿里巴巴和腾讯2019-10-16
- IDC:今年上半年中国公有云服务市场规模达54.2亿美元2019-11-07