kaggle竞赛入门

我入门是看了范淼和李超的《python机器学习机实践-----从零开始通往Kaggle竞赛之路》

这本书需要掌握python语言,并熟练使用如下python包:pandas numpy matplotlib/seaborn sklearn

pandas是数据处理的一个库,通过http://www.cnblogs.com/chaosimple/p/4153083.html就可以学会个大概

numpy是处理多维数组的一个库,通过http://old.sebug.net/paper/books/scipydoc/numpy_intro.html也能学到个大概

matplotlib可以用来做可视化,通过http://old.sebug.net/paper/books/scipydoc/matplotlib_intro.html也能学到大概

我一般使用seaborn做可视化,这个库是matplotlib的高级封装,通过http://blog.csdn.net/qq_34264472/article/details/53814653可以快速入门

https://www.kaggle.com/benhamner/d/uciml/iris/python-data-visualizations这个是seaborn做可视化非常好的例子

sklearn的整体性入门,个人觉得看 范淼和李超的《python机器学习机实践-----从零开始通往Kaggle竞赛之路》就可以了

当然,上面这些都只是入门,要学会融会贯通,查看官网进行系统性学习是必须的;另外就是开始做项目,在看别人的代码,写自己的代码中熟悉各种语法和操作

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------

我学习东西,一般的思路都是先去找学习路径,经常上知乎。。

http://www.cnblogs.com/zhizhan/p/5826089.html这篇文章非常的好

总结下重点,

1,特征工程 

目前的机器学习一般把大多数时间都花费在数据处理上(包括特征工程);

数据处理前需要先了解数据的大概,所以需要可视化

https://mp.weixin.qq.com/s/Nt9xKQQZLyWBmU_bMEsbtg这个是讲的比较好的一个例子

2,模型融合

模型融合简单来说就是博采众长,分为bagging boosting stacking等

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------

有了上面的基础就算大概入门了,然后找几个kaggle的例子进行练手,同时看看别人都是怎么玩的

https://www.kaggle.com/kernels这里都是大神,按照各种类别或者自己喜欢的领域边看边写代码

看到下面的神图

参考自http://www.sv-europe.com/crisp-dm-methodology/ 

拜读起来!!!

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------

我的机器学习之旅,学了spark ml,看了几本理论(差不多忘了),看了公开课(吴恩达的),看了无数的文章,学会了大多数的调优

慢慢的有一种感觉,这玩意还不成熟,总有一天会有一个大一统的模型出来,可以通过网页配置进行特征工程和机器学习调优,最终形成一个平台。

后来,果然看到了一个类似的http://blog.kaggle.com/2016/07/21/approaching-almost-any-machine-learning-problem-abhishek-thakur/

突然感觉,哪天是不是要失业了。。

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------

深度学习貌似注重算法一些,为了不失业,感觉得不断丰富自己的武器库。加油加油!!

 

posted on 2017-06-01 16:07  Kernel_wu  阅读(661)  评论(0编辑  收藏  举报

导航