从事机器学习开发需要掌握哪些编程语言?内含资料福利

当前在机器学习、数据挖掘、数据分析领域,比较主流的语言有以下几种:
python,r,sql,c++
其他一些语言比如matlab,ruby等等其实也可以用。主要是类似python和r会有自己的一些比较好的package可以直接拿去用。每种语言都有自己擅长的领域,例如python 和r 数据分析是强项,java是工程性的语言,c++现在做底层并行等,至于机器学习需要什么语言,很大程度上取决于用机器学习来做什么?
笔者曾经听过国外的一门课程,需要尽量自己造数据挖掘的轮子,比如python,除了numpy以外的package是要尽量少用的。当时我自己做了个不完全的统计:我见过有四个用c++写项目的,而matlab、r都没有遇到。坚持用c++的多半是以后想做投行,高频交易或者量化金融,练习用c++。实际上做机器学习和数据挖掘用python,r毫无疑问是最主流的。其原因也容易理解:python和r有很多自带的package,这些package有很多,被封装的很好的代码;如果你善于利用官方文档,往往就可以用很短的语句和很简短的方法避免大量繁琐的代码工作。
而c++的意义更在于写底层优化的程序和系统。因为我们假如我们想要对代码的一些细节进行优化,这个时候用c++写底层优化系统,就是一个必须要做的事情了。
为了能够帮助大家更好地入门机器学习的内容,小编也为大家准备了python和r语言的学习资料,如果需要的话私信小编即可。