Data Science 推薦書單(持續更新)

1. Programming Collective Intelligence

学习数据分析、数据挖掘、机器学习人员应该仔细阅读的第一本书。作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码:

以机器学习与计算统计为主题背景,述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论。想把 paper 上的公式转变为可以运行的代码,这是件考验功力的事情这本书就是是修炼此种功力的武林秘笈之一。 最显著的特点是,实战性极强! 针对每个算法,他从头到尾演示了一个完整的实现过程:从获取数据,组织存储,到算法实现,加载运算,再到最后的结果的分析利用。

这本书的价值之一,就是让读者体会演算法的用处,原来我们生活中实际使用的热门服务-Amazon 、NetflixDel.icio.usLast.Fm、Google News ,就是书本上的知识建构起来的。

Programming Collective Intelligence

https://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325

集体智慧编程

https://www.amazon.cn/图书/dp/B00UI93JD8

2.Introduction to Data Mining

最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,比較偏向理論的內容(很多Data Science的授課教材)。

Introduction to Data Mining

https://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367

数据挖掘导论
 http://home.ustc.edu.cn/~jw1992/book/introduction_to_DM.pdf

3. The Elements of Statistical Learning

該書數學推導,理論系統很完備,結合後面的exercise用R語言自己聯繫一下,對於理解機器學習的基本方法很有幫助(這本神書我早就想買了!!)

The Elements of Statistical Learning
 
https://www.amazon.com/Elements-Statistical-Learning-Prediction-Statistics/dp/0387848576/ref=pd_ybh_a_32?_encoding=UTF8&psc=1&refRID=XATF1QB35FS09PRPSVG0

4. Data Points: Visualization That Means Something

分析出結果後的可視化。

数据之美:一本书学会可视化设计

https://www.amazon.cn/图书/dp/B00HV4DPWS

Data Points: Visualization That Means Something

https://www.amazon.com/Data-Points-Visualization-Means-Something/dp/111846219X/ref=sr_1_1?s=books&ie=UTF8&qid=1498689029&sr=1-1&keywords=Data+Points%3A+Visualization+That+Means+Something

One clap, two clap, three clap, forty?

By clapping more or less, you can signal to us which stories really stand out.