Data Science 推薦書單(持續更新)
1. Programming Collective Intelligence
学习数据分析、数据挖掘、机器学习人员应该仔细阅读的第一本书。作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码:
以机器学习与计算统计为主题背景,述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论。想把 paper 上的公式转变为可以运行的代码,这是件考验功力的事情这本书就是是修炼此种功力的武林秘笈之一。 最显著的特点是,实战性极强! 针对每个算法,他从头到尾演示了一个完整的实现过程:从获取数据,组织存储,到算法实现,加载运算,再到最后的结果的分析利用。
这本书的价值之一,就是让读者体会演算法的用处,原来我们生活中实际使用的热门服务-Amazon 、NetflixDel.icio.us 、Last.Fm、Google News ,就是书本上的知识建构起来的。
Programming Collective Intelligence
https://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325
集体智慧编程
https://www.amazon.cn/图书/dp/B00UI93JD8
2.Introduction to Data Mining
最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,比較偏向理論的內容(很多Data Science的授課教材)。
Introduction to Data Mining
https://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367
数据挖掘导论
http://home.ustc.edu.cn/~jw1992/book/introduction_to_DM.pdf
3. The Elements of Statistical Learning
該書數學推導,理論系統很完備,結合後面的exercise用R語言自己聯繫一下,對於理解機器學習的基本方法很有幫助(這本神書我早就想買了!!)
The Elements of Statistical Learning
https://www.amazon.com/Elements-Statistical-Learning-Prediction-Statistics/dp/0387848576/ref=pd_ybh_a_32?_encoding=UTF8&psc=1&refRID=XATF1QB35FS09PRPSVG0
4. Data Points: Visualization That Means Something
分析出結果後的可視化。
数据之美:一本书学会可视化设计
https://www.amazon.cn/图书/dp/B00HV4DPWS
Data Points: Visualization That Means Something