2016/01/19~22 DSP資料科學冬令營心得分享

經過這四天資料科學營,接觸與學習到許多新的人、事、物。第一天的內容主要是分享資料呈現的方式、探索性資料分析還有R studio的基本介紹。第二天的內容主要是R的語法教學還有基本使用方法以及小練習,但是因為這一天要去尋找未來兩年的Boss(約了幾位研究所老師面談),所以只有參與到最後一小時的討論以及報告。因為缺少第二天的基礎,所以第三天覺得有點吃力,晚上的時間就全部用來熟悉R語言了。第四天也是最後一天,我們的分析主題經過多次修改與討論最後決定是「你所不知道有關所得的事─高雄篇」,簡單說就是分析高雄市的所得高低與捷運的分佈有沒有相關性。雖然最後結果顯示兩者並沒有很大的相關性,不過還是出現一些滿有趣的解釋,像是:有一區塊的機會中獎所得特別高,我們就將其解釋為想要中獎的人就去那邊買張樂透吧!根本走搞笑路線啊XD

我們的組別成員分別來自靜宜資管、資工、統資、中興資工、台師大(忘記她的系所了@@)。裡面特別要提的就是統資還有台師大這兩位,統資的同學感覺對於數字的分析較敏感,台師大的同學則是對很多領域有涉略,而且她還出過國,感覺見識就是比較廣。有這個機會與非資訊領域的人接觸、合作、了解他們的思維實在是相當有趣且珍貴的體驗。

目前為止在資訊領域學到的東西都是比較偏向技術性與操作性,也就是有一個想法我們要如何把它做出來,或者是去思考它是怎麼被實現出來的,其原理是什麼。但是資料科學領域除了要熟悉分析的工具外,還要了解將要分析的領域之背景知識,其數字背後代表著什麼現實生活中的意義,我認為這些都不是單單在網路上搜尋就可以輕易得到答案,更需要的是長時間的觀察與研究。課程中提到「Data Mining就像掏金一樣,撈起來大部分都是沒用的泥沙,但是那一點點的金沙卻是彌足珍貴的」我想這就是資料探勘或者資料科學如此吸引人的原因吧!

最後附上朋友對於這四天的詳盡整理與心得分享~
2016 DSP資料科學冬令營 第一天

2016 DSP資料科學冬令營 第二天(上午)

2016 DSP資料科學冬令營 第二天(下午)

2016 DSP資料科學冬令營 第三天

2016 DSP資料科學冬令營 第四天