淺談資料格式 — 結構化與非結構化資料
進入大數據時代,資料成為挖掘商機的礦脈,對資料的管理不夠,想要利用大數據來開創新生意等於緣木求魚。請思考一下,自己公司有刻意收集甚麼樣的資料嗎?有善待貯存下來的各式資料嗎?有專人管理嗎?還是坐看它們放在倉庫中,隨著歲月崩解殆盡?
在過去,許多企業認為資料庫裡的銷售資料、生產資料、財務資料…等量化資料,特別具有價值。事實上,真的是如此嗎?我有個朋友,十多年前就開始在網路上,架設網站收集網友關於美妝的討論資料,而網友的留言都是一些文本(Text)資料,沒有固定格式,也不容易發掘出什麼內容來。當年他的員工就曾經問他,收攬這些資料到底要幹麻…