悟道與無 — 知識與量子力學 (唬

位子要換腦袋

我剛開始在某基金會工作時,其實對該做什麼,怎麼做真的毫無頭緒。所以自己去買了許多書來看,來學(這是我解決問題的方法)。只是應該要看什麼書?好像也沒人可以跟說。所以只好捉了幾個方向自己上 taaze/博客來 找關鍵字,開書單。

當時只知道,我應該要有能力自己帶一個完整的專案(帶人?或至少教人家怎麼做事),我要知道政府在開放資料相關的法令有哪些,我需要知道資料處理應用,包含網路工具,與自己寫程式的不同可能選項(我不是個寫程式很強,但是至少能寫程式處理一些小問題的人)。

也就是,我花了很多時間來學習,要談開放資料,這一個我之前完全不認識的領域的東西,我該提升的能力會是什麼。而在每日的學習中,我很確定一點的就是,我每天對開放資料的理解,都比前一天多一點,都會看到更多一點不同的重點,都會發現更多的東西和這相關。所以在我的演講中,我常常用這當開場:

在 2010 年我開始碰開放資料時,我對開放資料的認知有三個。而這三個認知後來都發現是有問題的

  • 第一個是開放資料有很大經濟價值,把資料整裡一下拿出來賣應該很多人要!
  • 第二個是政府是個大黑箱,我們要用開放資料來揭露這個黑箱
  • 第三個是開放資料是需要很高技術門檻

第一個,開放資料真的有很大經濟價值嗎?或許有,但是絕對不是現在這樣的型態。開放資料的價值在於所有人都可自由取得,應用,分享。所以他的經濟價值會是什麼?絕對不是在資料本身。但是當我們談開放資料時,很多人想像的價值都是資料本身(甚至資料的買賣)。這個問題我要到一兩年後才開始發現。開放資料只是一個基礎,要談他的價值,應該要問的是在這樣的基礎上面,我們能建構怎樣的服務。使用者(消費者)要的是更好的服務,要的是完整的資訊,回答他們問題的資訊。而當所有人都可取得一樣的資料時,重點應該是如何做出服務的差異性。

從這問題,其實就可延伸去談,到底開放資料該怎麼做,才能讓資料的價值最大化?也就是資料的實用性能最大化。然後就會發現,我們談的開放資料,不是只有「開放」,而是更多會和「資料」相關的領域,甚至包含政府內的行政程序與法令。這不只是資料的管理,更進一步我們需要談的是資料的治理。

第二個,政府是個大黑箱。我必須承認一點,這個政府在很多資訊揭露上做的依然非常不足。對,資訊揭露,不是開放資料!但是當初推動開放資料時,除了經價價值以外,雖然很多人都會提到民主透明,因為 Obama 在美國的開放政府與開放資料政策。但是,要談民主透明,其實最重要的是政府資訊的揭露,然後才是開放資料!開放資料是是協助我們在資訊揭露的基礎上,透過資訊處理的能力,更有效的去解讀,分析,淬取龐大的資訊(內容)中我們需要的資訊。所以只談開放資料,卻不談更基礎的政府資訊揭露(政府資訊公開法),那結果當然亂七八糟,這就是現在推開放資料的問題之一:許多人對資料,資訊的差異認知錯亂

另一個問題則是,我們說政府是黑箱的同時,又有多少人真的能有效的去處理政府已經「公布」的資訊,然後進一步針對這些資訊去作要求?也就是,我們一邊說政府是個黑箱的同時,另一邊卻將眾多政府公布的文件與內容視而不見。這邊的問題不是有沒有,而是能不能有效,快速的處理這些內容!這邊的問題是,我們要如何培養懂資料,用資料的能力。所以在 2013 我開始推資料新聞學。當時還沒人談什麼資料素養,更不用說什麼資料科學了。

第三個,要懂資料,使用資料是有很高的技術門檻。我所面對的對像都是非理科或是對資訊科學沒有什麼概念的人。所以我發現要跟他們談開放資料,談資料的應用,其實是非常困難的事情。但是困難的主要原因也是我自己對這個領域到底應該要學習哪些技術,需要哪些知識也不是很清楚。

雖然今天我可以侃侃而談許多資料分析的工具,應用程式,方法,演算模式,一堆有的沒的名詞等。但是在當時這些對我來說都是有點遙遠,也覺得很難去讓一個非理工背景的人理解的概念。但是我又相信一件事情,開放資料應該是要讓所有人都可直接使用。不是只有懂資料科學的人才可使用的!所以當時的我真的不知道該怎麼去推開放資料。這是一個如此專業專門的學科(但是又沒人專門去談這領域的東西)。

2010 到現在,2017 — 我碰開放資料,談開放資料,去幫人上課教開放資料已經六年多。一直到今天,我依然會說我對開放資料的理解和認識,每天都會有新的東西出現,每天都會有機會學到更多。但是我也有機會開始建立我對這個領域的「知識模型」,這個模型包含了法令規範,組織運作程序,到資料標準與技術等不同的模組。同時,這個模型也包含了問題解決的程序,如何從問題意識(datajam)到問題處理(服務),到資料需求盤點,到最終的執行產出,一整套完整的執行模式與架構。

我認為我的這套「知識模型」還有很大的進步空間,還有許多地方需要更好的補強。但是面對現有的問題,我的確可以以這套「知識模型」套上來嘗試回答與找出答案。所以當我說「 我已經可以提出一整套作法,讓台灣政府的開放資料,在 3 年後,所有可開放,可公布上網的資料,至少 80% 都可變成開放資料!同時是嵌入現有作業流程的。機關需要改變配合的將會是最小化。而且是一次處理所有機關部門的問題!不是只是一小塊一小塊的去處理! 」。其實就是架構在這樣的知識模型上,自然而然會導出的結果。如果我們無法全面 reset 整個政府的資訊系統。那應該先處理的會是什麼?而又該如何有效的處理這樣的問題?答案其實真的很簡單也很直覺。同時,這個解答也不是只有我提出,而是國際上 W3C 或是許多跨國大企業與組織都已經在做的東西。我提出時,真的不知道原來其他人早有類似的想法。就好像許多對資料的想像和觀念,都是在我開始仔細看 linked data 時,才發現我的許多疑問與想法,都在 linked data 上有人提出類似但更完整的解答。

所以這是不是一套太過完美?或是只是我自己作夢?

換個位子真的要換腦袋。這是我的答案。因為在不同的位子上,你能看到的東西會完全不一樣,你所需要承擔的責任與任務也會不一樣。你對事情的理解與應該提出的解答也就要不一樣。如果看不到這些,那或許只是因為你還不到這個程度而以。

而有些人知道如何舉一反三,另外的人需要腳踏實地一步一步自己走一回。這裡面沒有誰比較好或不好。就是悟道有先後,大家都不一樣而以。但是,對自己搞不懂的東西,或許謙虛一點比較好

為什麼要扯量子力學?因為我覺得啊,量子力學和悟道很像啊 — 都是有不同門檻 (energy level) 要跨過去,而不是一個連續不斷的過程。這是不是唬爛?我不覺得啊,哈哈

圖片 : https://nystudio107.com/blog/json-l...