從 OKFN Global Open Data Index 排名
看臺灣開放資料推動的現況與未來

OKFN Global Open Data Index #GODI15

“What is the state open data around the world?”(世界上各國開放”政府”資料的狀況為何?)

英國開放文化基金會在其所主辦的全球開放資料指數 (Global Open Data Index — #GODI15) 網站上,開宗明義指出這個評比想要回答的問題:到底全世界各國在推動政府開放資料表現的如何?那些國家做的比較好?哪些資料集是各國優先開放出來的?從應用技術與法規授權上來看,哪一部分又會比較困難,挑戰比較大? (http://index.okfn.org/methodology/)

為了回答這個問題,從 2013 開始,每年 OKFN 都會舉辦一次各國開放資料狀態評比。每年的評比的內容與方式會依照往年的回饋而做調整。例如相較於去年,今年就取消了將交通運輸時刻表列為主要評比項目之一。因為各國的大眾運輸在運作上可能是由私人公司所管,評比政府在這可扮演的角色可能造成標準不一致的狀況。同時今年也新增了四個類別的資料集(政府採購與標案,飲水品質,氣象預報,土地權狀)和一個不列入計算項目的資料集(醫療品質 — 可能會列入明年的計算)。

在這需要特別說明的是,雖然 #GODI15 要評比的是各國政府在資料的開放性 (Openness),但是為了執行的便利性(由各國志工填寫問卷,再由一審查小組確認)#GODI15 在評比的範圍上刻意侷限在資料的「公佈」 (publishing)。相較於 Web Foundation (Open Data Barometer 評比的執行機構) 目前與其他非營利組織共同建置的「通用性開放資料評估框架」 (The common open data assessment framework) 草案相比,在後者提出的四個評估的面象中 (Context, Data, Use, Impact) 中,#GODI15 將重心放在 Data (資料內容與品質) 這一部分。

也就是,只要評比的政府資料是以原始資料,開放格式,開放授權等方式公佈,就可滿足評比的需求。並以此來衡量政府資料的「開放性」 : 資料是否存在,是否數位化,是否為公開資訊,是否可免費取得,是否能網路線上取得,是否採機器可讀格式,是否完整提供(非再處理過或節錄的資料),是否採用開放授權,和是否定期更新並提供最新版本。在這評分的標準下,我們其實可以從中看到早在 2007 年就由 Lawrence Lessig (Creative Commons 創辦人) 與其他開放政府倡議者共同提出的「開放政府資料八大原則」 (The 8 Principles of Open Government Data : http://opengovdata.org/) 的影子,例如對於資料的完整性,近用性,即時性,免費等原則。

透過 #GODI15的評比,我們的確對於被評比的項目在「開放」的程度上能有一可被衡量比較的標準。而針對評比的項目內容,#GODI15一共選擇了13類的資料集作為評比的基準,並針對每一類資料集各制定了至少三個要求以期降低在資料集評比時可能出現的混淆與不清。

例如在全國統計資料 (National Statistics) 中,就要求開放的資料集需包含

  1. 全國 GDP 數據,至少每季更新一次,
  2. 失業人口統計數據,至少每月更新一次,
  3. 全國人口統計,至少每年更新一次。

在政府支出 (Government spending) 這一資料集內,則要求列出

  1. 每一筆支出紀錄,
  2. 支出的時間,
  3. 收款的廠商或單位名稱,
  4. 支出金額,
  5. 每個月要更新一次。

#GODI15 — 臺灣 No.1

在今年的 #GODI15 評比中,臺灣從前年的 36 和去年的 11 一下就跳到第一名。根據 OKFN 的臺灣大使徐子涵所言 (GLOBAL OPEN DATA INDEX 2015 — TAIWAN INDEX — http://blog.okfn.org/2015/12/16/global-open-data-index-2015-taiwan-index/),臺灣在政府資料開放的成績上突飛猛進主要是因為三個重要原因 :

  1. 臺灣是個尊重言論自由的國家。而這個環境促使臺灣在推動政府資料的開放上成為很重要的助力。不只是在新聞媒體上臺灣享有高標的言論自由權,從公部門到私人組織與企業,臺灣在政府公開資訊的運用上也比起鄰近其他國家更為發達。臉書的高普及率也讓民間對於政府開放的資料(資訊)能有快速的回饋從而建立一個良性的循環。
  2. 從政府的角度來看,今年最重要的改變就是中央建立了政府開放資料諮詢小組,並在小組中要求聘僱1/3的外部委員。而這讓政府機關對於OKFN與 #GODI15的評比有進一步的瞭解和重視,從而影響了臺灣政府在開放政府資料的政策制定與執行。
  3. 最後一點則是因為台灣政府試著將一些可能包含個資與隱私爭議的資料集開放,例如健保資料。這項政策在執行時引起了許多關注人權的民間團體的抗議,但也從而引起更多民間團體對資料開放這一議題的關注。

根據徐子涵的文章所言,這一切都是臺灣因此在短短一年內快速衝上這次評比第一名的寶座,同時在政府資料開放的整體表現上進步神速的主要原因。但是以一名政府開放資料長期參與者的角度來看,這三點完全無法解釋與說明為什麼臺灣會在這次#GODI15 上有如此耀眼的成績。一樣從政府內,外,與協力三個方向來看,這次的成績主要原因有三(不是上面這三個):

  1. 政府高層的全力支持(這是因,不是果)- 從毛治國院在去年年底的政策宣示(毛氏三箭 : 開放資料,群眾外包,巨量資料分析),到整個政策的最高負責人為行政院副院長,並積極結合蔡玉玲政委與國發會來由上對下推動才是這次成果最重要的原因。
  2. 更清楚的政策與法令規範 — 從年初到現在,由蔡玉玲政委與國發會主導,結合民間社群的力量,建立了資料分級規範,一部符合國際標準的開放資料授權規範,以 #GODI15 為指標從質與量上來推動政府資料的開放,讓各部會與機關在政策的執行與推動上阻力能降到最低,同時目標清楚可行。這是執行上重要的關鍵。
  3. 更開放的態度與文化 — 從年初張副院長主動邀集民間開放資料社群與團體的聚會,直接透過網路轉播與回應等方式,建立與民間對話的機制與模範,到 vTaiwan,Join 等平台的運作等。雖然政府還是無法一下子 180度大轉彎,但是整體的心態等都開始調整並稍微開放,與民間的對話與合作關係也逐漸可能,可行。更多成功的範例也讓政府對資料開放後可產生的效應與成果能更有感覺。這是讓一切持續發展下去最重要的步驟。

因此,我們可以看到,這次台灣在評比中拿下第一名,或許一開始只是因為這是少數國際上臺灣可列入排名的評比。但是經過一整年的努力,其實際影響的層面不只是表面上的數字,而是更深層的政策落實與態度的轉換。

滿分但是不完美

在這次的 13 項資料類別的評比上,拿到滿分的項目包含了國家統計資料,政府預算資料,政府法令資料,政府採購與標案資料,選舉資料,全國地圖資料,污染源監測資料,公司企業登記資料等八項。因為資訊彙整問題而沒拿到滿分的則有,氣象預報(風向資料未整合進來),自來水品質資(一個月更新一次,非一個禮拜一次),郵遞區號與行政區邊界資料(郵遞區號與行政區邊界資料需進一步整合)等三項。最後是目前欠缺或是因為法令問題無法提供的資料類別,土地所有權(個資與隱私問題)和政府支出(只有政府預算決算,缺乏細項資訊)等兩項。

在滿分的項目,除了政府採購與標案 (Procurement tenders) 為新加入的項目,其他幾項都是去年即已列入評比的項目。其中以國家統計資料 (50% 到 100%) 與選舉資料 (45% 到 100%) 等成長最為顯著。但是如果我們仔細檢驗其他滿分的項目,就會發現:

  1. 全國法規資料庫所使用的授權條款為「全國法規資料庫公開資料使用規範」。在內容上雖然與開放資料定義符合,但是用字上卻稱為「公開資料」。
  2. 政府標案與採購 (Procurement tenders) 目前連接到的資料集是「與政府機關有巨額採購,且在履約期間之廠商名單」 (http://data.gov.tw/node/7264) — 這一部分應該屬於政府支出而不是該資料類要求的 : 完整的政府電子採購資料下載。
  3. 企業公司登記的部分,目前評比提供的是每月更新的登記資料。而不是完整,所有的有限企業在台灣的登記資料。
  4. 在政府預算的部分,依照評比項目的要求,應該要提供每一部分預算的說明文字。但是在目前提供的預算書中,我們並無法看到這些說明文字。

綜整上述各項說明,就可發現在滿分的項目,還是有將近一半其實是可能有爭議。雖然拿到滿分,但是還是有不少地方是需要再加強或是修正一下的。

在剩下的評比項目中,有兩項(自來水品質,天氣預報)均得到 90% 將近滿分的成績,另一個關於地理地點的資料集(行政區邊界與郵遞區號)。依照OKFN 網站上的說明,這幾項的缺失分別為 :

  1. 自來水品質 : 檢驗成果需要至少每週更新一次
  2. 天氣預報 : 缺少風力風向資料(在另外的檔案內)
  3. 地理地點 : 缺少郵遞區號與行政區邊界的整合 (分屬兩個不同資料集)

這幾個資料類別,除了自來水品質我們不確定是否每週都有(但是依照邏輯,這應該是每天都會有更新的資料集吧)。剩下的兩個都是已經有,但是「還不夠好」,因為資料被分散放在不同檔案內。而這一點正是我們該回過來檢視,目前在 data.gov.tw 上已經開放與公布的資料集,有多少是應該重新合併或整合的。有多少是可以以 Grouping (群組)的概念放在一起,來提升資料集本身的價值與實用性。但這一點也似乎比較偏向從使用者角度來思考資料集的開放性,而非從政府機關的資料管理與產出來規定。甚至進一步,在所謂完整下載 (bulk download) 的要求下(資料在單一資料集內,非分散儲存),這正是我們在談資料品質與資料的「適用性」時會須要去釐清與說明的。

最後兩個只得到 10% 分數的資料類別分別為地籍資料與政府支出細項。關於地籍資料的部分,目前內政部有提供查詢的功能。但因為個資保護等法令,在未來很可能依然無法符合 OKFN 評比要求來提供資料的開放。至於政府支出的細項。相信會是這所有資料集裡面更大的挑戰。但是這也讓我們不僅思考,目前政府所公佈的預算與決算資料,在缺乏詳細的說明之下(部分資訊有時會放在備註一欄),這些資料(資訊)到底是給誰看的?還是只是因為政府資訊公開法的要求,所以才會公佈上網?

第一名之後的衛冕戰

依照慣例,OKFN 應該會針對下一次的評比資料項目再做修正。就如今年的 13+2 項評比內容是在今年六月左右透過網路上的意見徵詢與討論 (WHAT SHOULD WE INCLUDE IN THE GLOBAL OPEN DATA INDEX? FROM REFERENCE DATA TO CIVIL SOCIETY AUDIT. http://goo.gl/Ky8FRK)。然後在八月時提出評比的詳細資料類別與內容 (THE 2015 GLOBAL OPEN DATA INDEX IS AROUND THE CORNER — THESE ARE THE NEW DATASETS WE ARE ADDING TO IT! http://goo.gl/kaV8Ii)

可預期下一年度的評比也應該會在明年六月左右起跑。面對下一波可能更多的資料類別,和對現有資料類別更深入的要求,在此我們建議政府如果想持續保持在政府開放資料領先的地位,應主動出擊,直接參與 OKFN 發起的討論,藉此機會,清楚說明在台灣我們因為法令的關係,在面對如地籍資料的開放時可能要考慮的重點。同時也可針對目前已經開放的資料集,其完整下載的必要性做進一步的討論(如,氣候預測資料到底該如何開放?全部塞進同一個資料集內?或是依照需求,依照條件,以地域或時間的方式,分拆為多個但是同一群組的資料集和關連性 — 如建立資料混搭時需求的 key)

另外,針對今年已經取得高分的資料類別,可預期的是明年 OKFN 的評比應該會針對各類別的資料集提出更多在內容上的要求,例如全國的統計數字,除了今年的 GDP,失業率或人口統計等,是有機會加入更多發展與經濟指數。而這些資料我們相信絕大部分都已經放上 data.gov.tw 網站以開放資料的形式公佈。但是這些資料的整合度(不同資料集之間的混搭或資料交換的可能性)將會需要從現在就開始思考與處理。我們將需要更多關於資料內容的標準與規範。

在 2015 年,臺灣在政府資料開放的推動上最大的收穫不是目前在data.gov.tw 上這一萬兩千多筆開放資料集,或是 #GODI15 評比的第一名,而是我們正在逐步的將基礎但重要的建設一一建立起來。接下來我們會需要更多的標準與規範,繼續協助各部會降低將政府資料(資訊)轉為開放資料的門檻。同時也應持續推動開放的文化,讓政府機關與民間有更好的對話機制,並提升資料被使用的可能性。以此來協助政府瞭解開放資料的優先順序與方向。

Like what you read? Give wHisKy Chang a round of applause.

From a quick cheer to a standing ovation, clap to show how much you enjoyed this story.