資料科學領域、非 CS 找工作,本來就在困難模式,今年畢業恰逢疫情襲來,瞬間變成地獄模式,簡單記錄一下一些統計資料(上集),跟可能會有幫助的小技巧(下集)。

求職期間:2019 年 8 月開始修改履歷,9 月 11 日投出第一份申請,2020 年 9 月 4 日拿到第一份口頭 offer。

總申請職位數:不含 Linkedin、Indeed 上直接投遞,在公司官網上申請的數量是 526 件,其中 24 件是內推。估計 Linkedin、Indeed 直接投遞件數應該在 300 左右。

申請職稱及領域:Data Scientist (Analytics/Insight Track, Non-ML), Data Analyst, Business Analyst

聯繫家數:26 家。

聯繫方式 .. | 總數 | 進入下一關 | 拒絕
來信問問題 |.. 5..|……..2…..…|.. 3
線上測驗 …| ..9..|……..5 …….| ..2.. (2 未知)
人資 screen |.11..|……..7……..|..4
約技術面試|..1…|……..1……..|..0

在進入下一關的 15 家中:

結束方式 ………………………… | 數量
Technical Interview 後被拒………|..2
Hiring Manager interview 後被拒|...3
Onsite 後被拒……………………..|..5
人事凍結…………………………..|..1
Offer……………………………….|..1
拿到 Offer 後主動拒絕……………|..3

在進入下一關的 15 家中,其中可能比較是大家聽過的或被認為有潛力的公司有 Tesla, Visa, SurveyMonkey, Amazon, Convoy & Udemy。

收到拒絕信數量:204 封。(分母:526 封 Linkedin/Indeed 直接投遞的申請)表示有一半以上的公司發無聲卡(哭)

資料科學領域守備範圍很廣,每家公司的需求和考試重點不一樣。因為我對 ML 興趣跟經驗較缺乏,只投非 ML 的分析職缺,所以線上測驗最常考的是 SQL,接下來是機率和統計的基礎知識,以及一點點簡單的 Coding。

回家作業有時候是給定一個問題,用資料回答,大多會以「產品經理想做 XX 決定,想知道關於 OO 的資訊,你會怎麼建議?」的形式進行。有些則單純是給一組資料,找出需要清理的部分、異常資料並加以處理,最後報告這份資料能帶給我們什麼重要/有趣的資訊。

我後來摸索出一份自己的報告形式:

  1. 簡單總結資料概況
  2. 介紹需要清理的部分和異常資訊有哪些,我會怎麼處理,這些處理可能怎樣影響資料分析結果
  3. 幾張有趣的圖表介紹資料的亮點/回答作業詢問的問題
  4. 結論:哪部分的分析比較不牢靠、需要哪些資料可以補強、如果想知道更多關於 OO 的資訊,可以怎麼做

雖然技術都是早就會的,不過也真的是到很後期,才做出心得,把報告模板化。現在想起比較早交出的資料作業,都想找個地洞鑽進去⋯⋯。大家或許可以多找一些題目自行練習,才不會像我一樣因為經驗不足,錯過心儀的公司!


平權前夕.彩虹起義粉絲頁昨天釋出婚姻平權及性別教育兩案公投的連署人數分區統計表,這時候當然是立刻下載資料研究一番囉!

粉絲頁貼文的圖表,揭露了連署數量最多的幾個區域,聰明的大家當然也好奇,假如對照當地人口,到底是哪些地區的連署比例最高呢?

平權公投連署比例排名

先來看一下平權公投連署比例,大致上長怎樣:

圖1 鄉鎮市區平權公投連署比例分布圖

大概是落在 0.x%-6% 的區間,超過 6% 的鄉鎮市區非常少。

由於中選會還未公佈各區選舉人數,加上要和婚姻狀態、教育程度等變數一起觀察,所以這裡我用的概估投票人口數字,是來自內政部資料開放平臺的「15歲以上現住人口按性別、年齡、婚姻狀況及教育程度分」資料集加總而成。

大部分人口統計資料的年齡分組都是 5 歲為一組,但公投年齡已經下修到 18 歲,因此面臨了一個尷尬的狀況:可以由一歲一組的統計資料概算投票人口,但沒有婚姻及教育資料,反過來使用 5 歲一組的人口統計,不是拿掉 15–19 歲組,少算一些投票人口,就是把 15–19 歲直接併入,高估投票人口。

我選擇了後者。所以連署比例會比實際(中選會公布選舉人數時可算出的)數字還低一點:

表1. 鄉鎮市區連署比例排名

大家或許會覺得都市化程度高的地方,支持婚姻平權的比例也會比較高。不過意外地,前三名都是好山好水好吃好玩的景點,想必這時候深坑連署王屏東連署王已經在偷笑了吧,實在是很秋~~~

大學畢業了嗎?來連署吧!

看完溫良恭儉讓的關起門來拍拍手好棒棒排行榜,接下來當然要來討戰一下。畢竟,做資料不討戰,誰要看啊?

就讓我們上一張各區大學畢業比例與連署比例的圖:


Let’s guess: what is the minimum wealth in NTD/USD for one to be in the evil top 10% of rich people?

Perhaps the title was a hint and you tried to lower your guess number. Nevertheless, the answer may still be beyond your expectation. It is 2.24 …


雖然民主兩個字每天都在政治場域上空飛來飛去,不過民主的程度與狀況,到底可以怎麼衡量與評價呢?今天就跟大家分享兩個研究中常用的指標。

Polity Score by The Center for Systemic Peace

第一個是上次提過的 Polity Score。由美國智庫 The Center for Systemic Peace (CSP) 計算的 Polity Score,是政治學研究中,常使用的一組民主程度指標。Polity Score 衡量三個面向:選舉的競爭性與開放性、廣泛政治參與、權力的制衡。分數範圍從 -10 到 10,-10 到 -6 為獨裁政體,-5 到 5 為君主政體,6 到 10 為民主政體,如果分數是 10 分,則為完全民主。

在這次的圖表中,我們將台灣與同為第三波民主化的十五個國家比較。維基百科告訴我們:「第三波民主化的起點通常被認定是葡萄牙與西班牙在 1973–1974 年之間的政權轉型,其中包括南歐的希臘、拉丁美洲的巴西與阿根廷、智利等,經過了亞洲的韓國六月民主運動與中華民國臺灣省解嚴令,最後以東歐的波蘭、匈牙利、捷克、斯洛伐克、保加利亞、阿爾巴尼亞、羅馬尼亞和前蘇聯共和國與蒙古國的民主化為終點。」除了前蘇聯沒有資料之外,大家可以在圖上看到台灣(亮桃紅色)與同時期步入民主的國家相比,Polity Score 的爬升表現如何。

圖中幾次躍進,分別是:

  • 1986–1987 解嚴
  • 1991–1992 終止動員戡亂/金馬解除戰地政務
  • 1995–1997 第一次總統直選

而 2003–2004 的提升,在新聞稿中的理由為媒體與學術自由。

自由之家的世界自由調查報告

自由之家新聞稿描述自己是「一家獨立監督機構,旨在支持民主變革、監督全球自由度和宣導民主與人權。」而《世界自由調查報告》是一份有關政治權利和公民自由的年度報告。
在報告中,有兩項主要的指標,政治權利(Political Rights)和公民自由(Civil Liberty),都是一個 1–7 的評分,與 Polity Score 相反,這兩項指標的數字越低,表示公民所享有的政治權利和公民自由越高

報告中解釋,在政治權利評為 1 分的國家或區域,表示人民享有廣泛的政治權利,包括自由公正的選舉。當選人可以確實掌權、政黨有足夠的競爭、反對黨在政治中扮演重要角色,且少數群體的權益也能在政治場域中被充分代表。

政治權利 2 分的人民則享有稍微弱化的政治權利,可能的弱化原因來自貪污、政黨未充分發揮制衡功能,以及有瑕疵的選舉過程。


天下雜誌最新一期(652期)封面「用錢買的台式民主」,八個大字怵目驚心。文案更重批:「有錢才能參選,造成金權世襲,華人世界唯一民主國家,為何民主倒退?」出動「民主倒退」如此重量級詞彙,聽起來事態嚴重。標榜台式民主的意義為何?跟用錢買到底有什麼關係?太多好奇與疑問,讀完全文卻沒有獲得解答,反而是浮起了更大的困惑:

「沒有證據支持、甚至內文完全沒有提到的論點,也可以拿來當標題嗎?」

全文圍繞著選舉經費太高、競選支出缺乏監理、政二代數量太多恐造成世襲等主題打轉,然而隻字未提如何衡量民主的好壞?倒退又是相對何時哪種狀況而言?更沒有定義「台式」民主是什麼,如何有別於其他種(可能更好)的民主?而民主做為一種可以被用錢買賣的標的物,這個標的會是什麼?買賣如何進行?

封面的敘述與內文幾乎完全斷裂,如此過於誇大、只求吸引目光的下標方式,與內容農場何異?

你的台式民主,不是我的民主

確認雙方對用詞的定義是討論的第一步,文中所述民主,與一般認知差異很大。綜觀全文,前三篇談選舉經費及政二代的文章,提到「民主」一詞所描述的多半為「政治生態」(註一),唯一出現類似定義的部分在第89頁:「民主政治中所講求的選賢與能」,然而在一般政治討論,即使是廣泛定義下,「民主」代表的是人民當家作主,可以選出政府、參與政治。而後兩篇談鄉鎮市長現況時,使用「民主」的方式則比較接近政治討論,意指選舉及政治參與。

以「民主」代指政治生態,不是不行。然而相對政治討論中邏輯清楚的「民主=人民作主=選舉+政治參與」,政治生態缺乏明確的定義,以及可供參照的度量,因此,生態是好是壞、是對是錯,都由作者坐地起價,更讓討論無法聚焦。度量並不一定是所有人都能接受的準則,但有了標準,我們才知道文中所提好壞多少如何衡量。加上封面標題與內文大小標將「台灣民主」指向金錢、指向惡化,不知情者大約會以為,民主的一人一票變成金錢一元一票,這種偷換概念的策略,騙到了目光,也輸掉了讀者對這家媒體的信任。

台灣民主,進步還是倒退?來自美國智庫的指標

台灣民主的表現如何?美國智庫 The Center for Systemic Peace (CSP) 的 Polity Score,是政治學研究中,常使用的一組民主程度指標。Polity Score 衡量三個面向:選舉的競爭性與開放性、廣泛政治參與、權力的制衡。分數範圍從 -10 到 10,-10 到 -6 為獨裁政體,-5 到 5 為君主政體,6 到 10 為民主政體,如果分數是 10 分,則為完全民主。

台灣的分數,自 2004 年起,一直是 10 分。

因此我也想問天下,民主定義不同,沒有關係。你們的民主,既然可以倒退,就表示有高點。台灣的民主高點是什麼時候?那時的民主長什麼樣子、哪些部分比現在更好?先舉出民主高點,才能來討論是不是真的「倒退」。

有一種燒錢,叫天下覺得你燒錢

專題前兩篇文章,認為選舉花的錢太多、政二代數量太多,然而超過多少是多?多少的選舉經費又是合理的金額?這些都無法在文中找到線索,所有的評價,都是作者自由心證,只是一味批評台灣選舉「花太多錢」。一家媒體要做出價值判斷,難道不應該先把標準或原則講清楚嗎?

除了評論毫無立基之外,各項數字也有誇大甚至矛盾之處,雜誌紙本第 85 頁圖表標題指「選議員,至少 1500 萬元起跳」,網站數位互動圖表以此為副標,文章中估算一次選戰所有議員參選人的支出,也以 1500 萬為單位,這數字僅來自公關公司經驗談,文中未提到第二資料來源或其他估計方式。而 100 頁起的四位年輕人專訪中,預估花費都在 100–500 萬之譜,我手算雜誌紙本第 84、85 頁圖表所列項目(註三),並依照年輕人專訪中提到的開支項目估算,花費大約在 200 萬左右,明顯與標題的「至少」1500 萬牴觸。同一文章的數字,竟前後矛盾。

經濟學人怎麼談民主?

恰巧,經濟學人上一期(2018–7–14)封面故事為 American democracy’s built-in bias,同為「民主」,經濟學人使用的就是政治討論上的定義,主題亦明確:美國選制在現今極化的選民樣貌下會造成什麼偏誤。

經濟學人的立論基準是「好的選舉制度,應該是一個可以準確反映選民偏好的制度」,而美國現行選制讓鄉村票比城市票更有影響力,這在過去美國兩黨支持者沒有城鄉差距時,尚不構成問題,但隨著選民分布的極化,當共和黨的支持者大多來自鄉村,而民主黨來自城市時,兩黨要贏得多數席次的機會,就不像從前那麼勢均力敵。當制衡的力量減弱,議題的天平也會傾斜,走向極端。

文章最後,經濟學人提出了兩種可能的解決方法,一是讓選民投票時,從投一票改為排序候選人,每一輪都剔除最後一名候選人,第二輪開始,如果選民的第一順位已被剔除,則將自動將票改投給第二順位。另一種是複數選區制,即一區可以選出多位候選人。這兩種方法可以防止候選人走向極端,而會更願意朝選民的最大公約數努力。

經濟學人的分析,指明立場、定義理想目標,提出問題、概覽現況及可能惡果,最後提出解方,並說明這些方法為何更接近目標。我期許台灣媒體,也能有這樣的豐富觀點與嚴謹定義。

註一:
「台灣的民主,儼然已經被金錢所綁架。」p.82
「『台灣的民主政治最大問題,就是政治人物要有家族、背景和關係。』中山大學政治學研究所教授廖達琪反問:『關鍵在,沒有錢,如何選?』」p.88
「民主政治中所講求的選賢與能,在今日漸漸成為『神話』,台灣為此付出多少看不見的代價?」p.89
「『我們的民主走到了一個很扭曲的地步,』一位不願具名的縣市首長⋯⋯」p.99
「他(牛煦庭)批評台灣是病態的民主,只奠基在人際關係之上」p.105
註二:
「(標題)鄉鎮長民選或官派?台灣民主的兩難」p.112
「然而台大政治系教授王業立認為,如果為了追求行政效率而廢除選舉、直接官派,台灣是開民主倒車。」p.113
「『不要老從選舉的角度看事情,選舉不是民主政治唯一指標,⋯⋯』黃健庭說。」p.114
「台灣民主站在十字路口,究竟最需要選風改革,還是行政革新?」p.114
註三:


Among 937 Nobel Laureates winners, only 48 of them are females. The field with least women winners is Economics. Elinor Ostrom was the first and only one woman awarded Nobel Prize in Economics. Prize in Physics and Prize in Chemistry are also seldom awarded to women. Since Maria Skłodowska-Curie won Prize in Physics in 1903 and Prize in Chemistry in 1911, only two women in Physics and four in Chemistry have been awarded Nobel Laureates. Maria Skłodowska-Curie is also the first person who won twice and the only person who won in two different fields.

Data Source: https://www.nobelprize.org/
Interesting Stories Related to Nobel Prize:
The Economist/Greying of the Nobel laureates
BBC/Why are Nobel Prize winners getting older?


首圖用裁切版 XD

瑪麗蓮夢露主演的電影《七年之癢》(The Seven Year Itch)討論婚姻生活日趨平淡,感情的考驗也隨之而來。電影的熱映,使得「七年之癢」一詞,成為中西文化中共同代指外遇的名詞。電影中男主角閱讀的同名書籍亦指出「許多男人在第七年開始有婚外情」,讓七成為婚姻中的敏感數字。

到底七年這個長度有沒有根據呢?還是只是創作者無心成就的神奇數字?我們用台灣的離婚資料來檢查看看。

假如七年真的是一個考驗,而且真的有「很多」人沒有通過考驗,那我們可以預期,在第七年或八年(考慮七年吵架隔年離婚)時,離婚的人比較多,或是至少要比七年前或七年後來得多。也就是說,我們要檢查的是「在婚姻第七年或第八年時離婚的人,是不是比第一到六年,或第九年以後來得多。」

圖表上的七年之癢在哪裡

文章首圖是從內政部戶政司公開的人口資料庫中,分類 C.結婚與離婚的 xls 檔跑出的熱圖。縱軸是離婚發生年度,橫軸是離婚的當下,這個婚姻持續的長度。0 為不到一年,1 為滿一年未滿兩年,以此類推。

我們可以輕易地圈出圖上「滿七年後離婚」的部分。


上完一週 MIT 的貧窮行動實驗室 J-PAL(The Abdul Latif Jameel Poverty Action Lab) 在 edX 上的公開課程 Designing and Running Randomized Evaluations,就感到獲益良多,決定趕快來推薦大家這堂好課~

這堂課旨在分享如何設計及實作一個隨機實驗,來衡量某個處理/措施/政策是否達到預期的效果。從釐清問題到實行細節,資料收集、清理到分析,都包含在內。會介紹處理資料時可能遇上的盲點,以及如何解決。

更好的是,課程並不需要任何的先備知識,可以直接上手。(雖然沒學過迴歸的話,可能會有一點點卡關。)

第一週課程介紹:評估成效的幾種方法

要衡量一個處理/措施/政策到底有沒有效果,最理想的方式當然是平行世界。假設我們想知道小明到陳X數學補習,數學會不會進步,那就讓一個世界的小明什麼都不做,而另一個世界的小明到陳X數學補習半年,再比較兩個世界,此前人生歷程完全一模一樣的小明,補習之後數學成績到底有沒有進步。而平行世間中,那個沒補習的小明,就是虛擬條件 (Counterfactual),也就是當我們想測試的處理/措施/政策沒有發生時,會發生什麼事。

事情要是可以這麼簡單就好了。

平行世界畢竟是不存在的,科學家(統計學家?)們只好想想其他辦法,來模擬出類似的對照效果。

於是他們使用對照組(Comparison Group) ,來跟被實驗的對象作比較。在實驗中,對照組是一群跟被實驗的對象很像的人,但被放置 play,不做任何處理。

不過人們也不是常常有錢做隨機實驗,做/不做實驗時幾種比較常見的評估方法筆記如下,並用「食用神奇蘑菇對智商提升的效果」來舉例 XD

回到課程,在 Case Study 中,提供了一組真實數據,來讓大家了解這幾種方法的內涵,以及可能造成的誤會,隨著使用不同的方式檢查資料,結果會不斷地翻盤,非常有趣。即使不上這門課,建議大家也可以按註冊(enroll)看一看資料可能如何欺騙我們的感情喔~

好課推薦給大家!


人生本來就有很多事是徒勞無功的。

沈佳宜如是說。即使當年的中二屁孩還不明白,女神終究是對的,畢竟,探索資料也常常是諸多徒勞無功之事的,其中之一。

看資料的時候,腦袋裡通常會有一百種幻想,彷彿已經找到了驚人的連結,然而實際上,把圖畫出來之後,馬上就冒出千百種更有可能的解釋,而且沒有任何一個,足夠強而有力到否定其他所有可能。人生就是這麼困難。

聽起來不怎麼絕望嗎?來,我們可以一起看看事情是怎麼發生的。

拿到一大包資料時,我們最常做的事就是畫分布圖。分布圖可以讓我們免於滑資料滑到眼睛脫窗的悲劇,就能對資料有個大略的印象。這張圖的幾個印象大概是:

  1. 大部份的單筆捐款金額都落在 10 萬元以下。
  2. 大家喜歡整數。

由於單一公司可抵稅的政治獻金上限是 50 萬,合理懷疑大家剛剛好捐到 50 萬,好進行一個完美的抵稅操作,也是相當理智的決定,那資料上到底有沒有呢來看看。


//今天下午在我跟 c3h3 Chia-Chi Chang 大大講垃圾話的摸門特,赫然驚覺,在微軟的 #OpenHack Day 組隊中,竟然!!!被其他我不能說出名字的 R 社群夥伴們拋棄惹!!!可憐的 c3h3 只好在我的嘴砲中,快手整資料,並佐以「你這個 Power BI 拉一拉一分鐘就好啦!」的配音,咻咻聲做出一張互動儀表板。

在貼連結之前,先說畫圖的緣由,以免你點進去一頭霧水:當我很無聊看著政治獻金一筆一筆細目時,發現有一些我大概知道選區的立委,有非常多小額的捐款,來自選區內的中小企業或商店,例如台南的陳亭妃大多數的捐款都來自台南的「營造」「建設」公司,或是內湖的黃珊珊有一些當地「西藥房」或商店的捐款。

我開始好奇:在各立委候選人的營利事業政治獻金中,有多少筆數跟金額來自選區內的小額挹注?多少來自鏡傳媒提及的大企業?

回到資料,可以看到每位候選人的「選區」以及「每一筆捐款的公司地址」,我們將選區與地址所在縣市一致的獻金,視為「選區內的支持」,而不一致的區域視為「選區外」,圖表中左方主要的長條圖兩個色塊,即分別為「淺色:選區內」及「深色:選區外」的政治獻金。這細節當然有很多魔鬼,不過容後再談。

廢話不多說,先來看看圖表:https://app.powerbi.com/view?r=eyJrIjoiNGY0ZGU0OGMtYjc0Zi00NWY0LWFjYjMtMzU3MDY1NWRlZmVhIiwidCI6IjQ3ZTQxZDBmLWJkMmEtNGIyMy1iMzY5LWZlNDZlY2RiYTEwZSIsImMiOjEwfQ%3D%3D&pageName=ReportSection

圖表上幾乎所有元素都是可以亂按的,大家請隨意。不過主要可以利用右方的得票率長條圖、當選與否跟現任競選連任與否圓餅圖當作篩選條件,如果按下當選,大抵可以發現,當選者比較集中在政治獻金提報較多的前段班,這當然也不意外,畢竟捐款企業們也不是做慈善事業,猜測通常是預期候選人會當選,或者有和其他候選人一戰的實力,才比較有捐錢的誘因。

從文章開頭我發現的小特性,我們應該可以稍微想像,這些選區內的營利事業政治獻金,有可能是候選人,或是候選人的團隊,或是推候選人出來的政治前輩,曾經勤跑基層、挨家挨戶拜訪,所得到的實質性支持。這些捐款金額往往不大,很可能也如圈內人士所說並未完全揭露,卻還是可以稍微窺探候選人與基層關係的鑰匙。

由於我們對於「選區內」的認定比較寬鬆,同縣市就認定為選區內,所以觀察「選區外」獻金較多的候選人,相對比較不會出錯,在此我們有幾個重點觀察對象,可以跟大家分享笑一笑:民進黨黨團總召,本屆被派到新竹選分區立委的柯建銘,除了榮登政治獻金總收入第一的寶座之外,他在新竹本地,也就是選區內的營利事業政治獻金收入,在收入前段班之中,無論比例還是數量,都是數一數二的少。他以約莫 5% 的差距,得票數 90,642:79,951(得票率 41.33%:36.45%),擊敗了國民黨的鄭正衿。毫無懸念。看來老柯不需要新竹人民的錢也可以穩坐立委寶座啊(欸不要亂評論)。

下一位,則是眾所皆知被國民黨派去(陷害?)去基隆選區的郝龍斌,來自基隆的政治獻金都快少到看不見了,應該是,跟基層很不熟?於是郝龍斌也快樂地以 5% 的差距, 得票數 68,632:78,707(得票率 36.14%:41.45%),輸給了民進黨的蔡適應,喔順帶一提,郝龍斌提報的政治獻金 800 萬,只有 18 萬來自基隆,蔡適應的 400 萬則有 100 萬左右來自基隆。

好了剩下的就給大家自己玩囉(懶)

友情提示:政治獻金細目中,地址欄位一般是填入OO市XX區,但有些小天才,就會填「民權東路四段」,或是「羅斯福路三段」之類的,因為下午趕時間(?),我們一概不予處理,視為選區外啦,所以某些人選區內可能有少筆數喔,至於影響多大,其實需要回去看這幾筆資料金額大概怎樣啦,我是沒看啦(喂)。又,因為選區內認定相當寬鬆,設立在台北市的大企業又相對多,所以選區內外之判定,在台北市立委可能是相對非常非常不準的。當然用統編去撈個資本額可以稍微判定企業的特質,但對我們好奇的「選區內的支持」能不能用資本額一刀劃開,確實難,要做的話也需要訂出一個有理有據的切割標準來。

總而言之,選區內的支持度/跟基層麻吉程度,到底能不能從選區內部獲得的營利事業政治獻金來觀察,我覺得還不能畫上絕對的關係,大概需要跑一百個回歸吧我想(看向經濟系的朋友)。反而是長期觀察各地方政治的朋友,可能可以透過這些熟悉的企業或商家名稱,再一次印證(或根本不用印證)某些圈子與某些政治人物的關係。

某打過選戰的朋友,曾經透露他們計算選區內支持度的方式:騎機車跑遍選區每一條巷子,觀察住宅形態、居住族群,佐以當地的人口年齡性別教育等統計,估算每一個社區的人口分布,以及支持度,並和週期性的電話民調相映證,得出一份內部的選票估計,並依此擬定戰略,攻城掠地。最終他們贏了。

資料是交互的。資料,是跟事實相互驗證的。

同場加映,我與 c3h3 超不融洽的製作過程:

// c3h3:「這我 15 分鐘就做完了,根本就不算 hack 嘛!」
我:「⋯⋯對不起喔。」

//我:「這顏色不行!我要調顏色!」
c3h3:「調什麼顏色啊調顏色很麻煩耶不行!」
我:「不可以!一定要調!兩張圖明明就不同資料怎麼可以同個顏色,這樣看的人會很困惑!」
c3h3:「不行!」
我:「我絕對不會承認這是我做的!我要說這都是 c3h3 的貢獻!」
c3h3:「明明就是你叫我做的你怎麼可以不具名!」
我:「我要把 credit 給該給的人!」

//c3h3:「好啦給你調。」
(過了十分鐘)c3h3:「喔調完真的還不錯耶。」
Seeeeeeeeeeeeeeee!

最後要感謝: 辛苦手工,釋出資料集的鏡傳媒捧油 早上宣稱說要做政治獻金資料結果拋棄我們的 孫玉峰 (Summit Suen) 跟我說活動八點開始害我鬧鐘設六點爬起來發現八點半到九點之間才報到的 張婕 辛苦辦活動的正妹們 Reneata Chang Jennifer Chiu 活動完不去吃飯還邊走邊在開下個活動的會我們應該是過勞工作狂? Ning Chen Kristen Chan 張懷文 (Huai-Wen Mia Chang)

我超乖我都有 hashtag #OpenHack 只是我還沒傳 github 額額
大家晚安,歡迎靠北,被打臉4成長的動力雖然很痛 QQ

可以來臉書網誌留言給我~

Claire Tsao

Data Lover | Github: missmoss

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store