Cultivating Data Culture as A Startup — slide by slide

Shuen-Huei (Drake) Guan
BlendVision
Published in
28 min readNov 20, 2017

2017/11/12,站上了 台灣資料科學年會 的 R0 講台,分享了這一年來我們是怎麼實驗性的執行 Data Culture Building 計劃…

如果,塑造一家公司內部的 Data Culture 可以被視為是在經營一家 Startup 的話,那麼在它的生命週期裏頭,一樣會有開發與營運的技術問題;一樣要面臨追著數字成長的挑戰;一樣要考慮丟多少資源在行銷;更要常常想什麼是最適合 pivot 的時間點…

2017 年,KKStream 與 KKTV 聯手,透過 Kaggle 發起了 4 場 Data Games;去了趟 Google Next ’17 取經;在 PyCon Taiwan ’17 露臉;跑去義大利的 ACM RecSys ’17 進修…。這是一場用力往 Data Culture Building 邁進的旅程,發生在短短不到的一年內~

只是些故事分享;請不要全數相信我們的經驗。攝於澎湖將軍澳嶼

開始前,有兩件事要聲明。

首先,這是一連串故事的集合:KKStream & KKTV 既是主辦單位也是參與者;KKBOX 有派出專業人士擔任種子隊;我們出國了兩次去取經;我們一小搓人嘗試在公司內部發起 Data Culture 的分享。只有故事,沒有技術。

另外,由於是我們的獨有經驗,有一定的人文、時空與背景。它可以在我們這邊產生一定的成效,但不代表就適用於您或貴單位的情境。所以請小心服用,並且建議您懷抱著 120 萬分的懷疑來看待。勿盡信之,但可參考之。

兩個聲明:

一:只有故事,沒有技術。

二:勿盡信之,可參考之。

來自業界的?有專職 data 的?有玩過 data game 的?

對在現場(中央研究院人文社會科學館的 R0)的大家做個調查,了解一下大家的背景;資料科學在貴單位的狀況;以及個人對於 data game 的經驗。

Q1. 有多少人是來自產業界的,請舉個手。
A1: 有將近九成!

Q2. 貴公司或單位,有專職在處理資料的人或部門的,請個舉手。
A2: 有約五成!!

Q3. 那…有玩過或比過架設在 Kaggle 上面,或是其它型式的 data game 的,麻煩請個舉手。
A3: 10%。人不多,太好了!那這個分享還有它的一點點價值。

顯然四天的年會,對大家來說還不夠累,還有這麼多位來自產業界的朋友們,願意在這個週日正好眠的上午,來中央研究院人文社會科學館的 R0 聽故事。更讓人開心的是,有近五成的單位或公司有專職 data 工作的人或單位!

讓我們從三年前的 KKBOX Video team 的成立開始閒聊起~

所有的故事都有個開始,我們的也不例外。故事從三年前開始,那個時候約莫就是三四個人的小組,目標是在接下 KDDI 的 au VideoPass 影音服務專案後,把它成功的”熱轉移”到我們的平台。

二年前的 KKBOX Video team,比較有規模了,人多到可以喝酒喝得很過癮~

我應該忘了說,那個時候的「我們的平台」是不存在的,一行 code 都沒有!但時間是飛快不等人的,轉眼間,就過了一年,團隊長到約 40 人。是個可以開心慶祝一下的時候了~

  • 產品推出去了。而且還在三個月內連續推出兩個服務!
  • 團隊有個雛型,比較像樣了。前端/後端/開發/營運/設計/管理/服務/研究…等都冒出頭了。
我參與的專業工作之一:影片 codec/streaming/quality 的調教與精進。Tears of Steel footage.
運氣好的話,你有機會從這一張圖看出”同樣影片”的”不同品質”。Tears of Steel footage.

加入團隊後,主要的貢獻在於影音技術與知識上:成立 Content Platform 團隊;在影音的 codec 與品質上持續輸出;奠定核心串流服務的基礎。我們有著非常不賴的團隊 :)

那個時候,我還沒有正式涉足任何與 data 相關的議題,一切看似美好。接著的 KKStream 與 KKTV 的成立;KKStream 的組織重組;KKTV growth team 的成立;隔一年的 KKTV 服務釋出;VideoPass 開發團隊開始不安於現況想要有更遠大的目標…終於,得逼迫自己開始認真往 data 這一塊還缺著的拼圖邁進了。那時最記得的,是 Peter 與我會三番兩次在公司週會上,一直喊著「我們要建立起 data-driven 的 mindset 來貫穿整個 KKStream 團隊」但實際上,是個舉步維艱的局面。

KKV 集團終於有了專職的 data scientist, Kae!

時間快轉到 2016 年下半旬,KKV 集團有了資料科學團隊第一人的加入。師從台大林守德教授、在中研院陳昇瑋團隊下歷練、經歷了 KKBOX 研發中心。羅經凱(Kae)的到來,讓我們充滿希望,覺得整個就是我們賺到了!

我們以為,只要有了第一位 Data Scientist 的加入,接著他會帶領我們理出個方向;擴大資料團隊編制;一步一腳印往前走去…但故事的發展並沒那麼一帆風順。倒不是 Kae 的能力不足,而是我們大大的搞錯了些什麼 — 我們以為成立 data team 就像成立一個 iOS team 一般容易,完全不曉得這是個不一樣面向的問題。網路上多的是教你怎麼成功建立 Data Culture 的文章,像以下就取自其中的一篇

  1. find the data visionaries (ex, the 1st data scientist);
  2. organize and build a data hub for all others to access;
  3. explain the data to make it clearly understandable;
  4. invest some good tools to make it easy to utilize the data;
  5. count on the results generated from the data.

很遺憾的,這就像有天你很熱血的想跟上潮流:繳錢上了 Daniel Teng 的課;胡亂地讀了幾本書;公司組織與上司也都全力支持;跟兩三位同事勤奮地扮演著 facilitator 的角色…。但是不知怎麼的,導入的 Agile 或是 Scrum 就是沒那麼成功,不太道地的樣子,有種說不出口的悶。

我們也一樣失敗了,失敗在建立 data team, data culture, data-driven mindset 這些事上頭。我們的確是建置了一些 infrastructure,寫了一些 codes,整合了一些外部 services ,也實作出了「類資料分析」與「類推薦系統」。但這些成果與塑造 Data Culture 是不一樣的兩碼子事。很顯然問題一定不在 Kae 他身上,那在哪邊呢?

終於 hire 到一位來自中研院,有著豐富經驗的資料科學專家了。但後來才發現,我們幾乎沒完成任何一個想達到的目標!

初嚐 data 就失敗的教訓暗示著,我們一定是哪裏搞錯了!

不是 Kae 的能力不足;不是主管的不支持;不是團隊成員的不賞臉;不是老闆的妄為打亂了節奏;不是客戶的不懂 data 的重要性;也不是姐妹公司的高層一直出差不在無法溝通;更不是程式碼寫得不夠有彈性…那一定是我們自己哪搞錯了!

老朋友 Winnie Lee 曾在兩年前的資料科學年會上說過:讓所有人相信 data,是最重要的第一步。

「如果你想建立起一個以 data 為決策與執行依據的組織,首要的任務,是先讓所有人相信 data。唯有先解決人性最深處的信任問題,後續的發展才得以期待…」以上這一段話,是我自個兒心裏腦補,假設兩年前 Winnie 在講座上的分享內容。那時候的她,應該說得滿腔熱血的吧!

“If you want to build a big data organization, everybody has to first believe in data.”

— Winnie Lee, COO@Appier

Winnie 提到了很重要的一個切入點:讓團隊成員相信資料。

事實上,她兩年前的座談會上,提出了「8 Tips To Turn Big Data into Big Insights」,上述是裏頭的第一點。這八點裏頭的另一點,格外的讓我注意,同樣的至關重要:「公司的高層會是一個問題,因為他們擁有的經歷、權利、資源以及決策能力,對於新文化的養成與塑造,尤其是 data-driven culture,會是個大問題。營造出讓資料替自己說話,讓 growth hackers 結合商業後解釋數字,而不是由高層人士直接下達天條。」

HIPPO can be a problem. Let data speaks, not HIPPO speaks.

— Winnie Lee, COO@Appier

Fei-Fei Li 於 Google Next 現身,提出 “Democratizing AI” 這個終極目標。
Google Next ’17 有很多有看頭的技術,而我們則是特別專注在 BigQuery, ML Engine, Vision API, Video Intelligence API 這幾個子項目。

很不巧的,剛好在 Google Next ’17 前的一個多月得知有這個會議。既然錯的一定是自己,然後 Google 又是以強調 big data, super cloud, genius AI, creative process, talented superstars 的公司,那就從改變自己開始吧!去取經吧!

撇開那些與 AWS 服務很相像的 GCP 服務與名詞,那些無法立即對 data culture building 有效益的東西,況且我們也不是要來這做「AWS vs GCP」的。所以即使我們上了些 bootcamp 的課程,有了一些手把手玩紐約計程車資料進 BigQuery 以及透過 Tensorflow 來建置模型做預測的體驗,甚至還聽了幾位 Google AI 專家介紹 Google Cloud API 的能耐…等等。對於我們這次來取經的目的,還是沒什麼頭緒,無感得讓人發慌。

史丹佛大學的校園很美,四處走走逛逛,可以刺激我們的腦袋,改變運轉的方式~

Google Next 的期間,我們四處晃晃尋求靈感與答案,不想就這麼空手而回。途中,同行的莊鐵頭 (Ironhead) 提了個不像是在辦公桌上會出現的想法:「我在想…每週的 weekly,我可以跟大家說一些 AI 的八卦,讓大家對 big data, AI, machine learning 有一些了解,而且就只是聽聽八卦似的輕鬆…」

“我在想…每週的 weekly,可以來個 AI 八卦分享…“

— Ironhead

“我的直覺告訴我,這件事可行,而且很重要,即使我並不曉得為什麼~“

— Drake Guan

大部分在工作場合的討論與決策,都遵循著某種流程:要有點邏輯,至少不能橫空而出;要能指出與偉大願景或是年度目標之間的關系,最好是有跟 KPI, OKR 或甚至是 MP 在數字表現上有個勾稽;要抓出需要的資源,也許還要提出與其它任務的權重高低…等。但 Ironhead 的點子,則有點像是突然跳出來,有點自我一廂情願的想法。我的直覺告訴我,這件事可行,而且很重要,即使我並不曉得為什麼~

每週一則的 AI 八卦,是週會中最歡樂的時光~

AI 八卦(Gossip of A.I.),就從我們自 Google Next ’17 回來的幾週後,自四月份正式開始。我記得第一次的八卦,提到 Stanford University 的 CS231n 這一門與 AI 相關的課程,修課人數從 2015 年的 150 人,一路飆高到,在 2017 年有多達 750 個人修這一門課!之後像是有名的 AlphaGo 新聞、是馬非馬又是馬的 CycleGAN替模特兒穿上華服的 Vue.ai、或甚至是 Ironhead 去交大聽 Yann LeCun 的大師講座…等

2017/04/10 ~ 2017/11/06,足足有二十回的 AI 八卦~

大多數的我們,並沒有直接意識到從今年四月開始的 AI 八卦對我們的影響。而且大多數的內容,也都在緊接著週會的那一頓午餐過後,很快的被淡忘掉,因為它既不是工作所需,與生活無關,更不是主管等著要的東西,更多的時候,是個觸摸不到的“遠知識“。至少,這些小道消息讓我們意識到 AI 發展的近況。曉得畫風可以被學習;所有棋類的遊戲人類已經無法贏 AI 了;AI 可以甚至可以幫忙應徵你未來的同事…這個「AI 八卦」確實留下了點什麼影響。

4 ways to build a human company in the age of machines, Tim Leberecht at TEDSummit 2016.

Tim Leberecht 在他有名的 TED talk, 4 ways to build a human company in the age of machines, 提到:在這個機器愈來愈優秀的時代,機器將愈來愈厲害,愈來愈有效率,而人類則可以往另一頭發展 — 往不需要那麼有效率,但是美麗的方向。

“To maintain our humanity in the this second Machine Age, we may have no other choice than to create beauty. Beauty is an elusive concept. For the writer Stendhal it was the promise of happiness. For me it’s a goal by Lionel Messi.”

— Tim Leberecht

他提到的四個方法中,其中一個是:Create Intimacy。

Google 給的 “intimacy” 解釋。姑且,我們在這邊以 “親密;熟悉;友善" 來解釋它。

有研究指出,我們對於一份工作,或是辦公環境的感受,有很大一部分取決於我們與同事之間的關係。同樣的,對於一個新的概念或是新的方法,我們接受它的程度與意願,是否也取決於某種關係?換個方向來想:如果我們不經意的製造出了一種與 data 之間的親密關係,是種帶點隨性、輕鬆、自然而又熟悉的關係,我們是不是就間接的創造出了對 data 的信任感與喜愛?

在這為期六個月不長不短的 AI 八卦,big data, machine learning, AI 變成了平日的八卦新聞,詞彙變得熟悉(或至少不是第一次聽到),而且還是有畫面容易想像的八卦。一個不小心,我們跑了幾個月的科普教育(每週只有五分鐘的那種),讓它變成了我們的 common sense 或甚至是共同語言,讓它變得很 lovely。

故事一:親愛的,我們把生硬的 data/AI/ML 行話變親密了!

文化,從來都不是少數人的事,它是眾人生活點滴的累積。

下一步,之於對 data 感到親密之後的下一步,就得有更 lean forward,更主動一點的接觸與體驗 data 了。Google Next 這次又派上了點用場,它暗示我們要再去看看 Kaggle,想想它能怎麼被拿來使用。

喔,對了。我們跟著 Fei-Fei Li 見證了 Google 買下 Kaggle,就在 2017/03/08 這天~

Kaggle 是一個平台,用來讓人舉辦以 data 為名的競賽平台。如果你有資料,有難題,有資源,就可以釋出整理過的資料,說明清楚問題,提供獎金給奪冠的參賽隊伍,然後等著期待有人提出好解答。如果,想讓一件開始有點熟悉了的事變得更有意思,那辦個派對或是遊戲,就是一個無法再更好的提議了。於是我們在想,不如來辦個 data game,讓所有人都參與吧!

KKV Data Game 17.05 final @ 二魯.

今年五月的第一場 data game,無意間奠定接下來這一整年總計會辦的四場比賽的個性。那時的我們,應該完全沒有想到會有這樣的成果與影響。這就好比有天你參與主辦了 PyCon APAC/TW 2014,與大家訂下了一些 SOP 與原則,留了下來,於是未來的每一屆 PyCon TW 都受惠了。

  1. 主標: [KKV] Data Game 17.05;副標:What to See Next? 推坑好劇 由你決定。主標指出了比賽時間(第一場是 2017 5 月),像是個 code name,說明了是個會一路持續下去的事件。而副標則指出這一場比賽要比的是什麼,每一場都可以不一樣。
  2. 每一場比賽,有機會帶出一個新的主題,新的度量衡,新的資料觀點,以及新的挑戰。拿 17.05 這一場來說,推薦系統的評比三大方向:精準(Accuracy)、多元(Diversity)以及新穎(Novelty)被介紹給所有參賽者。
  3. 比賽規則:每隊最多三人;每隊每天最多能上傳預測十次;鼓勵分享想法與點子,但不分享結果;開設專屬的 slack channel 供大家討論;二個禮拜就截止比賽。
第一場 Data Game 比的是精準預測用戶接下來會看哪一部劇。

挑戰 A 是標準的比賽項目:給與過去幾個月用戶的完整觀看紀錄,由參賽者各自發揮,預測用戶下個月會看得最多的是哪一部劇。這個比賽的設置有幾個非常重要的細節:

  1. 用戶的觀看紀錄被經過整理,去掉奇怪或不正常的資料。大大降低第一次玩 data game 的壓力,力求它是個 for real, for fun and for experimental 的競賽。
  2. 只需要「預測下個月看最長的一部劇或是電影」,重點放在預測,而不是推薦。
追加的另一個競賽項目,讓最後一天公佈結果時更加熱鬧些。

另一方面,為了讓第一次主辦的 Data Game 不會落得冷清,得有個法子讓參與比賽的團隊,在整整兩個禮拜的過程中能玩得盡興,即使覺得離冠軍團隊很遙遠了,也不致於就想放棄不玩了。於是特別追加了歡樂場,挑戰 B:點子王。

桌遊的種類中,有一種類被稱為 Eurogame,它擁有一些獨特的性質,以致於它在桌遊界裏頭,是個可以比較長青的類型。 Eurogame 其中一個特質是,它的遊戲設計,會盡可能讓所有玩家玩到最後,而不會在中途讓玩家出局,或是在中途就讓有些玩家因為差距過大而想放棄了。

點子王的設計同出一轍,目的在創造出另一種「勝出」的氛圍。所以即使你已經離前三名角逐冠軍的隊伍很遠了,你還是有機會在這個點子王裏頭勝出,靠的不是你預測看片多準,而是決賽當天你的人氣(或是惡勢力)。當天的「點子王」競賽比「預測王」來得歡樂許多 XD

這個作法,事實上在去年辦的 KKV Programming Contest 2016 即有類似的點子。當時是分成競賽組/歡樂組,競賽組還有分成幾種不同獲獎方式(ex, 第十組成功解題的隊伍),歡樂組則是下注(像在看賽馬)。

A Eurogame, also called a German-style board game, German game, or Euro-style game, is a class of tabletop games that generally have indirect player interaction and abstract physical components. Euro-style games emphasize strategy while downplaying luck and conflict. They tend to have economic themes rather than military and usually keep all the players in the game until it ends.

Eurogame@Wikipedia

範例技巧一:直接把比賽的 sample 結果檔送出,就有分數了!
範例技巧二:假設所有人都會去看測試資料裏頭最多人看的那一部劇(因為這就是「流行」的定義)。
更多的點子分享,這些全數都在 Data Game 17.05 Workshop 中拋出來,讓更多人有一些想法可以參考!

能讓 Data Game 17.05 成功的因素之一,在比賽第一天主辦的 Workshop 可以說是功不可沒。包括像是介紹 Data Game 的意義;清楚而詼諧的說明遊戲規則;Kaggle 的介紹/註冊/系統使用方法;對於比賽所提供的資料的深入淺出(人事時地物);提供了 Python/R/Ruby/… 等的一些程式框架;更進階的 Collaborative Filtering / SVM 的引薦;…太多了。

如果,你是一位亂入的人,進到這一場 Workshop,你會有種錯覺,以為這是一場辦在某公司內部的資料研究 workshop 或甚至是 conference。因為它有主席、攝影、財務、人事、宣傳、…等組別的投入,嚴然是個接近完整的活動團隊!

這是集眾人之力而成的比賽,不只把比賽放到大家眼前,邀請參加。同時,更與一群不同觀點與技能的人合作,成立籌備小組。這時候的比賽,不再是「別人的事」,因為主辦單位裏頭有「我們的人」。比賽的成果,不再是「主辦方的事」,因為「我們的同事有人就在主辦方裏頭」。我們不小心組成了一群了不起的籌備小組!

喔,對了!我有沒有提到 Data Game Evangelist?!他們是整個比賽的傳教士,他們不可以有技術背景,他們人緣都異常的好,他們知道怎麼用有別於正規參賽隊伍的角度來看待整個活動,他們常常是親切可愛美麗又各有所長的好夥伴。因為有了他們,我們的活動才得以推廣得如此順利!

27% 是第一關魔術數字;永遠不要小看你們家的 interns,因為這一次就是他拿冠軍的!
Data Game 17.05 一些有趣的數字。

約莫七成的同事都加入一起玩,有為數不少是非工程師背景的,其中還有一隊是完全沒有工程師,三位都是 PM 或是 PO 所組成的,這個團隊常常做出讓我們大開眼界的實驗,而這都要歸功於 evangelist 的努力推廣。

為期二個禮拜的比賽,總計收到約 400 次的送件。換算下來,每天約有將近 30 次的送件。對於所有人這兩個禮拜都一樣要上班,週末一樣要玩樂,實在是出乎預料外的送件量。事實上,我們也可能剛好遇上了工作量的度小月,但更多時候,是所有人非常積極的投入。中午午休時間,會看到有團隊在研究;下午茶時間,也看得到有人在研究;就連兩個會議之間的半小時空檔,都看到有小組在實驗送件。有一位在 lobby 遇到我的同事這樣跟我說:「Drake,你看大家這麼盡情投入這個 Data Game,如果你也有辦法讓大家投入在工作的其它挑戰或事物上,是不是會創造出什麼驚人的東西出來?! 」

對了,忍不住要特別介紹由非工程師組成的小組,他們一開始就取得好成績,而他們有的工具只有 Microsoft Excel 以及 Google Sheets!我沒記錯的話,他們一開始連要怎麼順利開啟觀看紀錄(.csv 檔)都有問題!過程中,他們非常有毅力的送件了數十次,就只是為了搞清楚到底怎樣的格式才可以送件成功!因為他們的努力,讓我們所有人見證了「樞紐分析」以及「VLOOKUP」的厲害之處,同時再次了解到自己對 Excel 這類工具的不了解。

你永遠不會知道你的夥伴的潛能,包括冠軍隊伍是由 intern 拿走的,強而有力的 non-developer 團隊靠的是 Excel,以及有人非常科學的每次送件都寫出完整得像是 code commit log 的 submission description!You never know until you tried…

你看大家這麼盡情投入這個 Data Game,如果你也有辦法讓大家投入在工作的其它挑戰或事物上,是不是會創造出什麼驚人的東西出來?!

Takeaway for Data Game 17.05. A picture is worth a thousand words, even though it is just a picture of words~
我最尊敬的 HCI 大師之一 Bill Buxton 曾如是說。

“You have to design the organization to design the product.”

— Bill Buxton

“You have to re-design the organization to cultivate the (data) culture.”

— Drake Guan

故事二:你必須重新定義組織與關係,才有機會塑造新的文化。對了,記得讓整個過程要有趣而且熱鬧。

文化,向來都不只是一群人內部自個兒玩玩就好,它還需要外部的力量(或威脅)!
才剛剛結束的 17.05,突然意識到 PyCon TW 的到來,於是有了趕鴨子上架的 Data Game 17.06!

說在上半年就計畫總共要舉辦四場是真的,但有計畫提供對外舉辦,或甚至搭上什麼其它外部活動,就真的是騙人的了。Data Game 17.06 就是在突然意識到 PyCon TW 的來臨,而臨時決定的「下一集」。

就在 PyCon TW 的前幾天(據說是三天還是五天),我以身為這家公司(如果把 Cultivating Data Culture 視為一家 Startup 的話)的 CEO,根據 Data Game 17.05 的成果與數字,相信我們有一定的潛力可以有個好的成績。不試不知道,身為 CEO 要有膽量,加上有 羅經凱 (COO) 以及 莊鐵頭 (CTO) 的支持下,就決定衝了!

因為 17.06,突然默默無聞的 KKStream FB page 起了些漣漪!

選在 PyCon TW 的前一天發佈的消息,過了一晚,成了 KKStream FB page 有史以來 reach 到最多人的一則發文。沒有人曉得為什麼,只知道可能是 FB 對這個比賽愛戴有佳,又或者是我們跟上了什麼潮流,或是我們做對了什麼…總之,沒有人知道為什麼,就是受到了比過去還要多人的關注。我們幾位非常開心,感覺可以期待會有非常多人參賽。

但其實事與願違,沒多少人(隊)送件!有點乏人問津!

如果把辦 Data Game 來塑造 Data Culture 這事,視為在經營一家 Startup 的話,那我們就是遇到了一個大危機,是會就此倒閉的那種。我們開始有點慌了,急著找方法補救。有人提出現在是 video 當道,於是隔天做出影片說明參賽方法;有人發現 Kaggle inclass 的不優 UX 而多加了一些說明在發文裏頭;有幾個人立即組成小組,發活動行銷信件到認識的教授或實驗室去拉人氣;有人立即聯絡媒體,發了兩篇文章[1][2]出去;還有人……

我們忙翻了。

做了這麼一堆補救,有因此改善狀況,吸引到更多人投入這個比賽嗎?

沒有!

最後意外地,來自外部的參賽隊伍,讓 17.06 看起來是個成功的比賽,而來自 KKBOX 的 David 則是抱走了冠軍頭銜。

最後,總計有來自 81 位挑戰者,組成了 63 隊,在兩週內送件了 800 多次。17.06 相較於 17.05 又有了一些成長,而且投入的人力又更精實了些。優勝隊伍,有個 KKBOX Group Company Touring,當晚則有一個「與總裁共進晚餐」,在 MUME 吃了頓好料的。

大部分的隊伍投入的時間,都有一種「工程師的 pattern」,下午茶時間以及晚餐過後睡覺前是最活躍的時候。其中有一隊叫 For Fun 的,他們都是深夜開始送件,從深夜 11、12 點開始一路玩到凌晨 2、3 點,一點兒都不 for fun,非常的 serious!

另外有一隊叫 tjw,只有一個人。而且重點是,他只出現在二個禮拜的比賽中,最後的那八小時(凌晨 8 點以前)。就只有這麼短短的 8 小時,他就以黑馬的姿態,一路殺進第三名了!後來吃晚宴時聊了一下,才聽到他笑笑的說:「其實,我早早就知道這個比賽了,但沒什麼誘因。然後我老婆剛好那一陣子有在用 KKTV 看劇,然後我們後來發現,原來比賽可以拿到 KKTV redeem card!於是我等哄完小朋友入睡後,開始挑燈夜戰,在這最後的八小時,直接殺進前三名…」

另外就是,來自 KKBOX RDC 團隊的黑馬 KS Tseng 拿下冠軍,他為此還寫下了一篇 blog 分享:KKBOX Data Game — 17.06 1st place Solution

至今,我們仍不曉得為何一開始的高 FB post reach,後來的乏人問津,到最後的熱烈賽事。

故事三:你永遠不會曉得事情的發展方向,短暫的成功與失敗都不用太在意,繼續往前吧!即使是 Data Game or Data Culture Building 亦如此。

ACM RecSys ’17: What’s the future of RecSys Conference?!

八月份,我們派了三位去了趟 ACM RecSys,刷新自己知識的同時,感受一下趨勢與方向。不過這裏的體驗,就是另外的故事了…(想聽的請舉手)

第三場 Data Game 17.09 比賽過程中,其中一隊寫了個 webpage 來記錄各種實驗!

隨後,我們又在公司內辦了第三場 Data Game 17.09,這次又更難了,資料量是幾 GB 的了,比賽時間也拉長了。印象中,我記得有一位同事在最後寫下了一段話:「原本以為,靠著自己對資料的了解與天份,一定可以拿到好成績。後來發現前幾名都是用 machine learning 建模型的,根本是被打假的!」聽說,那位同事後來就去上 Coursera 之類的線上課程學 ML 了!

Data Culture Building 大事紀

自 2017 的三月起,一連串的資料探險之旅。起於 Google Next 的靈光乍現,到後來一場又一場的 data game,以及中間發生的 AI 八卦與 ACM RecSys。這是個很難說不精彩的一年了。

  • 優先建立對 Data 的 親切感/信任感
  • 透過 Data Game 來增加體驗與樂趣
  • 文化是眾人之事,從生活點滴開始
  • 外部的刺激,可以加速文化的行塑

最後的最後,Data Game 又來了!今年的最後一場,一樣是對外開放,KKTV Data Game 17.11 已經進行了兩週,還有兩週。來一起共襄盛舉吧!

報名網址在此:http://bit.ly/kktv_dg_1711

結束了熱熱鬧鬧的 2017 台灣人工智慧年會x台灣資料科學年會後,感覺是時候來做個收尾。把投影片放出來;寫篇文章來把投影片內容闡述得更清楚一點;加一些幕後花絮…於是有了這麼一篇~

附錄:

--

--

Shuen-Huei (Drake) Guan
BlendVision

thinking, planning, coding and inspiring something about human beings, and then tech... https://about.me/drakeguan