參與香港開源年會 2019 的所見所聞

講座:自由香港字型、R與數據分析、Mozoilla 網絡健康報告、香港科技教育、亂數與LikeCoin;活動背後:會議廳外的活動顯示屏、簽到與名牌列印、紀念品換領、無線網絡

🐟Curtis Chan FishSunSun
Curtis’s Digital Life
23 min readJun 19, 2019

--

今年 6 月 15 至 16 日連續兩日,一年一度的《香港開源年會》(Hong Kong Open Source Conference)在香港科學園順利舉辦了。作為學生義工,除了出力幫忙整個會議的運作,我也趁低峰期時混入有興趣的講座當台下聽眾。

▲ 不同與會組織的紀念品,例如有 Raspberry PiFreeBSDHK01Mozilla (瀏覽器 Firefox 的基金會)MySQL 等。

比起往年,今年多了可愛的貓貓吉祥物 橘源瑪 Kottis官方也有提供Telegram 上的貼紙。它實在太可愛,我第一時間就安裝了這個 sticker pack。

另外也終於一睹 Daisy Maris Fung陳可樂 Holok Chen 的真人,哈哈。

▲圖自大會官方Facebook

(這裏開始切換成學術討論模式,本文超「長」細。)

目錄

▲ 最後一日的大合照。自大會官方Facebook,Hong Kong Open Source Conference 香港開源年會 (找到我嗎?我在左邊第一排卡其色褲)

▼主題一覽表取自香港開源年會 的Facebook 貼文,有最近熱門的區塊鏈、人工智能、擴充實境等題目。

▼ 開幕禮有 FreeBSD 基金會的人,左圖中正介紹系統升級的哲學 Principle of Least Astonishment (POLA)。而右圖中則是 Microsoft 介紹其公司對開源的重視。

🌸 1 我比較感興趣的講座

大會有現場錄影義工,所以可以之後再 on-demand 觀看這些錄像。但是在現場看比較有在場感一些。以下是我在現場的感受。

⭐️ 1A 解構香港人用標楷體的困惑

第一個當然是香港本地的專案 — 《解構香港人用標楷體的困惑》自由香港字型 Free HK Fonts 的代表 Kingman Leung 。可在 HKOSCon 2019 Day 2 Track 1 (Hall 04) — YouTube 觀看 (3:04:59 to 3:42:59)。

香港的中文字型有很大部分受著1994年台灣教育部國字標準字體教師手冊所影響。但是香港常用字字形表和台灣不盡相同,而「自由香港楷書」則用來解決這個電腦字型問題。

▼ 香港教育局的常用字字形表。台下聽眾指出這份官方文件的封面都不是規範楷體,笑。截圖自大會直播流 3:26:54。

香港教育局有一套指引教科書、學校的字體規範,但是卻沒有一個可用的非商用字體供老師去使用。講者引述一些老師的經驗。他們每次列印考卷、通告都很麻煩。雖然有近似的字體可用,但是教育工作者們仍要人手逐字檢查,並手動將字塗改以合符教育部門要求。

▼ 為了不要令到學生混亂,老師要將左方台灣電腦中文字體修正成右方香港的標準。

為何最近才有這個項目?事源是版權問題。講者一路嘗試解決這個問題,幸台灣那邊在2015年將官方的字體全字庫改用 CC-BY 4.0 來授權,只須致謝即可使用,讓到講者可在其社區中心,與教育大學的老師、一眾長者合力造字。未來項目與台灣 justfont 合作,將字體質素提升至商業水平,望新版本能吸引更多香港人或世界各地的正體中文用家使用。

另外,他也發現得多香港人分不到本地與台灣的一些常用字的分別。好像上圖的「充」字,香港教育局規定第一劃是一點,但台灣教育部則定為一個連筆。

透過講者手上的配對遊戲板,見到香港學生「陌生的樣子以為是台灣的,其實是香港的寫法」,反之亦然。

因為今年 Apple 的開發者大會 (WWDC)介紹了不少新的 iPad OS 系統特性,其中一點是可以直接在 App Store 購買或下載字體至 App 中使用。去到答問環節,我就向講者提議 (3:27:53) 不如與 Apple 合作,將這套「自由香港楷書」放在 App Store 上,在今年秋季 iOS 作業系統正式推出後就能讓更多人使用到。在 Apple 公司網頁「如何與我們聯絡 — Apple (香港)」似乎只有銷售方面的聯絡資料。

WWDC 2019 Keynote — Apple — YouTube (1:10:28 to 1:10:48)
Next, I want to talk about fonts.
Now, we all know that fonts bring out the personality of a project, and this year we are giving you a new way to use custom fonts inside of your favorite apps. You will be able to download them right from the App Store. We are working with all of the major providers of fonts.

再後來,我又想到之前我幫忙的 OpenStreetMap。除了 Google 地圖,台灣逐步應用這個開源地圖資料庫。它的設計像維基百科,讓到任何人都可以協力修訂自己社區的地理資訊。我在WikiProject Hong Kong — OpenStreetMap Wiki協助製訂本地的地理結構化數據的規範。雖然花了幾個月將自己居住地區大埔的數據補足,不過最大問題還是沒有人使用(知道)這工具的存在。

▼ 閒置了的 Facebook 專頁,正找尋共同管理者。

⭐️ 1B Raspberry Pi history, tips and use case

由日本來的講者 Masafumi Ohta (@masafumiohta) | Twitter / Japanese Raspberry Pi Users Group,介紹 Raspberry Pi 在英國劍橋誕生的原因。可在 HKOSCon 2019 Day 2 Track 3 (Hall 06) — YouTube (00:00 to 40:51) 中觀看。

這種輕便又價格相宜的電腦是因為在 2008年時其基金會留意到報讀電腦科學的人越來越少,由1999年超過 600 人,去到當年少於 250 人 (5:31)。而當時學生的編程能力只能寫一些簡單 HTML 網頁,而不像之前的錄取生在入讀前已懂寫程式。而近年來,電話與平板電腦這些流動設備足以應付日常生活,也比起電腦更難「黑/hack」。

這個樹莓派可以實體化編程的組件,讓到年幼學生更易明白概念。不過我就覺得這東西對於7至15歲的學童有點悶(可能是我的情感投影)。我自己比較偏愛 Microsoft 的 Minecraft,用遊戲形式來教編程。之前參與過 CS Unplugged 的研討會,有些教育者想出只靠紙筆也能教導科技背後的運作,有時候科技教育不一定需要很多資金。當然我個人取態是多管齊下,集各家之大成。

▼ 學習編程的途徑越來越少,促成以 Raspberry Pi 的出現,嘗試令新一代更易接觸到編程。截圖自大會直播流 6:20。

⭐️ 1C R for Exploratory Data Analysis

這場《R for Exploratory Data Analysis》是關於數據分析工具 R,由數據科學家 Chris Choy 講述最新發展。可在 HKOSCon 2019 Day 2 Track 2 (Hall 05) — YouTube (2:17:30 to 3:00:00) 觀看。

這位講者介紹了一個 package,稱為 tidyverse。一裝它就能整合了大部分數據科學常用的封包,如 ggplot、haven 等,可以讓 R 的新手快速入門的一套工具。有空我要試一試這套分析工具。

▼ 講者介紹的 tidyverse 寫法上有點像 SQL,例如右圖的 mutate 類似 SQL 的 AS。截圖自大會直播流 2:30:18。

這世界實在太多東西可以學習,還是先加入香港 useR 群組。

⭐️ 1C Diagnosis the internet’s health — Mozilla Internet Health Report

這個《Diagnosis the internet’s health — Mozilla Internet Health Report》由台灣而來的講者 Irvin Chen (@irvinfly) Twitter(Mozilla / MozTW 社群)。他主要挑選了 Mozilla 收集世界各地關於網絡使用的情況。完整片段可在 HKOSCon 2019 Day 1 — YouTube (5:14:35 to 5:44:31)找到。


左:《網絡健康報告》、開放文化基金會、Mozoilla 台灣社群。
右:Mozoilla 現正進行的計劃 Common Voice「一組大型、可公開使用的語音資料集,可奠定以機器學習為基礎的語音技術的創新,與健康的商業競爭」

作為心理學學生,這個報告對我來說很吸引。除了網頁上有很多有趣的互動元素解釋各文章的概念,今年的集合5大問題也與我個人近期的關注點有重疊的地方。

▲ 左:報告五大主題 (5:17:12);右:線上線下都是生活 (5:36:45)

科技帶來私隱的問題,閱畢《23 reasons not to reveal your DNA》一文後,我反而覺得,知道自己祖先是從那裏來真的這麼重要,將聚焦擺在現在的生活不是更有用?。

另外一篇《Show me my data, and I’ll tell you who I am》這個研究主要講很多公司會蒐集我們用家的數據、使用習慣,再讓機器分析,建立我們的電子檔案。但是,這些檔案是否真的正確。我去到 Mozilla 攤位與講者再細談之後,與其讓這些公司去估計我們想要甚麼,為何不能主動告訴他們自己的意願呢?

回看之前歐盟推出 GDPR 法令,還是香港八達通公司的新聞,最大問題商業機構偷用我們的資料給第三方知道。無論數據能否帶來好處,有否給予人們知情權才是爭議的地方。

即使我們有大量數據,但是它們不一定中立的。有點像以前中學讀ICT 教的 Garbage In Garbage Out,即使演算法準確無誤,但是輸入一些有問題數據,出來的結果也是無用《Recognizing the bias of artificial intelligence》報告中揭示出一些商業面部識別系統因為不完全的訓練數據,導致在招聘過程有更多性別或種族偏見。科技可以帶來效率,但發展未成熟的技術反而會帶來反效果。或許人工智能也要一本《精神疾病診斷與統計手冊》。

Mozilla 國際/台灣/香港的社群

⭐️ 1D Introducing Open Technology to Hong Kong Education

Introducing Open Technology to Hong Kong Education》由來自香港創意開放科技協會的 Dr. Haggen So 講述香港的科技教育情況。可在 HKOSCon 2019 Day 2 Track 3 (Hall 06) — YouTube (2:35:11 to 3:06:56) 中觀看。

▲ 香港教育局在促進 STEM 課堂上的不足,政府仍流於很多一筆性撥款,沒有很深入去了解這些科技能培訓學生種種方面的用處。截圖自大會直播流(左:2:29:20;右:2:53:03)。

香港教育局官員不太明白 STEM 教育,只當這幾科是一個「課外活動」,公開考試或大學甄選機制亦沒有明顯的配合。另外,講者亦強調一點,STEM 真的只是教學生們學寫程式?

在 Q&A 環節中,講者也指需要時日才能令到香港的課堂有一些運算思維 (computational thinking) 的課程,再加上大部現時的老師都是 liberal arts 的背景。台下則有聲音 (3:06:01)指 工程學 (engineering) 正是STEM 的一個例子,很多老師卻沒有這科的背景。

不過我就覺得設計思維 (Design thinking)也是常忽視的一環。解決問題很重要,但問題是,所謂的解決方案是否真的是目標/使用者的問題呢?完美的代碼卻沒有擊中使用者的痛點,我想就是 STEM 想讓學生們明白的其中一點。

香港創意開放科技協會嘗試讓學生學到這些開放科技可以應用至日常生活上。截圖自大會直播流(左:2:54:25)。

⭐️ 1E Random number generation for simulation, blockchain and cryptography

致力於「化讚為賞 回饋創作 」的 LikeCoin 也有參與。該組織的區塊鏈開發者 Chung Wu 主持了《Random number generation for simulation, blockchain and cryptography》,可在HKOSCon 2019 Day 2 Track 1 (Hall 04) — YouTube中觀看 (beginning to 24:00)

▲用 Minecraft 升級武器系統來表示每一次升級可能會失敗,還原基本級。重點是不同的隨機數計算方法計出來的概率預計值與實際值有差異,尤其是採用 LuaJIT 的時候。 截圖自大會直播流(左:3:02;右:5:54)。

▼隨機數/亂數在加密貨幣的應用: 透過程式去創造一些亂數,增加估到真正鎖頭的難度。截圖自大會直播流(左:7:10;右:1:34)。

來自 LikeCoin 的講者總結要選一個好的偽亂數產生器,還有盡量用一些現成的 加密 libraries,例如其提及在 NodeJS 的 crypto.randombytes 函數 (17:57)。

日常生活裏,其實我不用知道 Excel 背後如何運作才能用。不過作為 LikeCoin 的使用者,我要實地感謝他們的努力。

⭐️ 1F Plant Identification System with AI + AR

來自台灣的 Ru Lu, Wang Fumin and Denken Chen 在《Plant Identification System with AI + AR》介紹他們的植物識別 app,可從HKOSCon 2019 Day 2 Track 4 — YouTube (45:23 to 1:41:49) 中找到。

▼ 這個應用程式採用的科技。在 iOS 上用 Core ML,而 Android 則為 TensorFlow Lite。截圖自大會直播流(1:01:37)

▼ 訓練用的數據不足夠。截圖自大會直播流(51:32)

不像商業組織或政府部門有海量的數據可以餵給機器去訓練,這個植物識別 app 開發者透過 Data Augmentation ,將現有的數據集隨機加工,從而𧗠生出更多數據。而另一個折衷的方法稱為轉/遷移學習 (Transfer learning,53:16)。

▼一些重要概念,截圖自大會直播流

Confusion Matrix 用來圖像化識別模型正確率 (58:35)。而 Saliency Map Analysis (1:00:36) 則找出不同植物class 在像素上主要不同,從而得知預測模型是否真的明白各植物的特徵。這兩個有點像我心理學堂上的 London taxi drivers 記憶研究。透過比較磁力共振造影圖每一格的分別。

▼ 比較不同離線識別模型對流動裝置的空間需求,當然越小越好(1:09:55);

⭐️ 1G A muggle promote Open Source pathways. Take COSCUP sponsorship team for example

「⋯⋯ Open source 專案其實是很有趣,可以學到很多東西⋯⋯」

A muggle promote Open Source pathways. Take COSCUP sponsorship team for example》由在台灣開源人年會 (COSCUP) 的不會編程、在會中幫忙了十年義工 Shia Shia Hsu (Facebook) 或 @lobstershia (shiashia蝦蝦, Twitter) 演講。

▼ 左:透過分享會義賣紀念品來得到一筆可觀的為其組織資金 (38:45)。右:包括任何類型的人在團體中 (40:15)。截圖自大會直播流。

她在 COSCUP 找尋資助與宣傳的工作。她們認為一個好的團隊要有一半工程師及一半「絕對不能是」工程師來組成。這樣才能有創造更多對社區有用的事情。透過這個專案,任何人只要懷著想社區更好的理想就可以加入。我想,社會也是一樣,這種 inclusive 文化能促進不同背景的人溝通。

開源精神不只存在工程師的社區裏。透過這個專案不只邀請他們一起回饋社會,也可以賦權人們,讓他們的知道自己 worthwhile。

學懂選擇,因為世界很大。分享知識,世界會因為您變得更好 (42:59)。

🌸 2 背後的運作

▲ 高錕會議中心內外相片。右方是今次金級贊助商 Microsoft ,一位外國員工正在介紹他們的開源相關科技,如 Visual Studio 及 GitHub。

一個開發者大會背後還是要有人去幫忙換燈泡。這場大會還有很多 (厲害的)技術人員幫忙,這裏我只記錄一部分運作情況。

2A 簽到與名牌列印

▲ 左:第一日準備的情況。右:有一位台灣來的講者對這兩部無線打印機有興趣。

「用自己的技術來支持自己的社群會議」

Sammy Fung 開發,在其《開源會議管理系統 badgeprint — 森路歷程》介紹為何有這個「即場印label」的系統出來。實際體驗這個系統之後覺得這個界面非常實用與整齊。

透過這個系統,工作人員可以派給來到的人根據票據類型相應的名牌(如講者紅色、記者/員工綠色等),並即時用無線打印機列印名字及公司。

大會主要用的購票系統 Eventbrite來作出席記錄。該系統提供iPhone / Android App 來掃描購票確認信或在 Apple Passport 上的 QR-code。

▼將 Eventbrite Organizer (右二)放置在 dock 中方便快速執行

2B 活動資料顯示屏

除了上面的名牌列印及簽到系統,還有另一個很多人忽視,卻非常重要的設施:每個會議室外擺放的動態時間表。可在 HKOSCon 2019 Day 2 Track 2 (Hall 05) — YouTube (4:24:46 to 4:27:28)。

這個由大會義工 Koala Yeung 去研發出來的。以純 HTML 5,沒有任何 dependencies,每一個屏幕顯示相應的研討會主題及演講者相片、活動起始、結束與當刻進度、大會圖案。

2C 紀念品換領

▲ 現場的紀念品新加的購買點。有很多與會者除了問 Kottis 公仔與襟章的售價,還問這位工作人員所使用的外置顯示器資料。取自香港開源年會 Facebook

兩日基本 check-in 過程流暢,不過第二日多了紀念品換購。大會採用 Google 試算表去記錄。

一開始因為有點急,我經常不小心改動到這張名單的姓名及其他不關事的欄位(抱歉,我不夠細心,別打我!)。然後再問了問這個文件建立者,我就加了一個限制編輯在 Taken 一欄以外,只填入 Yes 就足夠。

剛剛提及的 QR-code,這個條碼背後可以對應相關購買資訊。以我的工作人員用門票為例,不論從何處取得,附上的條碼都是 9595526431218532289001。

似乎大會有方法可以從購票系統取得所有參與者的資料,如果改用最近也很熱門的 AirTable,一個輕量級數據庫應該會更易輸入這些換領記錄。

假設票務資料用 csv 形式手動載入好之後,或者透過AirTable 的API,我可以在每一個記錄加上一欄布林值,並在電話中來勾選成「已取」。用 AirTable 手機 app 內置的條描掃描就可以直接搜尋預先匯入好的購買記錄。此舉也可以逐筆記錄去處理,要大批改動也可用網頁版編輯。

既然第一日大會已經應用了 Eventbrite organizer 的行動簽到app,大會來年或考慮一下這個 AirTable app 。

2D 無線網絡

另外,在接待處很多人問的問題是:「這裏有免費的 Wi-Fi 嗎?」僅次於空氣和食物,Wi-Fi 應該是最需要的資源。還好香港科學園未至於這麼落後,答案是有的,SSID 是 Wi-Fi HK via HKSTP (參考 Wi-Fi.HK — 熱點位置 (繁體中文版本))。

來年大會或可考慮印幾個 QR-Code,讓會議參與者一掃就連接這個無總網絡。

▲ 準備開幕check-in流程。我在白衫左四。取自Hong Kong Open Source Conference 香港開源年會 Facebook。

2019年6月19日發佈初稿。

--

--

Curtis’s Digital Life

讀心理學,鐘意科技同效率相關題材。A Psychology student is hooked on technologies and productivity. #地鐵迷 #非火車迷 #科幻 #電子化 #硬筆書法#手寫 #metro #digital #handwritten #calligraphy