CodeTengu 第 100 期,前 99 期總回顧!

Rick Liu
8 min readSep 24, 2017

什麼是 CodeTengu Weekly(碼天狗週刊)[1]?根據該網頁的標頭描述:「CodeTengu Weekly(碼天狗週刊)是一份開發者導向的 IT 技術週刊,適合所有患有資訊焦慮症、氣血循環不順以及性受挫的軟體工程師們。致力於解決開發者之間的資訊不對稱。」不論我換 Flipboard 或是換 Feedly,碼天狗週刊和湾区日报 [2] 一樣,自我知道後就從沒離開過我的閱讀器。兩者主要都是推薦優質文章給讀者,只是頻率不同,一個是週刊一個是日報;內容方面,湾区日报只有作者一人,發佈內容多少會受到作者個人好惡影響,如果你跟作者有興趣的主題類似,那麼讀起來還是挺有收穫的,而碼天狗週刊則是由一群成員輪流發佈,成員間屬性、專長皆有不同,能看到比較廣泛、多樣化的主題,以及不同角度、更專精的短評。

非常榮幸能夠加入成為碼天狗的發佈成員之一,有點像是從一個樂團小粉絲變成樂團成員的感覺,知道之後內心獨自興奮了好幾天。按目前的規劃,未來在碼天狗週刊上分享的內容主要專注在兩個方向:

  1. Kaggle 競賽相關的技術、心得、解法等文章及資源。
  2. 機器學習/深度學習/人工智慧(這三個詞分不開了)技術、應用、教學等文章及資源。

我的第一期,碼天狗的第 100 期,這一期很特別,平常每週只會有三位 curators 的分享,這次週刊邀請所有有空 curators 都將一起發佈這期的內容,以慶祝第 100 期的到來。在等待這前所未有的第 100 期的同時,我們就用統計的方式,來回顧一下前面的 99 期吧!

碼天狗統計資訊

  • 14 位 curators
  • 經歷 781 天(第一期發表於 2015 年 8 月 3 日),平均 7.89 天一期。
  • 1448 篇分享,平均每期 14.63 篇。
  • 分享文章來自 755 個不同的網站。
  • 分享短評共 91858 字。

來源網站

圖一是出現次數最高的 30 個網站,github、medium、youtube 都不意外,也出現了幾個 curator 自己的網站。乍看之下,大部分都是英文網站,繁中的應該都是 curator 自己的網站,簡中的網站似乎只有微信公众平台 [3] 以及简书 [4]。

[Fig. 1] Top 30 domains from past 99 issues

等等,榜上有 instagram 是怎麼回事?讓我們來看看到底都分享了什麼:

https://www.instagram.com/kimjungmin0111/
https://www.instagram.com/kang_ye_bin/
https://www.instagram.com/lulutung/
https://www.instagram.com/xxjominxx/
https://www.instagram.com/wjmild/
https://www.instagram.com/kiksnowgirl/
https://www.instagram.com/hongz_wannika/
https://www.instagram.com/ray__yang/
https://www.instagram.com/90_allie/
https://www.instagram.com/ayuuubb/
https://www.instagram.com/gojoonhee/
https://www.instagram.com/yua_mikami/
https://www.instagram.com/linzy_minji/
https://www.instagram.com/pantipa.a/
https://www.instagram.com/jessicababyfat/
https://www.instagram.com/gundamstagram/
https://www.instagram.com/qbee7582/
https://www.instagram.com/elaineyongg/
https://www.instagram.com/eunhyeato/
https://www.instagram.com/shiraishi_yuuka/
https://www.instagram.com/iremcheng/
https://www.instagram.com/jovin26/

恩,適當補充正能量!接著讓我們看看短評九萬多字,都在寫什麼吧。

文字詞頻

圖二是短評用字的文字雲,從中發現了各式各樣的主題。常見的語言如 Python、JavaScript、Swift、PHP、Golang、CSS、Elixir、Ruby。內容從使用者研究、到前端 UI 設計、到後端系統效能,甚至到測試、CI、架構、維護、專案管理、團隊管理等等,可以說是包山包海。從前 100 個最常出現的詞彙就能展現如此的多樣性,可想而知內容本身也必定相當精彩。

[Fig. 2] Top 100 vocabularies from reviews

圖三是分享文章的標題和描述所製成的文字雲,明顯可以應證,分享的文章來源以英文網站為大宗,而大網站 SEO 都做得很好,導致 domain name 比例極大。中文部分很輕易地能拼湊出:林軒田教授機器學習基石/技法 XX 講學習筆記。這是其中一位 curator Fukuball [5] 的機器學習 [6] 筆記,相信也是眾所皆知的一個網誌。

[Fig. 3] Top 100 vocabularies from website title & description

說了這麼多,最後隨機抽樣看看幾篇過去被分享的文章,真的是不錯啊。

本文試圖從 CodeTengu Weekly(碼天狗週刊)三種不同屬性文字的詞頻統計來窺探週刊過去 99 期的整體輪廓。總結來說,廣泛的主題、優質的文章、專業的短評,一天兩篇文章的時間,讓你輕鬆跟上科技時代快速變遷的腳步!

[1] http://weekly.codetengu.com
[2] https://wanqu.co
[3] https://mp.weixin.qq.com
[4] http://www.jianshu.com
[5] https://twitter.com/fukuball
[6] http://blog.fukuball.com/tag/machine-learning/

--

--