Python x MySQL — 從營收出發的產業間分析

PHIL
Stock Analysis
Published in
4 min readJul 14, 2019

上一篇談到了取得營收,這一篇就要來看看如何從 data 中挖礦。

做法很單純,給每個個股標上「產業」的標籤,再用這個標籤把個股分類,就可進行橫向的產業比較。

標籤不會自己生出來,故這裡要借用「TEJ 產業資料庫」,其中包含我們所需要的產業分類(由 TEJ 自行編製),目前是免費的,申請試用的 api key 就可使用。TEJ 官網上有如何使用 api 的教學,資料的回傳值會直接整理好成 dataFrame ,使用上毫無難度。

TEJ API 使用範例

用 api 取得的 data 大概有 150 個欄位,不過我們大概只會用到其中的 5 個,故程式碼中把這些欄位獨立出來,另外建了一個小 table — TEJ_STOCK_DATA_BASIC — 後續都會用他去 join 原本營收的表格。

明星產業 3 秒鐘一把抓

我們選擇 2018 年 12 月的營收資料,檢視各產業的累計營收年增率,進行橫向比較,找出成長中的熱門產業

其實就是簡單的 sql,帶時間參數後,按 AVG_ACC_YOY (平均累計營收年增率) 排序,return 該時間的資料

2018 年各產業的成長幅度排序

進一步用 python 函式庫作視覺化

2018 年十大熱門產業

當然也可以做縱向的歷年資料,來檢視產業興衰趨勢

2010–2018 年營收年增率前十大產業(成長產業)
2010–2018 年營收年減率前十大產業(衰退產業)

簡單的看法:

  1. 「建設業」(俗稱建商)在 9 年內 7 次登上成長幅度前十榜,其中三年還是龍頭,在台灣真的沒有任何產業比得上
  2. 部分產業的循環是非常快的,如「量販」在 2013 年是成長榜的亞軍, 2014 年就成了衰退榜的冠軍
  3. 一個產業下的子產業會有完全不同的成長曲線,看「太陽能電池」vs 「太陽能系統」就知道

從產業抓個股

有了大方向的產業趨勢,下一步就可以用產業來選股,比如說這邊挑出2018年成長幅度居冠的「汽電共生」來做進一步觀察

屬於「汽電共生」的個股

看起來只有 8926 — 台汽電 這支個股,那就來看看他歷年營收的表現

將營收中 ID=”8926" 的資料截出來,再結合 2010–2018 年的資料

一樣做個視覺化

台汽電 — 當月營收 vs 營收年增百分比

上面這個圖也許有些研究投資的朋友會覺得似曾相識,基本上各個股票的網站,如財X狗 / X股網 / GooXinfo! ,上面的線圖也大概就是這樣畫出來的

小結

按「營收」這個維度,我們可以進行下列的分析

  1. 年度產業營收成長榜
  2. 歷年產業營收成長榜
  3. 按產業成長選股
  4. 個股歷年成長率追蹤

這回分享到這,下一回會探討營收跟價格間的關係,統計上來說就是「自變數」與「依變數」的關係,來看看投顧老師說的「XXX營收井噴你還不上車嗎」這句話在邏輯上能不能相信XD

最後呢不免俗的,如果你覺得這篇文章有幫助的話,按 :clap: 做個鼓勵,長按的話將會得到投資之神的眷顧,我們下回再見

--

--