Python x MySQL — 從營收出發的產業間分析
上一篇談到了取得營收,這一篇就要來看看如何從 data 中挖礦。
做法很單純,給每個個股標上「產業」的標籤,再用這個標籤把個股分類,就可進行橫向的產業比較。
標籤不會自己生出來,故這裡要借用「TEJ 產業資料庫」,其中包含我們所需要的產業分類(由 TEJ 自行編製),目前是免費的,申請試用的 api key 就可使用。TEJ 官網上有如何使用 api 的教學,資料的回傳值會直接整理好成 dataFrame ,使用上毫無難度。
TEJ API 使用範例
用 api 取得的 data 大概有 150 個欄位,不過我們大概只會用到其中的 5 個,故程式碼中把這些欄位獨立出來,另外建了一個小 table — TEJ_STOCK_DATA_BASIC — 後續都會用他去 join 原本營收的表格。
明星產業 3 秒鐘一把抓
我們選擇 2018 年 12 月的營收資料,檢視各產業的累計營收年增率,進行橫向比較,找出成長中的熱門產業
其實就是簡單的 sql,帶時間參數後,按 AVG_ACC_YOY (平均累計營收年增率) 排序,return 該時間的資料
進一步用 python 函式庫作視覺化
當然也可以做縱向的歷年資料,來檢視產業興衰趨勢
簡單的看法:
- 「建設業」(俗稱建商)在 9 年內 7 次登上成長幅度前十榜,其中三年還是龍頭,在台灣真的沒有任何產業比得上
- 部分產業的循環是非常快的,如「量販」在 2013 年是成長榜的亞軍, 2014 年就成了衰退榜的冠軍
- 一個產業下的子產業會有完全不同的成長曲線,看「太陽能電池」vs 「太陽能系統」就知道
從產業抓個股
有了大方向的產業趨勢,下一步就可以用產業來選股,比如說這邊挑出2018年成長幅度居冠的「汽電共生」來做進一步觀察
看起來只有 8926 — 台汽電 這支個股,那就來看看他歷年營收的表現
將營收中 ID=”8926" 的資料截出來,再結合 2010–2018 年的資料
一樣做個視覺化
上面這個圖也許有些研究投資的朋友會覺得似曾相識,基本上各個股票的網站,如財X狗 / X股網 / GooXinfo! ,上面的線圖也大概就是這樣畫出來的
小結
按「營收」這個維度,我們可以進行下列的分析
- 年度產業營收成長榜
- 歷年產業營收成長榜
- 按產業成長選股
- 個股歷年成長率追蹤
這回分享到這,下一回會探討營收跟價格間的關係,統計上來說就是「自變數」與「依變數」的關係,來看看投顧老師說的「XXX營收井噴你還不上車嗎」這句話在邏輯上能不能相信XD
最後呢不免俗的,如果你覺得這篇文章有幫助的話,按 :clap: 做個鼓勵,長按的話將會得到投資之神的眷顧,我們下回再見