STATA 簡介

CW Wayne Yeh
Aug 29, 2021

--

STATA 是一個商用統計軟體,同時支援圖形化介面(GUI)與程式指令。讀者也許有使用過 Excel 處理資料,或是聽說過其他統計軟體與程式語言,像是 SPSS、SAS、R、python。那麼為何我們要用 STATA 呢?

STATA 與其他分析工具比較

首先,不論利用何種工具進行實證研究,經常需要有一個腳本(script)把所有流程記錄下來。這不僅是為了方便管理,更是方便他人能重現我們的成果。因為這樣,純 GUI 的工具就顯得十分不便。再來,在眾多可以寫程式指令的統計軟體中,STATA 的指令相對簡單易學。STATA 多數的指令都相當直觀,就像是把步驟用精簡的文字記錄下。這樣的優點在比較複雜的資料操作上尤其明顯,比如說:群組別操作、合併資料、彙整資料等。Fig 1-1 提供 R、STATA 執行的程式碼比較,各位可以猜猜看這是在執行哪些功能。

STATA、R 程式碼比較
Fig 1-1 STATA、R 程式碼比較

當然,STATA 並非沒有侷限。如果需要手刻最新的計量方法、演算法時,也許 R 或 python 會是個比較好的選擇。此外,STATA 的語法也不像程式語言那麼有彈性,這也許是因為程式語言有許多好用的資料結構或物件可以操作。STATA 還有一次只能讀入一份資料的限制,儘管熟悉後這不會是太大的問題。其他統計軟體則有各自的長處,像 SAS 就廣為業界所使用,也有 GUI 版本的 SAS EG 可用。R 和 python 都是免費開源的程式語言,除了用途廣泛功能強大外,也都有龐大的社群在開發與維護,這意味著你很容易就能查到教學與範例。

STATA 主要介面

STATA 主要介面
Fig 1-2 STATA 主要介面

Fig 1-2 為 STATA 的主要介面。Result Window(1) 主要呈現指令輸出的報表;Command Console(2) 可以直接鍵入 STATA 的指令;Variable Block and Properties Block(3) 會顯示目前 STATA 讀取資料的變數欄位、標籤以及一些細節。點選不同變數,就可以在右下角的 Properties Block 看到更多細節。若點選變數前的小箭頭,則可以直接將變數貼至 Command Console。左側是 Review Block(4),用來記錄執行過的指令,有 error 的指令會呈現紅字。在此點擊指令可以將其貼至 Command Console,雙擊之則可以直接再次執 行。

Tool bar(5) 上有各種功能。右側的「Break」可以終止現有程序,旁邊的「More」則可以讓 Result Window(1) 繼續呈現回報的結果(當結果太多時,並不會一口氣都呈現在 Result Window 上)。倘若不希望持續點擊「More」,可以在 Command Console 輸入 set more off,perm ,強制 STATA 執行指令後要一口氣呈現所有結果。Tool bar(5) 中間的「data browser」、「data editor」可以直接瀏覽或修改資料。這兩者分別能藉由 bredit 指令呼叫,尤其br 在檢查資料或檢查指令是否正確執行時特別有用。正中間的「do-file editor」相當重要,點擊後就可以看見 do-file editor 的介面並開始寫 do-file。基本上,do-file 就是 STATA 執行指令的腳本,也是將 STATA 用在研究專題的關鍵功能。我會在下節繼續 do-file 的介紹。

--

--

CW Wayne Yeh

資料分析/閱讀筆記/生活雜感。我是葉政維,台大經研畢,目前是樹鋸分析師🪚,正在職場站穩腳步,也在探索什麼是好的生活。