【JASP】統計分析與實作

NTU Data Analytics Club
NTU Data Analytics Club
8 min readJan 9, 2023

本學期很榮幸請到 郭俊東講師(Tim )為 DAC 社員介紹 Excel 常用的功能以及函數,並教大家如何使用 Excel 和統計軟體 JASP 執行各項統計分析。本篇文章將分享 JASP 的操作方式,繼續看下去一起無痛學習這個好用的統計軟體!

郭俊東(Tim) 講師介紹:

臺灣大學健康政策與管理研究所博士,曾任哈佛大學公衛學院博士後研究員及國防醫學院兼任教師,專長教學論文寫作、統計學及統計軟體。

文章目錄
一、JASP 簡介
二、描述性統計
三、推論性統計-獨立樣本 t 檢定
四、推論性統計-變異數分析(ANOVA)
五、推論性統計-卡方檢定
六、推論性統計-相關分析

本篇文將著重於 JASP 的操作方式,詳細的統計概念或 Excel 操作方式請參考:

【Excel】統計概念介紹【Excel】統計概念與實作

一、JASP 簡介

JASP(Jeffrey’s Amazing Statistics Program) 是一款免費的統計軟體,主要的特色是簡單直觀的操作介面,以及具備完整的分析功能,而且大部分功能用點選即可完成統計分析,非常推薦利用JASP來學習和熟悉各項統計方法!

基本介紹

  1. 匯入檔案:打開 JASP 以後點擊左上角的選單,尋找你要匯入的檔案。另外,如果是平時想要做練習,可以點擊「Data Library」中的範例資料集喔!

2. 介面介紹:匯入檔案後就會進入 JASP 的操作頁面

  • 資料欄位:JASP 會自動判讀每一欄位的變項類型,若有判別錯誤的情形,可以點選表頭的小圖示進行更改。
補充:JASP 將等距(Interval)和等比(Ratio)變項統一歸類為連續型變項(Scale)
  • 上排列表:顯示的是常用的分析模組,像是敘述統計、t檢定、ANOVA 等
  • 新增模組:點擊右上方的加號可以新增更多分析模組到上方列表中
回到目錄

二、描述性統計

在拿到一筆資料時,首先需要運用描述性統計的方式來了解和掌握資料的分佈和樣貌,包括查看平均值、中位數、標準差等等,而在 JASP 可以直接一鍵查看這些統計值!

  1. 操作步驟:
  • 點選功能列「Descriptive」
  • 將想要分析的變項放入「Variables」,即可在介面右側看到結果
補充:可以將「名義尺度(Nominal)」或「序位尺度(Ordinal)」的變項放進「Split」,則可以看到資料分割後的描述統計。以下圖為例,將性別放進 Split 之後,即可查看男性與女性的銷售額狀況。

2. 結果呈現:系統預設會呈現 Valid(有效值)、Missing(缺失值)、Mean(平均值)、Std. Deviation(標準差)、Minimum(最小值)和Maximum(最大值)。如果需要查看更多統計值的話,可以點「Statistics」底下更多的項目,包含四分位數、集中趨勢、離散趨勢、偏態、峰度等指標。

回到目錄

接著將介紹推論性統計常用的幾種檢定和分析方法,推論性統計是運用由母體抽樣的樣本來推估母體的特質(見微知著),建立虛無假設(H0)與對立假設(H1)以驗證兩變項之間是否具有關聯。

三、推論性統計-獨立樣本 t 檢定

獨立樣本 t 檢定的目的是比較「2 個獨立樣本的平均數」是否具有顯著差異。以本次分析的銷售資料集為例,想了解 Type A 和 Type B 兩種介面的銷售金額(Sales) 是否具有統計上的顯著差異,即可使用獨立樣本 t 檢定。

  1. 操作步驟:
  • 點選功能列「T-Tests」,選擇「Independent Samples T-Test」
  • 將想確認的依變項放入「Dependent Variables」,樣本分組放入「Grouping Variable」
  • Test 選擇「Student」
  • 若要查看描述統計,可以點選「Descriptives」
獨立樣本 t檢定的假設為兩組樣本的變異數具有同質性,若想檢驗兩組樣本的變異數是否具有同質性,可以點選「Assumption Check」中的「Equality of variances」

2. 結果呈現:獨立樣本 t 檢定 p 值小於 0.05 即代表兩樣本的平均數具有顯著差異,而究竟是哪一組樣本的平均數較高,則可以看描述統計來判斷。

以此資料集為例,Type A 和 Type B 這兩種介面的銷售額平均值具有顯著差異,代表 Type B 介面的平均銷售金額 602.76 顯著高於 Type A 的 527.44。

回到目錄

四、推論性統計-變異數分析(ANOVA)

若要比較「多組樣本的平均數」是否具有顯著差異,則可以使用變異數分析。ANOVA 是 Analysis of Variance 的縮寫,會叫做變異數分析是因為計算方式是將變異數拆解為「組間變異數」和「組內變異數」,藉此來判斷各組的平均數是否具有顯著差異。ANOVA 的結果僅能解讀為多組樣本的平均數顯著不同,若要進一步找出哪兩組的平均數具有顯著差異則需要採用事後檢定(Post Hoc Test)來驗證。

  1. 操作步驟:
  • 點選功能列「ANOVA」中的「ANOVA」
  • 將依變項放入「Dependent Variable」,自變項(分組)放入「Fixed Factors」
  • 點選「Post Hoc Tests」進行事後檢定,放入自變數,選擇事後檢定的類型
商業上常用 Tukey 和 Bonferroni 事後檢定,Scheffe 法相對嚴謹因此常用於醫藥衛生研究領域

2. 結果呈現:ANOVA的 p 值若小於 0.05 即代表多組樣本間的平均數沒有完全相同,進一步查看事後檢定的結果則可以檢視哪幾組樣本的平均數具有顯著差異。以此資料集為例,鑽石級會員的平均銷售額顯著高於黃金會員和普通會員,而黃金會員的平均銷售額也顯著高於普通會員。

回到目錄

五、推論性統計-卡方檢定

卡方檢定適用於兩個變項皆是「類別型變數」,目的是確認兩變項之間是否具有關聯,若觀測值(即實際分佈)非常接近期望值(兩變項為獨立事件下的期望值),則無法拒絕虛無假設,意即兩件事情彼此獨立並無關聯。

  1. 操作步驟:
  • 點選功能列「Frequencies」中的「Contingency Tables」
  • 建議將 X 放入列、Y 放入欄

2. 結果呈現:

  • 選擇「Expected」可以呈現兩變項的期望值
  • 點選「Percentage」選擇列的百分比,通常百分比會顯示自己想要關心的變項分布比例。以此資料集為例,想要知道 Type A 和 Type B 兩種介面下各等級會員的人數比例,因此將 Group 放在列,並選擇顯示每列的人數比例(每列的加總是 100%)
  • 卡方檢定的 p 值若小於 0.05 則代表兩變項間有關聯(並非獨立事件)
回到目錄

六、推論性統計-相關分析

最後介紹的是 Pearson 相關分析,目的是用於判斷連續變數之間的相關程度。一般來說,若 Pearson 點選功能列「Regression」中的「Correlation」

  1. 操作方式:
  • 將想要分析的變項放入「Variables」
  • 相關係數 r 的絕對值大於 0.7 屬於高度相關,小於 0.3 則屬於低度相關。

2. 結果呈現:可以從相關矩陣查看兩兩變項間的相關係數是多少,以及是否達到顯著水準。以此資料集為例,會員年齡和加入會員的年數呈現高度正相關(r=0.98)。若想看實際分佈狀況,也可以點選「Scatter plots」查看散佈圖。

回到目錄

非常感謝 Tim 在這學期的一開始就為第四屆社員帶來如此扎實的課程內容,概念和實務性兼具!相信社員經過了三堂的課程後不僅能得心應手地掌握 Excel 的各種功能,也學會使用 JASP 來進行統計分析!

歡迎各位拍手交流,NTUDAC 也會持續在 MediumFacebookLinkedIn 更新社課的資訊,歡迎對資料有興趣的大家持續關注,跟我們交流想法~

#社課精華 #JASP

--

--

NTU Data Analytics Club
NTU Data Analytics Club

臺大資料分析與決策社 (NTUDAC) 為一群對資料科學抱有熱忱的臺大學生創立, 旨在教授學員如何利用數據分析解決商業問題的商業性社團,在 Medium 將分享社團課程與實作專案內容,以期推廣資料分析的相關資訊。