Measurement and Scaling Concepts (Research Methodology)

Afdan Rojabi
UX Afdan
Published in
9 min readOct 23, 2019
Gambar : Stephen Dawson

Pada topik ke — 6 ini akan dijelaskan dengan rinci tentang skala pengukuran data yang terdiri dari nominal, ordinal, interval, dan rasio. Skala pengukuran nominal dan ordinal merupakan skala pengukuran diskrit sedangkan untuk interval dan rasio merupakan skala pengukuran kontinyu. Selain itu, skala pengukuran memiliki kriteria pengukuran yang baik yaitu validitas dan reliabilitas.

SKALA PENGUKURAN DATA

Berdasarkan jenis skala pengukuran data, data kuantitatif dikelompokkan ke dalam empat jenis yang memiliki sifat berbeda. Sedangkan definisi dari skala pengukuran merupakan prosedur pemberian angka pada suatu objek agar dapat menyatakan karakteristik dari objek tersebut.

1. SKALA NOMINAL

Skala yang diberikan pada suatu objek yang tidak menggambarkan kedudukan objek atau kategori tersebut terhadap objek atau kategori lainnya, tetapi hanya sekedar label atau kode saja.

Misalnya:

Gender : 1 = laki-laki 2 = perempuan

Pendidikan :

1 = untuk tingkat SLTP

2 = untuk tingkat SMP

3 = untuk tingkat perguruan tinggi

Keterangan :
Angka 1 dan 2 atau 3 pada skala pengukuran ini tidak ada artinya, bahwa angka angka 3 lebih tinggi kedudukannya daripada angka 2 begitu juga sebaliknya. Angka tersebut hanya sebatas identifikasi saja terhadap suatu objek.

Adapun cirri-ciri dari skala tersebut adalah :
a. Kategori data bersifat saling lepas (satu objek hanya masuk pada satu kelompok saja)
b. Kategori data tidak disusun secara logis

2. SKALA ORDINAL

Data yang disusun secara berjenjang mulai dari tingkat terendah sampai ke tingkat tertinggi atau sebaliknya dengan jarak/rentang yang tidak harus sama. Data ini setiap jenjangnya memiliki sifat yang berbeda.

Misalnya :
Tingkat pendidikan diurutkan berdasarkan jenjang pendidikan

Taman kanak-kanak=1

Sekolah Dasar (SD) =2

Sekolah Menengah Pertama =3

Sekolah Menengah Atas =4

Sarjana =5

Analisis data menunjukkan pendidikan Taman Kanak-Kanak dengan nomor urut 1 lebih rendah disbanding dengan tingkat pendidikan SD nomor urut 2 dan SD lebih rendah disbanding SMP.

3. SKALA INTERVAL

Skala interval suatu skala dimana objek dapat diurutkan berdsarkan suatu atribut tertentu, dimana jarak/interval antara tiap objek sama. Pada skala ini yang dijumlahkan bukanlah kuantitas atau besaran melainkan interval dan tidak terdapat nilai nol.

Misalnya :

Pengukuran instrument penelitian.

Dalam banyak kegiatan penelitian data diperoleh sering melalui kuesioner untuk menilai sikap atau perilaku sering dinyatakn dengan data interval, setelah alternative jawabannya diberi skala yang setara dengan data interval.
Contoh :

Jawaban:

STS = 1

TS = 2

N = 3

S = 4

SS = 5

Keterangan :
STS : sangat tidak setuju

TS : tidak setuju

N : netral

S : setuju

SS : sangat setuju

Interval antara STS dan TS atau S dan SS adalah sama.

4. SKALA RASIO

Suatu skala yang memiliki sifat-sifat skala nominal, skla nominal dan skala interval dilengkapi dengan titik nol absolute dengan makna empiris. Karena terdapat angka nol maka pada skala ini dapat dibuat perkalian atau pembagian. Sifat yang membedakan data skala rasio dengan nominal, ordinal dan interval dapat dilihat melalui contoh ini.

Contoh:

panjang suatu benda dalam ukuran meter dinyatakan dalam rasio

a. Panjang benda 1 meter dengan 2 meter sangat berebda nyata, sehingga dapat dibuat kategori benda yang berukuran 1 meter dan 2 meter (sifat data nominal).

b. Ukuran panjang benda mulai dari yang terpendek sampai yang paling panjang (sifat data ordinal).

c. Perbedaan antara panjang benda 1 meter dengan 2 meter memiliki perbedan yang sama antara panjang benda 2 meter dengan 3 meter (sifat data interval).

d. Kelebihan sifat yang dimiliki data rasio ada dua hal, yaitu data rasio memiliki angka 0 meter, artinya tidak ada benda yang diukur dan benda yang memiliki panjang 4 meter, 2 kali lebih panjang dari benda yang memiliki panjang 2 meter. Kedua hal tersebut tidak dimiliki oleh jenis data nominal, ordinal, dan interval.

VALIDITAS

Menurut Azwar (1986) Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.

Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.

Terkandung di sini pengertian bahwa ketepatan validitas pada suatu alat ukur tergantung pada kemampuan alat ukur tersebut mencapai tujuan pengukuran yang dikehendaki dengan tepat. Suatu tes yang dimaksudkan untuk mengukur variabel A dan kemudian memberikan hasil pengukuran mengenai variabel A, dikatakan sebagai alat ukur yang memiliki validitas tinggi. Suatu tes yang dimaksudkan mengukur variabel A akan tetapi menghasilkan data mengenai variabel A’ atau bahkan B, dikatakan sebagai alat ukur yang memiliki validitas rendah untuk mengukur variabel A dan tinggi validitasnya untuk mengukur variabel A’ atau B.

Pengertian validitas juga sangat erat berkaitan dengan tujuan pengukuran. Oleh karena itu, tidak ada validitas yang berlaku umum untuk semua tujuan pengukuran. Suatu alat ukur biasanya hanya merupakan ukuran yang valid untuk satu tujuan yang spesifik. Dengan demikian, anggapan valid seperti dinyatakan dalam “alat ukur ini valid” adalah kurang lengkap.

Validitas suatu instrumen banyak dijelaskan dalam konteks penelitian sosial yang variabelnya tidak dapat diamati secara langsung, seperti sikap, minat, persepsi, motivasi, dan lain sebagainya. Untuk mengukur variabel yang demikian sulit, untuk mengembangkan instrumen yang memiliki validitas yang tinggi karena karakteristik yang akan diukur dari variabel yang demikian tidak dapat diobservasi secara langsung, tetapi hanya melalui indikator (petunjuk tak langsung) tertentu.

Validitas menunjukkan sejauh mana suatu alat pengukur itu mengukur apa yang ingin diukur. Bila seseorang ingin mengukur berat suatu benda, maka dia harus menggunakan timbangan. Timbangan adalah alat pengukur yang valid bila dipakai untuk mengukur berat, karena timbangan memang mengukur berat. Bila panjang sesuatu benda yang ingin diukur, maka dia harus menggunakan meteran. Meteran adalah alat pengukur yang valid bila digunakan untuk mengukur panjang, karena memang meteran mengukur panjang. Tetapi timbangan bukanlah alat pengukur yang valid bilamana digunakan untuk mengukur panjang.

Sekiranya penelliti menggunakan kuesioner di dalam pengumpulan data penelitian, maka kuesioner yang disusunnya harus mengukur apa yang ingin diukurnya. Setelah kuesioner tersebut tersusun dan teruji validitasnya, dalam praktek belum tentu data yang dikumpulkan adalah data yang valid. Banyak hal-hal lain yang akan mengurangi validitas data; misalnya

apakah si pewawancara yang mengumpulkan data betul-betul mengikuti petunjuk yang telah ditetapkan dalam kuesioner.

JENIS-JENIS VALIDITAS

Validitas terbagi menjadi :

  • Concurrent Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan kinerja.
  • Construct Validity adalah validitas yang berkenaan dengan kualitas aspek psikologis apa yang diukur oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu dapat menyebabkan kinerja yang baik dalam pengukuran.
  • Face Validity adalah validitas yang berhuubungan apa yang nampak dalam mengukur sesuatu dan bukan terhadap apa yang seharusnya hendak diukur.
  • Factorial Validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor- faktor yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya, dimana validitas ini diperoleh dengan menggunakan teknik analisis faktor.
  • Empirical Validity adalah validitas yang berkenaan dengan hubungan antara skor dengan suatu kriteria. Kriteria tersebut adalah ukuran yang bebas dan langsung dengan apa yang ingin diramalkan oleh pengukuran.
  • Intrinsic Validity adalah validitas yang berkenaan dengan penggunaan teknik uji coba untuk memperoleh bukti kuantitatif dan objektif untuk mendukung bhwa suatu alat ukur benar-benar mengukur apa yang seharusny diukur.
  • Predictive Validity adalah validitas yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerj seorang di msa mendatang.
  • Content Validity adalah validitas yang berkenaan dengan baik buruknya sampling dari suatu populasi.
  • Curricular Validity adalah validitas yang ditentukan dengan cara menilik isi dari pengukuran dan menilai seberapa jauh pungukuran tersebut merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional.

RELIABILITAS

Reliabilitas adalah hal yang dapat dipercaya. Popham (1995: 21) menyatakan bahwa reliabilitas adalah “…the degree of which test score are free from error measurement” Realibilitas adalah indeks yang menunjukkan sejauh mana suatu alat ukur dapat dipercaya atau dapat diandalkan. Bila suatu alat pengukur dipakai dua kali — untuk mengukur gejala yang sama dan hasil pengukuran yang diperoleh relative konsisten, maka alat pengukur tersebut reliable. Dengan kata lain, realibitas menunjukkan konsistensi suatu alat pengukur di dalam pengukur gejala yang sama. Dengan demikian, keandalan sebuah alat ukur dapat dilihat dari dua petunjuk yaitu kesalahan baku pengukuran dan koefisien reliabilitas. Kedua statistik tersebut masing-masing memiliki kelebihan dan keterbatasan

Reliabilitas, atau keandalan, adalah konsistensi dari serangkaian pengukuran atau serangkaian alat ukur. Hal tersebut bisa berupa pengukuran dari alat ukur yang sama (tes dengan tes ulang) akan memberikan hasil yang sama, atau untuk pengukuran yang lebih subjektif, apakah dua orang penilai memberikan skor yang mirip (reliabilitas antar penilai). Reliabilitas tidak sama dengan validitas. Artinya pengukuran yang dapat diandalkan akan mengukur secara konsisten, tapi belum tentu mengukur apa yang seharusnya diukur. Dalam penelitian, reliabilitas adalah sejauh mana pengukuran dari suatu tes tetap konsisten setelah dilakukan berulang-ulang terhadap subjek dan dalam kondisi yang sama. Penelitian dianggap dapat diandalkan bila memberikan hasil yang konsisten untuk pengukuran yang sama. Tidak bisa diandalkan bila pengukuran yang berulang itu memberikan hasil yang berbeda-beda.

JENIS-JENIS REABILITAS

Ada dua cara umum untuk mengukur reliabilitas, yaitu:

  1. Relibilitas stabilitas. Menyangkut usaha memperoleh nilai yang sama atau serupa untuk setiap orang atau setiap unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini menyangkut penggunaan indicator yang sama, definisi operasional, dan prosedur pengumpulan data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk dapat memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah sama atau hampir sama.
  2. Reliabilitas ekivalen. Menyangkut usaha memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda pada waktu yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau lebih indicator yang berbeda, batasan-batasan operasional, paeralatan pengumpulan data, dan / atau pengamat-pengamat. Menguji reliabilitas dengan menggunakan ukuran ekivalen pada waktu yang sama bias menempuh beberapa bentuk. Bentuk yang paling umum disebut teknik belah-tengah. Cara ini seringkali dipakai dalam survai.Apabila satu rangkaian pertanyaan yang mengukur satu variable dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan tersebut dibagi dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering digunakan untuk teknik belah tengah ini.) Hasil masing-masing bagian pertanyaan diringkas ke dalam skor, lalu skor masing-masing bagian tersebiut dibandingkan. Apabila dalam skor kemudian skor masing-masing bagian tersebut dibandingkan. Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah. Reliabilitas ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda. Kecemasan misalnya, telah diukur dengan laporan pulsa. Skor-skor relatif dari satu indikator macam ini haruslah sesuai dengan skor yang lain. Jadi bila seorang subyek nampak cemas pada ”ukuran gelisah” orang tersebut haruslah menunjukkan tingkatan kecermatan relatif yang sama bila tekanan darahnya yang diukur.

METODE PENGUJIAN RELIABILITAS

Tiga tenik pengujian realibilitas instrument antara lain :

  1. Teknik Paralel (Paralel Form atau Alternate Form)

Teknik paralel disebut juga tenik ”double test double trial”. Sejak awal peneliti harus sudah menyusun dua perangkat instrument yang parallel (ekuivalen), yaitu dua buah instrument yang disusun berdasarkan satu buah kisi-kisi. Setiap butir soal dari instrument yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson).

2. Teknik Ulang (Test Re-test)

Disebut juga teknik ”single test double trial”. Menggunakan sebuah instrument, namun dites dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas. Teknik perhitungan yang digunakan sama dengan yang digunakan pada teknik pertama yaitu rumus korelasi Pearson. Menurut Saifuddin Azwar, realibilitas tes-retest adalah seberapa besat derajat skor tes konsisten dari waktu ke waktu. Realibilitas diukur dengan menentukan hubungan antara skor hasil penyajian tes yang sama kepada kelompok yang sama, pada waktu yang berbeda.

Metode pengujian reliabilitas stabilitas yang paling umum dipakai adalah metode pengujian tes-kembali (test-retest). Metode test-retest menggunakan ukuran atau “test” yang sama untuk variable tertentu pada satu saat pengukuran yang diulang lagi pada saat yang lain. Cara lain untuk menunjukkan reliabilitas stabilitas, bila kita menggunakan survai, adalah memasukkan pertanyaan yang sama di dua bagian yang berbeda dari kuesioner atau wawancara. Kesulitan terbesar untuk menunjukkan reliabilitas stabilitas adalah membuat asumsi bahwa sifat / variable yang akan diukur memang benar-benar bersifat stabil sepanjang waktu. Karena kemungkinan besar tidak ada ukuran yang andal dan sahih yang tersedia. Satu-satunya faktor yang dapat membuat asumsi-asumsi ini adalah pengalaman, teori dan/atau putusdan terbaik. Dalam setiap kejadian, asumsi ini selalu ditantang dan sulit rasanya mempertahankan asumsi tersebut atas dasar pijakan yang obyektif.

3. Teknik Belah Dua (Split Halve Method)

Disebut juga tenik “single test single trial”. Peneliti boleh hanya memiliki seperangkat instrument saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrument menjadi dua sama besar. Cara yang diambil untuk membelah soal bisa dengan membelah atas dasar nomor ganjil-genap, atas dasar nomor awal-akhir, dan dengan cara undian.

Referensi :

  • Lecture Notes Week 6: Measurement and Scaling Concepts (BINUS University)
  • Zikmund, Babin, Carr, and Griffin. 2009. Business Research Methods. Thomson South-Western.

--

--

Afdan Rojabi
UX Afdan

User Experience | Product | Management & Business