#

Probability atau Non Probability Sampling, Mana yang Lebih Baik

      Dalam melakukan penelitian, kita dihadapkan pada masalah bagaimana menentukan jumlah sampel dan target sampel yang tepat agar menghasilkan kesimpulan yang paling tepat yang mewakili kondisi karakteristik populasi yang sebenarnya. Pada penjelasan sebelumnya, saya telah menjelaskan tentang probability dan non probability sampling. Namun, dalam pelaksanaan di lapangan keduanya memiliki kelebihan dan kekurangan masing-masing, metode probability sampling tidak selalu lebih baik dari pada non probability sampling, begitu pun sebaliknya. Hal ini bergantung pada kondisi di lapangan serta karakteristik objek penelitian.

Kelebihan probability sampling

1.     Pengambilan sampel akan lebih objektif karena dilakukan secara acak tanpa melihat baik atau buruknya kondisi objek penelitian. Setiap individu memperoleh kesempatan yang sama untuk terpilih sebagai sampel.
Contoh, BPS akan melakukan survei ubinan tanaman pangan untuk komoditi padi sawah, maka plot padi sawah yang terpilih harus dilakukan dengan probability sampling, agar semua lokasi sawah baik yang subur maupun kurang subur dapat terpilih sebagai sampel.
2.    Kesimpulan yang dihasilkan tidak sebatas pada analisis deskriptif, tetapi juga dapat dilakukan analisis inferensia.
Misalnya, rata-rata pengeluaran rumah tangga dari hasil survei sosial ekonomi nasional terhadap SEJUMLAH rumah tangga di Kabupaten A sebesar Rp 7.542.000 perkapita per tahun. Karena survei ini menggunakan probability sampling, maka nilai rata-rata pengeluaran SELURUH rumah tangga di Kabupaten A dapat di estimasi dengan menggunakan analisis inferensia.


Kekurangan probability sampling

1.    Untuk penelitian objek yang tidak memiliki master frame (kerangka sampel) metode ini sulit dilakukan, karena poada umumnya peneliti harus melakukan listing (pendaftaran) setiap individu dalam populasi, meskipun ada beberapa metode/teknik probabily sampling yang tidak membutuhkan informasi jumlah polulasi individu tersebut (dapat dibaca pada artikel berikut).
Contoh, seorang mahasiswa akan melakukan penelitian tentang perbandingan efisiensi teknis produksi keramik di Kecamatan A dan Kecamatan B. Jika ingin menggunakan probability sampling, maka dia terlebih dahulu harus mendaftar semua pengrajin keramik yang berstatus pengusaha (bukan buruh) di kedua Kecamatan tersebut.
2.        Membutuhkan waktu, tenaga dan biaya yang lebih besar.
       Misalnya, pada contoh di atas, untuk melakukan listing pengrajin keramik, maka mahasiswa         tersebut membutuhkan waktu penelitian yang lebih lama, tenaga yang lebih besar, dan biaya         penelitian yang lebih banyak, untuk mencapai tujuan penelitiannya. 

Kelebihan non probability sampling

1.         Membutuhkan waktu, tenaga dan biaya yang lebih kecil dibanding probability sampling.
Contoh, seorang mahasiswa ingin meneliti tentang minat baca masyarakat. Untuk memudahkan penelitian, dia cukup mewawancarai 60 responden yang ditemuinya di sekitar kampusnya, seperti di taman, tempat hiburan dan lain-lain.
2.     Tidak memerlukan kerangka sampel dalam memilih sampel penelitian. Yang terpenting adalah adanya populasi target yang telah ditentukan oleh peneliti.
Misalnya, pada contoh nomor 1 di atas, si mahasiswa tidak perlu membuat sample frame terlebih dahulu sebagai dasar penentuan responden yang akan diwwancarainya.

Kekurangan non probability sampling

1.        Hasil penelitian bisa jadi kurang representative karena subjektivitas peneliti dalam memilih sampel target penelitian.
Contoh, seorang peneliti ingin mengetahui efektivitas penggunaan kontrasepsi di Kecamatan A. Kemudian mengambil sampel beberapa dusun yang dekat dengan tempat tinggalnya. Maka, kesimulan yang dihasilkan nanti bisa jadi kurang representative karena ternyata dusun sekitar tempat tinggalnya merupakan orang-orang yang berpendidikan tinggi yang memahami pentingnya kualitas penduduk, bukan kuantitasnya.
2.     Analisis yang digunakan hanya sebatas analisis deskriptif saja, sehingga kesimpulan penelitian hanya untuk menggambarkan kondisi/karekteristik kumpulan individu yang menjadi sampel saja, bukan untuk mewakili keseluruhan populasi.
Misalnya, pada contoh nomor 1 di atas, kesimpulan penelitian ini hanya berlaku untuk sampel sekelompok itu saja, tidak dapat mewakili kondisi seluruh Dusun di Kecamatan Tersebut.

Skala Pengukuran Data

Jenis data statistik jika ditinjau dari skalanya dapat dibedakan menjadi 4 macam yaitu

1.         Skala Nominal

Skala nominal yaitu skala yang hanya menunjukkan pengelompokan objek, individu-individu, peristiwa/kejadian dalam suatu populasi. Skala ini tidak begitu bermakna matematis karena hanya menunjukkan hanya dapat menunjukkan frekuensi dari masing-masing objek. Kita tidak membandingkan kualitas antara satu objek dengan objek lainnya.
Misalnya di dalam sebuah kelas terdapat 20 buah bangku, 18 buah meja, 4 buah sapu, dan 1 buah lemari. Secara skala, posisi benda-benda tersebut setara, bangku tidak lebih baik dari pada meja, sapu tidak lebih indah dari pada lemari, dan sebagainya.

2.        Skala Ordinal

Skala ordinal adalah skala yang digunakan untuk menunjukkan perbandingan sekelompok objek dari tinggi ke rendah atau sebaliknya. Posisi antar objek atau kategori tidak setara sehingga kita dapat mebandingkan anatara satu dengan yang lainnya lebih tinggi ,lebih baik dsb.

Contoh data dengan skala ordinal yaitu tingkat kepuasan pengunjung perpustakaan terhadap layanan perpustakaan. Skalanya dapat dibagi menjadi 4 skor yaitu :
5  : sangat puas
4  : puas
3  : cukup puas
2  : kurang puas
1  : sangat tidak puas

Dari skala tersebut dapat dilihat bahwa semakin tinggi skor yang diperoleh maka semakin baik tingkat kepuasan yang dihasilkan.

3.        Skala Interval

Skala interval memiliki semua sifat skala ordinal. Namun, skala ini mampu memperlihatkan jarak yang sama antara ukuran yang satu dengan yang lain. Seperti halnya pada contoh skala ordinal di atas, kita tidak dapat mengetahui ukuran yang pasti jarak antara puas dan sangat puas. Pada skala interval ini sudah memiliki jarak yang teratur dan dapat diukur secara matematis, namun hanya sebatas penjumlahan dan pengurangan saja.

Sebagai contoh suhu air dalam panci sebelum dipanaskan yaitu 15oC. Setelah dipanasi selama 5 menit suhunya berubah menjadi 47oC. Hal ini dapat disimpulkan bahwa suhu air meningkat 32oC setelah dipanaskan selama 5 menit.

Hal lain yang perlu diketahui dari skala interval adalah, skala ini tidak memiliki nilai nol yang mutlak. Misalnya suhu ruangan 0oC bukan berarti ruangan tersebut tidak memiliki suhu.

4.        Skala Rasio

Skala rasio memiliki semua sifat yang dimiliki oleh skala interval. Namun, skala rasio memiliki nilai nol yang mutrak (absolut).
Sebagai contoh :
Jumlah sepatu       = 5 pasang berarti terdapat sepatu sebanyak 5 pasang
Jumlah sepatu       = 0 pasang berati tidak ada sepatu

Operasi matematis pada skala rasio tidak terbatas pada penjumlahan dan pengurangan saja tetapi juga pada perkalian dan pembagian.
Misalnya
Jarak Kota A ke Kota B = 30 km
Jarak Kota A ke Kota C = 60 km
Dapat disimpulkan bahwa jika dilihat dari kota A, kota C 2 kali lebih jauh dari pada kota B.

Contoh Kasus : Nilai Ulangan Matematika Kelas X, apakah termasuk skala nominal, ordinal, interval atau rasio?
Analisa : Jika kita membuat permisalan data dilai ulangan tersebut yaitu
Siswa A           : 60
Siswa B           : 85
Siswa C           : 30
Siswa D           :  0

Data tersebut memiliki ukuran interval yang jelas misalnya “selisih nilai A dan B adalah 35 poin” atau “siswa B memiliki nilai 35 poin lebih tinggi dari pada siswa A”. Hal yang dapat kita simpulkan dari data tersebut yaitu :
Siswa B memiliki pengetahuan lebih baik di bidang matematika dari pada siswa A. Hal ini dapat dilihat dari nilai yang diperoleh.

Dari permisalan tersebut kita dapat melihat bahwa data nilai ulangan Matematika Kelas X sudah memenuhi kriteria skala interval. Namun apakah data ini mampu memenuhi syarat skala rasio. Kita lihat

1.       Jika seorang siswa memiliki nilai 0 pada ulangan matematika ini bukan berarti dia tidak memiliki nilai. Dia tetap memiliki nilai yaitu dari skala 0-100 di memiliki nilai nol. Jadi data nilai ulangan matematika tidak memiliki nol mutlak.
2.      Nilai siswa A = 60 dan nilai siswa B = 30. Tetapi kita tidak boleh menyimpulkan bahwa siswa A 2 kali lebih pintar Matematika dibanding siswa C. kita hanya dapat menyimpulkan bahwa siswa A lebih pintar matematika dibanding siswa C atau siswa A memiliki nilai matematika 30 poin lebih baik daripada siswa C.

Kesimpulan : Data nilai ulangan matematika kelas X merupakan data dengan skala interval.

Berikut Saya berikan tabel perbandingan skala data

Pembagian Data

Data merupakan kumpulan kejadian dari sebuah fakta yang terjadi. Data masih membutuhkan proses pengolahan untuk dapat dijadikan informasi. Data dapat dibagi menjadi beberapa jenis. Berikutsaya akan menjelaskan pembagian/pengelompokan data.

1.      Data Menurut Sumbernya

Menurut sumbernya berpatok pada sumber perolehan data tersebut, apakah data tersebut berasal dari internal atau eksternal. Data internal adalah data yang diperoleh dari dalam organisasi atau kelompok sendiri. Sebagai contoh, seorang wakil kepala sekolah bidang kemahasiswaan ingin mencari data jumlah siswa menurut kelas dan jenis kelamin, maka data tersebut dapat dipeoleh langsung dari intern sekolah itu sendiri dengan mengumpulkan data dari masing-masing wali kelas. Sementara itu data eksternal adalah data yang dipeoleh dari luar organisasi atau kelompok. Sebagai contoh, seorang pedagang mainan anak-anak ingin membuka lapak baru di sebuah kecamatan, maka dia perlu mencari data tentang jumlah penduduk menurut kelompok usia di kantor statistik setempat agar dapat memperoleh data potensi jumlah anak-anak yang menjadi target pelanggannya.

2.      Data Menurut cara memperolehnya.

Data menurut cara mempeolehnya mengacu pada bagaimana data itu dapat dipeoleh, yaitu data primer dan data sekunder. Data primer adalah data yang dikumpulkan sendiri oleh suatu kelompok, organisasi, instansi, atau secara perorangan langsung pada objek yang didata. Misalnya, seorang peneliti ingin mengetahui tingkat kepuasan penumpang terhadap pelayanan Bus TransJakarta dengan mewawancarai langsung penumpang TransJakarta di halte-halte yang menjadi sampelnya. Sedangkan, data sekunder adalah data yang telah diolah oleh pihak lain dan diperoleh dalam bentuk jadi, umumnya dalam bentuk publikasi seperti buku, leaflet, dan infografis. Misalnya, seorang mahasiswa ingin mengukur tingkat ketercukupan pangan di suatu wilayah Kabupaten, maka dia akan mengumpulkan data konsumsi pangan per kapita per tahun serta data produksi pangan dalam setahun yang telah dipublikasikan oleh instansi terkait seperti Dinas Pertania atau Badan Pusat Statistik.

3.      Data Menurut Sifatnya

Data menurut sifatnya dapat dibagi menjadi data kualitatif dan data kuantitatif. Data kualitatif adalah data yang tidak berbentuk angka. Data kualitatif pada umumnya menggunakan kata sifat sebagai ukurannya, misalnya : Harga bawang putih saat ini sangat mahal, jumlah rumah tangga di Dusun ini cukup banyak, dan sebagainya. Data kualitatif dapat pula menunjukkan fenomena, misalnya : penghitungan suara hasil pilkada di tingkat kecamatan berjalan lancar, jumlah pengguna jasa KRL terus meningkat, dan sebagainya.  Sementara itu, data kualitatif adalah data yang dinyatakan dalam bentuk angka. Misalnya, harga bawang putih saat ini Rp 25.000 per kg, terdapat 230 rumah tangga yang tinggal di dusun ini, proses penghitungan suara hasil pilkada sudah mencapai 90 persen, dan lain-lain.

4.      Data Menurut Waktu Pengumpulannya

Data menurut waktu pengumpulannya mengacu pada saat kapan data itu dikumpulkan. Ini terbagia atas data cross section dan data time series. Data coss section adalah adalah yang dikumpulkan pada satu periode waktu tertentu. Data ini akan menggambarkan kondisi atau kejadian pada waktu yang bersangkutan. Misalnya Jumlah Mahasiswa Kampus P menurut jurusan dan jenis kelamin pada tahun ajaran 2017/2018. Sedangka data time series atau data berkala adalah data yang dikumpulkan secara berkala dari waktu ke waktu. Pada umumnya data ini digunakan untuk menunjukkan perkembangan suatu fenomena atau kegiatan dari waktu ke waktu. Misalnya pergerakan kurs Rupiah terhadap Dollar AS selama 4 bulan terakhir, pergerakan inflasi bulanan selama satu tahun terakhir, dan perkembangan harga bawang merah di pasar tradisional selama bulan Juni – Desember tahun 2016.

Mengapa Data Statistik Diasumsikan Normal

Bagi para peneliti, seperti kalangan mahasiswa jurusan tertentu saat mengerjakan tugas akhir, sering dihadapkan pada analisis yang menggunakan beberapa metode statistik. Untuk memecahkan beberapa masalah tertentu terkadang kita memerlukan beberapa asumsi agar mampu memecahan masalah yang sedang diteliti, seperti mengestimasi parameter, dan lain-lain.

Hal yang paling umum dilakukan dalam menganalisis suatu masalah dengan metode statistik yaitu uji kenormalan. Sering kali kita harus mengasumsikan data tersebut mengikuti distribusi normal. Mengapa demikian?

Kita mengasumsikan normal, karena pada umumnya fenomena atau kejadian dunia ini mengikuti sebaran/distribusi normal. Sehingga, dalam mengesimasi parameter fenomena/kejadian tersebut kita mendekatinya dengan pengujian asumsi normalitas.

Namun demikian, banyak orang yang terlalu memaksakan kondisi suatu objek penelitian harus berdistribusi normal. Itu adalah pandangan yang keliru. Asumsi distribusi normal hanyalah sarana untuk mencapai tujuan penelitian. Hanya saja alat-alat statistik yang umum dan banyak dikenal oleh para peneliti memerlukan asumsi kenormalan tersebut.

Saat data suatu penelitian tidak mengikuti distribusi normal, maka hal yang pertama yang bisa dilakukan yaitu mengidentifikasi penyebab dari ketidaknormalan tersebut. Selama penyebab ketidaknormalan tersebut dapat diatasi, maka penelitian dapat dilanjutkan menggunakan alat statistik yang mensyaratkan data yang berdistribusi normal. Namun, jika tidak, maka silakan menggunakan alat statistik lain yang tidak mensyaratkan data harus berdistribusi normal.


Alat-alat statistik yang tidak mensyaratkan data yang berdistribusi normal dapat dibaca pada tulisan saya berikutnya.

Pemusatan Data

Dalam ilmu statistik, terdapat tiga ukuran pemusatan data, yaitu mean, median dan modus. Ukuran pemusatan data ini digunakan untuk  melihat suatu kelompok data berpusat pada suatu titik atau area tertentu. Masing-masing dari mean, median dan modus memiliki keunggulan dan kelemahan sehingga penggunaannya dalam penelitian juga berbeda-beda.

1.   Mean

Mean diperoleh dari nilai rata-rata suatu kelompok data. Rata-rata yang digunakan disini adalah nilai rata-rata aritmetika yang diperoleh dengan menjumlahkan seluruh nilai data dibagi dengan jumlah datanya. Mean biasanya dilambangkan dengan ยต untuk data populasi atau  (x-bar)untuk data sampel.


Dimana x adalah nilai observasi, n adalah jumlah observasi, dan i = 1,2,…, n

Contoh aplikasi :
Hasil ujian fisika 20 siswa di kelas XII IPA dituliskan sebagai berikut :
71  93  66  78  90  88  87  40  91  99  79  72  82  80  85  78  90  82  81  74
Jika siswa yang nilainya berada dibawah nilai mean dikurangi 10 harus mengikuti remedial, berapa siswa yang tidak perlu mengikuti remedial?
Penyelesaian
                                                               = 80,3
Maka mean – 10 = 70,3  Sehingga jumlah siswa yang tidak perlu mengikuti remedial adalah siswa yang nilainya di atas 70,3 yaitu sebanyak 17 orang.
Kelebihan dan Kelemahan Mean
Keunggulan :  
1.  Mean atau rata-rata lebih dikenal dan sering digunakan banyak orang terutama di kalangan peneliti, sehingga lebih mudah untuk menggunakannya.
2. Setiap kelompok data hanya memiliki satu nilai rata-rata saja. Karena hanya memiliki satu nilai rata-rata, maka ukuran pemusatan data ini (mean) bisa digunakan untuk inferensia statistic sdeperti uji beda rata-rata dua populasi atau lebih.

Kelemahan  :
1. Nilai rata-rata (mean) sangat sensitif terhadap data outlier (pencilan) karena penghitungannya menggunakan seluruh nilai data observasi. Adanya data pencilan tersebut menyebabkan nilai rata-rata yang dihasilkan menjadi kurang representatif.

1.      Niali rata-rata (mean) tidak dapat digunakan untuk data yang bersifat kualitatif.
2.  Jika data telah dikelompokkan, maka nilai rata-rata tidak mencerminkan nilai yang sesungguhnya.
3.  Rata-rata tidak dapat dihitung jika data dimasukkan ke dalam kelompok dengan kelas terbuka.
Contok kelas terbuka 



Jenis-jenis tabel



Tabel merupakan media penyajian data yang sering digunakan, tidak hanya dalam bidang statistik, tetapi juga dalam bidang-bidang keilmuan lainnya. ada beberapa jenis tabel yang umum digunakan. Disini saya akan menjelaskan sedikit jenis-jenis tabel tersebut.

1.   Tabel satu arah
Tabel satu arah adalah tabel yang memuat keterangan mengenai satu hal atau satu karakteristik saja. Karakteristik yang ditunjukkan bisa berupa jumlah, frekuensi, ukuran, kadar/persentasi, dan lain-lain. Contoh tabel satu arah

Daftar inventaris kelas X-1 T.A. 2012/2013
Sumber : data fiktif

2.  Tabel 2 arah
Tabel dua arah adalah tabel  yang menunjukkan hubungan antara dua hal atau karakteristik. Misalnya data mahasiswa menurut kelompok usia dan jenis kelamin, asal daerah dan agama, jurusan dan jenis kelamin, dan lain-lain.
Contoh tabel dua arah

Jumlah mahasiwa STIS menurut tingkat dan jurusan tahun 2014
Sumber : data fiktif

3.   Tabel 3 arah
Tabel tiga arah adalah tabel yang menunjukkan hubungan antara tiga hal atau tiga karakteristik. Misalnya data mahasiswa menurut jenis kelamin, asal daerah, dan jurusan, dan data petani menurut luas lahan, usia, dan jenis kelamin.
Contoh tabel tiga arah

Jumlah karyawan perusahaan Y menurut bagian kerja, jenis kelamin, dan pendidikan terakhir yang ditamatkan tahun 2010
Sumber : data fiktif

Dalam menyajikan data penelitian, terutama karya ilmiah, terdapat beberapa aturan-aturan dalam penulisan tabel. ini bisa dibaca pada postingan saya berikutnya tentang Aturan Penulisan Tabel.

Pengumpulan Data

Cara Pengumpulan Data

Pengumpulan data dapat dilakukan melalui 4 cara yaitu registrasi, sensus, survey, dan eksperimen. Namun, secara umum dalam statistik, dikenal dua cara pengumpulan data yaitu sensus dan survey.
  1. Registrasi/pencatatan. Istilah registrasi saat ini lebih kepada pencatatan secara individu melalui berbagai institusi. Misalnya pencatatan penduduk di desa-desa secara terus menerus. Setiap ada warga baru yang tinggal, lahir, maupun meninggal, maka warga yang terlibat atau pun perangkat desa melakukan pencatatan. Cara ini lebih dikenal dengan istilah catatan administrasi. Lembaga-lembaga swasta, banyak yang secara otomatis telah memanfaatkan catatan administrasi sebagai data statistik, seperti contoh pelaporan pasien Rumah sakit & perbankan.
  2. Sensus, yaitu cara pengumpulan data secara lengkap, dimana seluruh elemen dalam populasi yang menjadi objek penelitian diselidiki/dicacah satu per satu.
  3. Survei, yaitu pengumpulan data dimana data yang diselidiki adalah elemen dari populasi. Makin banyaknya jenis data yang dibutuhkan dalam suatu penelitian, timbul permasalahan bagaimana menghasilkan data yang akurat dengan menyeimbangkan tenaga, biaya dan waktu. Untuk itu survey lebih sering digunakan untuk penelitian.
  4. Eksperimen, lebih spesifik untuk tujuan-tujuan penelitian tertentu, misalnya memilih unit-unit dari suatu populasi, kemudian memberikan perlakuan yang berbeda antar unit, dan dibandingkan hasilnya. Misalnya seorang peneliti ingin melihat pengaruh pakan ternak yang terbuat dari daun bakau terhadap pertumbuhan kambing. Maka diambil 10 ekor kambing berjenis kelamin sama dan umur yang sama, 5 ekor diberi makan daun bakau dan 5 ekor lagi diberi makan rumput seperti biasa. Setelah beberapa minggu hasilnya dibandingkan.


Alat Pengumpulan Data

Dalam proses pengumpulan data, tentunya kita membutuhkan alat atau device untuk memperoleh keterangan dari objek atau elemen lain antara lain :
  1. Kuesioner (daftar pertanyaan),
  2. Wawancara,
  3.  Observasi atau pengamatan langsung, dan
  4.  Melalui pos, telepon, atau alat komunikasi lainnya.

  • Kuesioner merupakan satu set pertanyaan yang tersusun secara sistematis dan standar sehingga pertanyaan yang sama dapat diajukan terhadap setiap 
  • Wawancara, yaitu melakukan melalui komunikasi langsung dengan responden untuk memperoleh informasi tertentu. Misalnya melakukan wawancara dengan PSK untuk memperoleh informasi yang dibutuhkan dalam penelitian tentang HIV/AIDS.
  • Observasi, yaitu melakukan pengamatan dengan teliti terhadap suatu objek. Misalnya, seorang ahli biologi yang ingin meneliti kecepatan perkembang biakan bakteri pada suhu.
  • Melalui pos, telepon, atau alat komunikasi lainnya. Misalnya, survey elektabilitas calon presiden atau partai tertentu oleh lembaga survey politik tertentu dengan menggunakan daftar nomor telepon rumah sebagai frame-nya.


(Sumber : Buku STATISTIK Teori & Aplikasi, J. Supranto)