Di
dalam kehidupan sehari-hari, kita tentu sering melihat bahwa sesuatu
terjadi karena adanya pengaruh dari kejadian lain. Contoh yang sederhana
dapat kita lihat saat terjadinya kenaikan BBM. Saat harga BBM naik,
harga-harga barang kebutuhan pokok lain juga ikut naik. Secara tidak
langsung dapat kita katakana bahwa kenaikan harga kebutuhan pokok
dipengaruhi oleh kenaikan harga BBM. Mungkin banyak yang bertanya,
seberapa besar sih kenaikan BBM akan berpengaruh terhadap kenaikan harga
kebutuhan pokok? Bagaimana cara mengetahuinya?
Perkembangan
ilmu pengetahuan terus berusaha mencari cara untuk mengukur pengaruh
suatu kejadian terhadap kejadian lain. Ilmu statistik menawarkan suatu
cara untuk mengukur hal ini. Pengaruh satu (atau beberapa) kejadian
terhadap suatu kejadian dalam ilmu statistik diukur dengan menggunakan
Analisis Regresi Sederhana (satu penyebab mempengaruhi suatu kejadian)
atau Analisis Regresi Berganda (beberapa penyebab mempengaruhi suatu
kejadian).
Sebagai
suatu metode statistik, ada beberapa syarat yang harus dipenuhi sebelum
kita menggunakan Analisis Regresi Linier Sederhana/Analisis Regresi
Linier Berganda (RLS/RLB). Syarat yang harus dipenuhi antara lain bahwa
variabel yang dipengaruhi/variabel terikat/variabel dependent harus
berupa angka atau sesuatu yang bisa diukur dengan menggunakan bilangan.
Bagi yang sudah tak asing dengan istilah statistik, data yang digunakan
minimal berada pada level data interval. Hal ini harus dipenuhi karena
RLS/RLB termasuk ke dalam golongan statistik parametric yang mewajibkan
pengukuran dalam level minimal interval. Jika syarat ini tak terpenuhi,
RLS/RLB tidak bisa dipergunakan. Alternatif analisis yang dapat
digunakan adalah Analisis Regresi Logistik. Syarat lain yang harus
dipenuhi agar RLS/RLB dapat dipergunakan secara optimal adalah jumlah
data minimal 30 data. Kenapa 30? Hal ini terkait dengan asumsi
kenormalan yang digunakan dalam RLB/RLS. Data sejumlah itu dirasa cukup
(menurut penelitian ahli) untuk memenuhi asumsi tersebut. Jumlah 30 data
digolongkan cukup besar untuk sebuah sampel, sehingga pendekatan
kenormalan dapat dipergunakan dengan CLT.
Selain
syarat tersebut, agar dapat digunakan menganalisis dengan baik, model
yang dibentuk dengan menggunakan RLS/RLB harus memenuhi beberapa asumsi.
Asumsi-asumsi ini dikenal dengan nama ASUMSI KLASIK. Asumsi klasik ini
terdiri dari normalitas, homoskedastisitas, nonmultikolinieritas, dan
non autokorelasi.
Mengapa
normalitas diperlukan? Hayoo…kenapa? Ada 2 hal utama kenapa normalitas
diperlukan, dilihat dari sisi kehidupan sehari-hari dan dari sisi
statistik. Dari sisi kehidupan sehari-hari, sampel yang kita ambil harus
berdistribusi normal agar dapat mewakili seluruh data yang ada di
populasi. Secara awam dapat kita katakan bahwa kita berharap data-data
yang kita ambil adalah data mainstream bukan data yang non mainstream
agar dapat mewakili sebagian besar/seluruh populasi. Secara statistik,
kita menggunakan asumsi normalitas karena uji-uji yang kita gunakan
dalam RLS/RLB yaitu uji F dan uji T merupakan turunan dari distribusi
normal sehingga untuk menggunakannya maka asumsi normalitas harus
dipenuhi.
Selanjutnya,
mengapa homoskedastisitas harus dipenuhi? Btw, apa sih
homoskedastisitas? Homoskedastisitas adalah varian error data adalah
nol. Atau jika kita lihat melalui plot, maka sebaran data akan berada di
sekitar garis nol. Kenapa hal ini perlu? Karena kita berharap bahwa
model kita bisa memprediksi dengan tepat atau model regresi yang kita
hasilkan bukan merupakan regresi spourious(palsu). Jika varian error
tidak nol, maka akan berpengaruh terhadap interval kepercayaan dan
kesalahan pada pengujian hipotesis.
Nah,
asumsi selanjutnya adalah non Multikolinieritas. Multikolinieritas
sendiri berarti adanya keterkaitan antara variabel penyebab/variabel
bebas/variabel independent. Dalam (Juanda, 2009) disebutkan jika tujuan
pemodelan hanya untuk peramalan nilai Y (peubah respon) dan tidak
mengkaji hubungan atau pengaruh antara peubah bebas (X) dengan peubah
respon (Y) maka masalah multikolinearitas bukan masalah yang serius.
Masalah multikolinearitas menjadi serius apabila digunakan unruk
mengkaji hubungan antara peubah bebas (X) dengan peubah respon (Y)
karena simpangan baku koefisiennya regresinya tidak siginifikan sehingga
sulit memisahkan pengaruh dari masing-masing peubah bebas. Asumsi ini
tentu saja tidak diperlukan dalam RLS karena RLS hanya mempunyai satu
variabel bebas.
Asumsi terakhir adalah asumsi non autokorelasi. Asumsi ini tidak perlu diuji jika kita menggunakan data tipe cross section
(data satu periode) karena autokorelasi berarti hubungan linier antara
error serangkaian observasi yang diurutkan menurut waktu. Uji ini hanya
kita lakukan jika data yang kita gunakan adalah data tipe time series.
Model regresi linier berganda melibatkan lebih dari satu variabel bebas.
Modelnya :
Dimana
Y = variabel terikat
Xi = variabel bebas ( i = 1, 2, 3, …, k)
b0 = intersep
bi = koefisien regresi ( i = 1, 2, 3, …, k)
Model penduganya adalah:
√ Yi (Variabel Tak Bebas/Dependent Variable) merupakan random variable/bersifat stochastic
√ Xki (Variabel bebas/Independent Variable) bersifat fixed/non stochastic (bukan merupakan random variable)
√ E(ei)= 0
√ E(ei,ej) = σ2 untuk i = j (Homoscedastic)
√ E(ei,ej) = 0 untuk i ≠ j (Non autocorrelation)
√ error mengikuti distribusi normal dengan rata-rata nol dan varians σ2.
√ Tidak ada kolinieritas ganda (multikolinieritas) antar variabel independen.
Semoga membantu…:D
Sumber:
http://lesprivate-statistik.com/index.php/berita/52-tips-trik-dan-langkah-analisis-2
Sumber:
http://lesprivate-statistik.com/index.php/berita/52-tips-trik-dan-langkah-analisis-2
0 komentar:
Posting Komentar