Senin, 07 Maret 2016

Teori Regresi Linier Sederhana dan Regresi Berganda Serta Teori Asumsi Klasik

Di dalam kehidupan sehari-hari, kita tentu sering melihat bahwa sesuatu terjadi karena adanya pengaruh dari kejadian lain. Contoh yang sederhana dapat kita lihat saat terjadinya kenaikan BBM. Saat harga BBM naik, harga-harga barang kebutuhan pokok lain juga ikut naik. Secara tidak langsung dapat kita katakana bahwa kenaikan harga kebutuhan pokok dipengaruhi oleh kenaikan harga BBM. Mungkin banyak yang bertanya, seberapa besar sih kenaikan BBM akan berpengaruh terhadap kenaikan harga kebutuhan pokok? Bagaimana cara mengetahuinya?
Perkembangan ilmu pengetahuan terus berusaha mencari cara untuk mengukur pengaruh suatu kejadian terhadap kejadian lain. Ilmu statistik menawarkan suatu cara untuk mengukur hal ini. Pengaruh satu (atau beberapa) kejadian terhadap suatu kejadian dalam ilmu statistik diukur dengan menggunakan Analisis Regresi Sederhana (satu penyebab mempengaruhi suatu kejadian) atau Analisis Regresi Berganda (beberapa penyebab mempengaruhi suatu kejadian). 
Sebagai suatu metode statistik, ada beberapa syarat yang harus dipenuhi sebelum kita menggunakan Analisis Regresi Linier Sederhana/Analisis Regresi Linier Berganda (RLS/RLB). Syarat yang harus dipenuhi antara lain bahwa variabel yang dipengaruhi/variabel terikat/variabel dependent harus berupa angka atau sesuatu yang bisa diukur dengan menggunakan bilangan. Bagi yang sudah tak asing dengan istilah statistik, data yang digunakan minimal berada pada level data interval. Hal ini harus dipenuhi karena RLS/RLB termasuk ke dalam golongan statistik parametric yang mewajibkan pengukuran dalam level minimal interval. Jika syarat ini tak terpenuhi, RLS/RLB tidak bisa dipergunakan. Alternatif analisis yang dapat digunakan adalah Analisis Regresi Logistik. Syarat lain yang harus dipenuhi agar RLS/RLB dapat dipergunakan secara optimal adalah jumlah data minimal 30 data. Kenapa 30? Hal ini terkait dengan asumsi kenormalan yang digunakan dalam RLB/RLS. Data sejumlah itu dirasa cukup (menurut penelitian ahli) untuk memenuhi asumsi tersebut. Jumlah 30 data digolongkan cukup besar untuk sebuah sampel, sehingga pendekatan kenormalan dapat dipergunakan dengan CLT.
Selain syarat tersebut, agar dapat digunakan menganalisis dengan baik, model yang dibentuk dengan menggunakan RLS/RLB harus memenuhi beberapa asumsi. Asumsi-asumsi ini dikenal dengan nama ASUMSI KLASIK. Asumsi klasik ini terdiri dari normalitas, homoskedastisitas, nonmultikolinieritas, dan non autokorelasi.
Mengapa normalitas diperlukan? Hayoo…kenapa? Ada 2 hal utama kenapa normalitas diperlukan, dilihat dari sisi kehidupan sehari-hari dan dari sisi statistik. Dari sisi kehidupan sehari-hari, sampel yang kita ambil harus berdistribusi normal agar dapat mewakili seluruh data yang ada di populasi. Secara awam dapat kita katakan bahwa kita berharap data-data yang kita ambil adalah data mainstream bukan data yang non mainstream agar dapat mewakili sebagian besar/seluruh populasi. Secara statistik, kita menggunakan asumsi normalitas karena uji-uji yang kita gunakan dalam RLS/RLB yaitu uji F dan uji T merupakan turunan dari distribusi normal sehingga untuk menggunakannya maka asumsi normalitas harus dipenuhi.
Selanjutnya, mengapa homoskedastisitas harus dipenuhi? Btw, apa sih homoskedastisitas? Homoskedastisitas adalah varian error data adalah nol. Atau jika kita lihat melalui plot, maka sebaran data akan berada di sekitar garis nol. Kenapa hal ini perlu? Karena kita berharap bahwa model kita bisa memprediksi dengan tepat atau model regresi yang kita hasilkan bukan merupakan regresi spourious(palsu). Jika varian error tidak nol, maka akan berpengaruh terhadap interval kepercayaan dan kesalahan pada pengujian hipotesis.
Nah, asumsi selanjutnya adalah non Multikolinieritas. Multikolinieritas sendiri berarti adanya keterkaitan antara variabel penyebab/variabel bebas/variabel independent. Dalam (Juanda, 2009) disebutkan jika tujuan pemodelan hanya untuk peramalan nilai Y (peubah respon) dan tidak mengkaji hubungan atau pengaruh antara peubah bebas (X) dengan peubah respon (Y) maka masalah multikolinearitas bukan masalah yang serius. Masalah multikolinearitas menjadi serius apabila digunakan unruk mengkaji hubungan antara peubah bebas (X) dengan peubah respon (Y) karena simpangan baku koefisiennya regresinya tidak siginifikan sehingga sulit memisahkan pengaruh dari masing-masing peubah bebas. Asumsi ini tentu saja tidak diperlukan dalam RLS karena RLS hanya mempunyai satu variabel bebas.
Asumsi terakhir adalah asumsi non autokorelasi. Asumsi ini tidak perlu diuji jika kita menggunakan data tipe cross section (data satu periode) karena autokorelasi berarti hubungan linier antara error serangkaian observasi yang diurutkan menurut waktu. Uji ini hanya kita lakukan jika data yang kita gunakan adalah data tipe time series.
Model regresi linier berganda melibatkan lebih dari satu variabel bebas.
Modelnya : 
Dimana
            Y   = variabel terikat
            Xi  = variabel bebas ( i = 1, 2, 3, …, k)
            b0    = intersep
            bi    = koefisien regresi ( i = 1, 2, 3, …, k)
Model penduganya adalah: 
√  Yi (Variabel Tak Bebas/Dependent Variable) merupakan random variable/bersifat stochastic
√  Xki (Variabel bebas/Independent Variable) bersifat fixed/non stochastic (bukan merupakan random variable)
√  E(ei)= 0
√  E(ei,ej) = σ2 untuk i = j (Homoscedastic)
√ E(ei,ej) = 0 untuk i ≠ j (Non autocorrelation)
√  error mengikuti distribusi normal dengan rata-rata nol dan varians σ2.
√  Tidak ada kolinieritas ganda (multikolinieritas) antar variabel independen.

0 komentar:

Posting Komentar