Monday 11 January 2021

Analisis regresi

Analisis regresi

Analisis regresi adalah merupakan salah satu analisis yang paling popular dan digunakan secara meluas. Analisis regresi digunakan secara meluas untuk membuat ramalan dan ramalan, dengan kegunaan yang saling melengkapi dalam bidang pembelajaran mesin. Analisis ini juga digunakan untuk memahami pembolehubah bebas yang berkaitan dengan pemboleh ubah bergantung, dan untuk mengetahui bentuk hubungan.  Analisis regresi merupakan salah satu teknik analisis data dalam statistik yang sering digunakan untuk mengkaji hubungan antara beberapa pembolehubah dan meramal suatu pembolehubah (Kutner, Nachtsheim dan Neter, 2004). 

Istilah “regresi” pertama kali dikemukakan oleh Sir Francis Galton (1822- 1911), seorang antropologi dan ahli meteorologi terkenal dari Inggeris. Dalam tulisannya yang berjudul “Regression towards mediocrity in hereditary stature”, yang dimuatkan di dalam Journal of the Anthropological Institute, volume 15, hal. 246- 263, pada tahun 1885. 

Dalam mengkaji hubungan antara beberapa pembolehubah menggunakan analisis regresi, terlebih dahulu satu pembolehubah yang disebut dengan pembolehubah tidak bebas dan satu atau lebih pembolehubah bebas perlu ditentukan. Sekiranya ingin dikaji hubungan atau pengaruh satu pembolehubah bebas terhadap pembolehubah tidak bebas, maka model regresi yang digunakan adalah model regresi linear sederhana. Sekiranya ingin dikaji hubungan atau pengaruh dua atau lebih pembolehubah bebas terhadap pembolehubah tidak bebas pula, maka model regresi yang digunakan adalah model regresi linear berganda (multiple linear regression model).

Seterusnya bagi mendapatkan model regresi linear sederhana mahupun model regresi linear berganda dapat diperoleh dengan melakukan penentun terhadap parameter-parameternya menggunakan kaedah yang tertentu. Adapun kaedah yang dapat digunakan untuk menentukan parameter model regresi linear sederhana mahupun model regresi linear berganda adalah dengan kaedah kuadratik terkecil. 

Hasil analisis regresi adalah dalam bentuk pekali regresi untuk setiap pemboleh ubah bebas. Koefisien ini diperoleh dengan meramalkan nilai pembolehubah bersandar dengan persamaan. Koefisien regresi dikira dengan dua objektif serentak. Pertama, meminimumkan penyelewengan antara nilai sebenar dan anggaran nilai pembolehubah bergantung; Kedua, mengoptimumkan korelasi antara nilai sebenar dan anggaran nilai pembolehubah bergantung berdasarkan data yang ada. Analisis regresi dibahagikan kepada dua jenis iaitu regresi linar sederhana dan analisis regresi berganda.

                   Regresi Linear Sederhana

Regresi linear sederhana merupakan proses untuk mendapatkan hubungan matematik dalam bentuk persamaan antara pembolehubah tidak bebas tunggal dengan pembolehubah bebas tunggal atau dengan kata lain, regresi linear yang hanya melibatkan satu bebas X yang dihubungkan dengan satu tidak berubah bebas Y. Bentuk umum model regresi linear sederhana iaitu: Y = (2.1). Di mana:

= pembolehubah tidak bebas (bergantung)

= parameter intersep

= koefisien regresi (slop)

= bebas (bebas)

= penduga kesalahan

 Regresi Linear Berganda

Disamping hubungan linear dua pembolehubah, linear hubungan lebih daripada dua variable boleh juga terjadi. Pada hubungan ini, perubahan satu pembolehubah dipengaruhi oleh lebih daripada satu lagi pembolehubah. Maka regresi linear berganda adalah analisis regresi yang menjelaskan hubungan antara respon perubah (dependent variable) dengan faktor-faktor yang mempengaruhi lebih daripada satu predator (berubah-ubah bebas). Tujuan analisis regresi linear berganda adalah untuk mengukur intensity hubungan antara dua pembolehubah atau lebih dan memuat prediksi atau pengiraan nilai Y atas nilai X. 

Beberapa perkara lain penting juga untuk difahami dalam penggunaan analisis regresi linear ganda iaitu perlunya melakukan uji asumsi klasik atau uji syarat analisis regresi ganda sehingga persamaan garis regresi yang diperoleh dengan benar boleh digunakan untuk memprediksi pembolehubah yang bergantung atau kriterium. Uji syarat itu harus dipenuhi, jika tidak maka akan menghasilkan garis regresi yang tidak sesuai untuk memprediksi.

Sebelum masuk pada syarat ujian perlu difahami bahawa statistik sebagai alat analisis dikelompokkan menjadi dua bahagian yang berbeza, iaitu statistik parametrik dan statistik bukan parametrik. Pada statistik bukan parametrik tidak memerlukan syarat tertentu sedangkan pada statistik parametrik memerlukan syarat yang harus dipenuhi. Oleh itu, dalam uji syarat regresi linear ganda yang harus dilakukan pada dasarnya juga dikelompokkan menjadi dua bahagian, iaitu uji persyaratan untuk masuk ke statistik parametrik dan ujian keperluan untuk menggunakan regresi linear ganda. Untuk menguji Persyaratan untuk regresi linear ganda, terdiri daripada menguj lineariti garis regresi, iaitu tidak terdapat hubungan antara antara pembolehubah bebas (uji multikolineariti), tiada autokorelasi antara pengamatan data dan tidak berlaku heteroskedasitas (Gujarati, 1997).

No comments:

Post a Comment