Umumnya ada tiga kesukaran yang sering dihadapi peneliti dalam memahami suatu masalah yang diselidiki, yaitu:
a) adanya galat atau ingar yang terpaut dalam data;
b) adanya kerumitan dari beberapa pengaruh yang bekerja dalam pembangkitan atau ‘penampilan’ data; dan
c) kekeliruan menafsirkan korelasi sebagai suatu hubungan sebab-akibat.
Ingar
Keterangan yang ditimbulkan oleh faktor-faktor pengganggu (dari tiga kelas peubah-peubah tambahan), baik yang sudah diketahui maupun yang tidak diketahui disebut sebagai galat atau ingar (noise). Biasanya hanya sebagian kecil saja dari pengaruh ini disebabkan oleh kesalahan pengukuran, yaitu sepanjang pengukuran dilakukan dengan cermat dan teliti. Jika galat cukup besar, maka pengaruh faktor-faktor penting yang ingin diketahui kabur karena tertutup oleh pengaruh galat. Atau sebaliknya, galat seolah-olah menunjukkan adanya pengaruh faktor yang diselidiki padahal sesungguhnya tidak ada.
Interaksi antar Faktor-faktor
Adanya kerumitan berbagai pengaruh dalam percobaan misalnya dapat diikuti melalui teladan percobaan berikut yang meneliti pengaruh kopi dan alkohol terhadap reaksi pengemudi mobil.
Misalkan data yang diperoleh dari percobaan adalah (i) jika pengemudi tidak minum kopi, maka satu cangkir ‘sofi’ (sejenis minuman keras lokal dari hasil fermentasi nira kelapa atau enau) akan memperlambat reaksi selama 0.45 detik, tetapi (ii) jika pengemudi tidak minum sofi maka satu gelas kopi akan mempercepat reaksi selama 0.20 detik.
Dalam mengevaluasi pengaruh sofi dan kopi dari percobaan ini masalahnya akan menjadi sederhana bila pengaruh-pengaruh itu bekerja secara linear dan aditif. Jika pengaruh itu bekerja secara linear, maka berarti bahwa dua cangkir sofi tanpa minum kopi akan memperlambat reaksi pengemudi selama 2(0.45) = 0.90 detik, dan tiga gelas kopi tanpa sofi akan mempercepat reaksi selama 3(0.20) = 0.60 detik. Selanjutnya jika pengaruh-pengaruh itu aditif, maka berarti bahwa minum satu cangkir sofi dan satu gelas kopi akan memperlambat reaksi pengemudi selama 0.45 + (-0.20) = 0.25 detik. Dengan demikian jika pengaruh-pengaruh itu bekerja secara linear dan aditif, maka dengan minum tiga cangkir sofi dan empat gelas kopi akan memperlambat reaksi selama 3(0.45) - 4(0.20) = 0.15 detik.
Evaluasi seperti di atas belum tentu benar, karena pengaruh tambahan minum satu cangkir sofi tergantung pada: (a) berapa cangkir sofi telah diminum sebelumnya (pengaruh sofi tidak linear) dan (b) berapa gelas kopi yang diminum sebelumnya (pengaruh kopi dan sofi tidak aditif). Dengan menggunakan rancangan perlakuan dan analisis statistika yang sesuai tidak hanya pengaruh linear dan aditif saja yang dapat dievaluasi tetapi juga pengaruh taklinear dan tak-aditif, yaitu dalam hal ini pengaruh interaksi antara dosis sofi x kopi terhadap kecepatan reaksi ketika mengemudi.
Korelasi, Regresi dan Kausasi
Dalam matematika, tidak semua gugus ganda dapat disebut sebagai suatu “hubungan”. Suatu hubungan harus terdefinisikan dengan baik agar dari suatu gugus ganda dapat diidentifikasi unsur-unsurnya yang memenuhi “hubungan” yang dimaksud. Dalam penelitian kita umumnya berbicara tentang hubungan-hubungan antar peubah-peubah penelitian atau antar gugus-gugus dari peubah-peubah penelitian.
Korelasi dan regresi ialah suatu teladan hubungan-hubungan dalam statistika. Dalam statistika pengertian regresi jelas berbeda dengan pengertian korelasi, kendati keduanya berbicara tentang hubungan antara dua peubah.
Tidak sedikit orang yang tidak dapat membedakan antara istilah “regresi” dan "korelasi". Korelasi bukan merupakan hubungan implikatif. “Ko-relasi” menyatakan hubungan bersama antar dua peubah acak. Tidak relevan berbicara mengenai korelasi antar dua peubah jika salah satu dari atau kedua peubah yang dibicarakan bukan merupakan peubah acak.
Untuk suatu hubungan regresi harus dapat dikenali untuk ditentukan adanya dua gugus peubah-peubah. Gugus pertama terdiri atas satu atau beberapa peubah yang ditentukan, diprediksi, diterangkan, dijelaskan, respons, kriteria, dipengaruhi atau akibat. Sedangkan gugus kedua terdiri atas satu atau beberapa peubah lain yang menentukan, prediktor, menerangkan, menjelaskan, stimuli, perlakuan, pengaruh atau sebab.
Setiap peubah dari gugus pertama merupakan peubah acak yang dapat diamati dan dianggap bebas dari galat-galat pengukuran. Sedangkan nilai-nilai dari suatu peubah dari gugus kedua juga dapat diamati dan dianggap bebas dari galat-galat pengukuran, terlepas dari apakah nilai-nilainya dapat ditentukan atau diketahui dalam tahap perancangan, dari corak pengaruh tetap ataukah acak, atau baru diketahui kemudian dari pengamatan terhadap semua objek dari suatu contoh acak.
Jika peubah-peubah dari gugus pertama tidak dapat diamati, tetapi merupakan peubah-peubah konseptual dalam peubah-peubah gugus kedua, maka yang dihadapi ialah suatu masalah mengenai peubah-peubah komposit: indeks atau skor-skor komponen.
Jika masing-masing dari kedua kategori gugus peubah-peubah tersebut terdiri atas satu peubah saja, maka yang dihadapi mungkin adalah suatu model regresi linear sederhana. Tetapi, jika gugus kedua terdiri atas lebih dari satu peubah (termasuk suku interaksi antar dua atau lebih peubah atau polinomial dari suatu peubah) maka yang dihadapi adalah suatu model regresi linear jamak. Analisis diskriminan linear dapat dipandang analog dengan regresi linear jamak untuk situasi bilamana gugus pertama terdiri atas satu peubah kategorik (nominal, ordinal) atau dari suatu peubah berskala pengukuran selang atau nisbah yang telah dikelas-kelaskan. Kasus regresi peubah-jamak atau analisis ragam peubah-jamak akan dihadapi jika kedua gugus masing-masing terdiri atas lebih dari satu peubah.
Hubungan sebab-akibat adalah suatu hubungan implikatif: ada yang menentukan dan ada yang ditentukan. Hubungan sebab-akibat atau kausasi adalah suatu hubungan regresi; ada suatu peubah yang menjadi sebab sehingga suatu akibat terjadi. Misalnya, seseorang jatuh dari kendaraan yang sedang melaju kencang, dan kemudian mati di tempat. Orang tidak mengatakan almarhum mati karena jatuh dari kendaraan. Dari pemeriksaan medis baru diketahui bahwa sebab kematian misalnya ialah karena terjadi pendarahan pada otak yaitu sebagai akibat terjatuh dari kendaraan dengan kepala membentur benda keras masif.
Korelasi jelas tidak sama dengan kausasi. Pada korelasi antar dua peubah tidak jelas atau tidak dapat ditentukan peubah mana yang menentukan dan peubah mana yang ditentukan. Sepasang peubah yang dimaksud haruslah keduanya merupakan peubah-peubah acak. Bukan yang salah satu atau keduanya merupakan peubah-peubah dengan nilai-nilai yang dapat ditentukan atau diketahui sebelumnya dalam tahap perancangan. Misalnya, lingkar leher dan lingkar pinggang manusia. Kita tidak dapat menyatakan apakah lingkar leher menentukan besarnya lingkar pinggang ataukah sebaliknya. Tetapi, yang jelas masing-masing beragam menurut etnis, kelas usia dan jenis kelamin. Teladan lain, kita tidak dapat menyatakan apakah suhu udara menentukan kelengasan udara ataukah sebaliknya. Orang mengatakan bahwa suhu udara dan kelengasan udara dapat saling menentukan.
Pengertian korelasi dapat diusut dari pengertian keseiaan (agreement): “seia” dan “tidak seia” yang dimiliki oleh n pasang data (aj, bj) yang memberikan kecenderungan arah dan besarnya pola asosiasi (positif ataukah negatif) antara peubah A dan peubah B.
Nilai-nilai dari peubah-peubah A dan B yang beraneka, masing-masing memiliki ragam sebesar Var(A) dan Var(B). Tetapi ragam(A + B), yakni Var(A+ B) tidak sama dengan Var(A) + Var(B): Var(A+ B) = Var(A) + Var(B) + 2 Cov(A, B). Suku Cov(A, B) dinamakan sebagai kovarians atau peragam, yaitu ragam milik bersama. Bayangkan suatu denah Venn untuk pemaduan/penyatuan dua gugus data!
Salah satu ukuran korelasi adalah koefisien korelasi Pearson, yang disebut juga sebagai koefisien korelasi momen hasilkali, atau koefisien korelasi linear sederhana. Batasan (rumus) koefisien korelasi momen hasilkali diturunkan dari pengertian kovarians:
a) adanya galat atau ingar yang terpaut dalam data;
b) adanya kerumitan dari beberapa pengaruh yang bekerja dalam pembangkitan atau ‘penampilan’ data; dan
c) kekeliruan menafsirkan korelasi sebagai suatu hubungan sebab-akibat.
Ingar
Keterangan yang ditimbulkan oleh faktor-faktor pengganggu (dari tiga kelas peubah-peubah tambahan), baik yang sudah diketahui maupun yang tidak diketahui disebut sebagai galat atau ingar (noise). Biasanya hanya sebagian kecil saja dari pengaruh ini disebabkan oleh kesalahan pengukuran, yaitu sepanjang pengukuran dilakukan dengan cermat dan teliti. Jika galat cukup besar, maka pengaruh faktor-faktor penting yang ingin diketahui kabur karena tertutup oleh pengaruh galat. Atau sebaliknya, galat seolah-olah menunjukkan adanya pengaruh faktor yang diselidiki padahal sesungguhnya tidak ada.
Interaksi antar Faktor-faktor
Adanya kerumitan berbagai pengaruh dalam percobaan misalnya dapat diikuti melalui teladan percobaan berikut yang meneliti pengaruh kopi dan alkohol terhadap reaksi pengemudi mobil.
Misalkan data yang diperoleh dari percobaan adalah (i) jika pengemudi tidak minum kopi, maka satu cangkir ‘sofi’ (sejenis minuman keras lokal dari hasil fermentasi nira kelapa atau enau) akan memperlambat reaksi selama 0.45 detik, tetapi (ii) jika pengemudi tidak minum sofi maka satu gelas kopi akan mempercepat reaksi selama 0.20 detik.
Dalam mengevaluasi pengaruh sofi dan kopi dari percobaan ini masalahnya akan menjadi sederhana bila pengaruh-pengaruh itu bekerja secara linear dan aditif. Jika pengaruh itu bekerja secara linear, maka berarti bahwa dua cangkir sofi tanpa minum kopi akan memperlambat reaksi pengemudi selama 2(0.45) = 0.90 detik, dan tiga gelas kopi tanpa sofi akan mempercepat reaksi selama 3(0.20) = 0.60 detik. Selanjutnya jika pengaruh-pengaruh itu aditif, maka berarti bahwa minum satu cangkir sofi dan satu gelas kopi akan memperlambat reaksi pengemudi selama 0.45 + (-0.20) = 0.25 detik. Dengan demikian jika pengaruh-pengaruh itu bekerja secara linear dan aditif, maka dengan minum tiga cangkir sofi dan empat gelas kopi akan memperlambat reaksi selama 3(0.45) - 4(0.20) = 0.15 detik.
Evaluasi seperti di atas belum tentu benar, karena pengaruh tambahan minum satu cangkir sofi tergantung pada: (a) berapa cangkir sofi telah diminum sebelumnya (pengaruh sofi tidak linear) dan (b) berapa gelas kopi yang diminum sebelumnya (pengaruh kopi dan sofi tidak aditif). Dengan menggunakan rancangan perlakuan dan analisis statistika yang sesuai tidak hanya pengaruh linear dan aditif saja yang dapat dievaluasi tetapi juga pengaruh taklinear dan tak-aditif, yaitu dalam hal ini pengaruh interaksi antara dosis sofi x kopi terhadap kecepatan reaksi ketika mengemudi.
Korelasi, Regresi dan Kausasi
Dalam matematika, tidak semua gugus ganda dapat disebut sebagai suatu “hubungan”. Suatu hubungan harus terdefinisikan dengan baik agar dari suatu gugus ganda dapat diidentifikasi unsur-unsurnya yang memenuhi “hubungan” yang dimaksud. Dalam penelitian kita umumnya berbicara tentang hubungan-hubungan antar peubah-peubah penelitian atau antar gugus-gugus dari peubah-peubah penelitian.
Korelasi dan regresi ialah suatu teladan hubungan-hubungan dalam statistika. Dalam statistika pengertian regresi jelas berbeda dengan pengertian korelasi, kendati keduanya berbicara tentang hubungan antara dua peubah.
Tidak sedikit orang yang tidak dapat membedakan antara istilah “regresi” dan "korelasi". Korelasi bukan merupakan hubungan implikatif. “Ko-relasi” menyatakan hubungan bersama antar dua peubah acak. Tidak relevan berbicara mengenai korelasi antar dua peubah jika salah satu dari atau kedua peubah yang dibicarakan bukan merupakan peubah acak.
Untuk suatu hubungan regresi harus dapat dikenali untuk ditentukan adanya dua gugus peubah-peubah. Gugus pertama terdiri atas satu atau beberapa peubah yang ditentukan, diprediksi, diterangkan, dijelaskan, respons, kriteria, dipengaruhi atau akibat. Sedangkan gugus kedua terdiri atas satu atau beberapa peubah lain yang menentukan, prediktor, menerangkan, menjelaskan, stimuli, perlakuan, pengaruh atau sebab.
Setiap peubah dari gugus pertama merupakan peubah acak yang dapat diamati dan dianggap bebas dari galat-galat pengukuran. Sedangkan nilai-nilai dari suatu peubah dari gugus kedua juga dapat diamati dan dianggap bebas dari galat-galat pengukuran, terlepas dari apakah nilai-nilainya dapat ditentukan atau diketahui dalam tahap perancangan, dari corak pengaruh tetap ataukah acak, atau baru diketahui kemudian dari pengamatan terhadap semua objek dari suatu contoh acak.
Jika peubah-peubah dari gugus pertama tidak dapat diamati, tetapi merupakan peubah-peubah konseptual dalam peubah-peubah gugus kedua, maka yang dihadapi ialah suatu masalah mengenai peubah-peubah komposit: indeks atau skor-skor komponen.
Jika masing-masing dari kedua kategori gugus peubah-peubah tersebut terdiri atas satu peubah saja, maka yang dihadapi mungkin adalah suatu model regresi linear sederhana. Tetapi, jika gugus kedua terdiri atas lebih dari satu peubah (termasuk suku interaksi antar dua atau lebih peubah atau polinomial dari suatu peubah) maka yang dihadapi adalah suatu model regresi linear jamak. Analisis diskriminan linear dapat dipandang analog dengan regresi linear jamak untuk situasi bilamana gugus pertama terdiri atas satu peubah kategorik (nominal, ordinal) atau dari suatu peubah berskala pengukuran selang atau nisbah yang telah dikelas-kelaskan. Kasus regresi peubah-jamak atau analisis ragam peubah-jamak akan dihadapi jika kedua gugus masing-masing terdiri atas lebih dari satu peubah.
Hubungan sebab-akibat adalah suatu hubungan implikatif: ada yang menentukan dan ada yang ditentukan. Hubungan sebab-akibat atau kausasi adalah suatu hubungan regresi; ada suatu peubah yang menjadi sebab sehingga suatu akibat terjadi. Misalnya, seseorang jatuh dari kendaraan yang sedang melaju kencang, dan kemudian mati di tempat. Orang tidak mengatakan almarhum mati karena jatuh dari kendaraan. Dari pemeriksaan medis baru diketahui bahwa sebab kematian misalnya ialah karena terjadi pendarahan pada otak yaitu sebagai akibat terjatuh dari kendaraan dengan kepala membentur benda keras masif.
Korelasi jelas tidak sama dengan kausasi. Pada korelasi antar dua peubah tidak jelas atau tidak dapat ditentukan peubah mana yang menentukan dan peubah mana yang ditentukan. Sepasang peubah yang dimaksud haruslah keduanya merupakan peubah-peubah acak. Bukan yang salah satu atau keduanya merupakan peubah-peubah dengan nilai-nilai yang dapat ditentukan atau diketahui sebelumnya dalam tahap perancangan. Misalnya, lingkar leher dan lingkar pinggang manusia. Kita tidak dapat menyatakan apakah lingkar leher menentukan besarnya lingkar pinggang ataukah sebaliknya. Tetapi, yang jelas masing-masing beragam menurut etnis, kelas usia dan jenis kelamin. Teladan lain, kita tidak dapat menyatakan apakah suhu udara menentukan kelengasan udara ataukah sebaliknya. Orang mengatakan bahwa suhu udara dan kelengasan udara dapat saling menentukan.
Pengertian korelasi dapat diusut dari pengertian keseiaan (agreement): “seia” dan “tidak seia” yang dimiliki oleh n pasang data (aj, bj) yang memberikan kecenderungan arah dan besarnya pola asosiasi (positif ataukah negatif) antara peubah A dan peubah B.
Nilai-nilai dari peubah-peubah A dan B yang beraneka, masing-masing memiliki ragam sebesar Var(A) dan Var(B). Tetapi ragam(A + B), yakni Var(A+ B) tidak sama dengan Var(A) + Var(B): Var(A+ B) = Var(A) + Var(B) + 2 Cov(A, B). Suku Cov(A, B) dinamakan sebagai kovarians atau peragam, yaitu ragam milik bersama. Bayangkan suatu denah Venn untuk pemaduan/penyatuan dua gugus data!
Salah satu ukuran korelasi adalah koefisien korelasi Pearson, yang disebut juga sebagai koefisien korelasi momen hasilkali, atau koefisien korelasi linear sederhana. Batasan (rumus) koefisien korelasi momen hasilkali diturunkan dari pengertian kovarians:
dalam hal ini dan masing-masing ialah simpangan baku populasi data peubah A dan peubah B.
Walaupun benar bahwa rumus matematis untuk koefisien korelasi dapat dinyatakan dalam koefisien regresi A pada B (atau B pada A), dan sebaliknya koefisien regresi A pada B (atau B pada A) dapat dinyatakan dalam koefisen korelasi antara A dan B maka = (Ingat bahwa Cov(A, B) = Cov(B, A):
Walaupun benar bahwa rumus matematis untuk koefisien korelasi dapat dinyatakan dalam koefisien regresi A pada B (atau B pada A), dan sebaliknya koefisien regresi A pada B (atau B pada A) dapat dinyatakan dalam koefisen korelasi antara A dan B maka = (Ingat bahwa Cov(A, B) = Cov(B, A):
tetapi kita harus ingat pengertian berbeda antara korelasi dan hubungan regresi. Jangan pernah terpaku pada rumus yang sebenarnya dimaksudkan sebagai suatu penjabaran untuk keperluan komputasi.
Berdasarkan rumus yang diberikan, yaitu Cov(A, B) dibagi dengan hasilkali simpangan baku A dengan simpangan baku B, maka (i) koefisien korelasi Pearson tidak terdefinisikan jika salah satu dari atau kedua peubah acak A dan B bernilai seragam dan (ii) koefisien korelasi Pearson sama dengan nol jika Cov(A, B) = 0, berapapun besar nilai simpangan baku A maupun simpangan baku B (asalkan tidak sama dengan 0).
Dari teori statistika kita mengetahui bahwa jika A dan B bebas stokastik satu terhadap yang lainnya maka Cov(A, B) = 0. Tetapi, Cov(A, B) = 0 tidak selalu berimplikasi bahwa A dan B bersifat bebas satu terhadap yang lainnya. Hubungan antara kebebasan A dan B dengan Cov(A, B) bukanlah dalam bentuk pernyataan “jika dan hanya jika”. Jadi, orang harus hati-hati dalam menggunakan informasi besar-kecilnya nilai koefisien korelasi Pearson sebagai suatu ukuran dalam menguji kebebasan antara A dan B.
Satu lagi kekeliruan yang sering terjadi. Yaitu, menafsirkan harga mutlak koefisien korelasi yang dapat dianggap cukup kecil sebagai suatu petunjuk untuk menyimpulkan bahwa A tidak mempunyai hubungan dengan B. Simpulan seperti ini terlalu mekanistis dan dapat salah. A dan B mungkin saja mempunyai suatu hubungan yang cukup erat atau bahkan sangat erat, tetapi bentuk hubungannya tidak linear. Koefisien korelasi Pearson berbicara tentang hubungan linear, yaitu hubungan garis lurus.
Kemungkinan lain, data yang dihadapi sebenarnya bergrup. Jika koefisien korelasi dihitung untuk masing-masing grup maka mungkin saja akan didapat koefisien korelasi dalam grup yang cukup besar. Kemungkinan ketiga ialah karena hadirnya satu atau beberapa data pencilan, yaitu data ekstrim. Rataan dan dengan demikian juga kovarians maupun ragam peka terhadap adanya data pencilan, lebih-lebih jika bernilai sangat ekstrim atau terdapat dalam jumlah cukup banyak. Mengapa?
Tidak sedikit dari peneliti ada yang gegabah menyimpulkan adanya hubungan sebab-akibat dari dua macam kejadian berdasarkan adanya korelasi antara dua kejadian. Korelasi antara kejadian X dan kejadian Y dapat saja terjadi bila kedua kejadian itu masing-masing dipengaruhi oleh kejadian ketiga (Z), padahal sesungguhnya sama sekali tidak ada hubungan sebab-akibat antara kejadian X dan Y.
Kejadian X dan W mungkin berkorelasi, tetapi yang merupakan faktor sebab bagi Y sebenarnya ialah Z. Faktor pengaruh sisaan-sisaan biasanya dianggap dapat mempengaruhi Y tetapi bersifat bebas dari X maupun Z. Tetapi, dalam beberapa situasi ada kalanya X atau Z berasosiasi dengan Z. Kegagalan dalam menggunakan akal-sehat dalam memahami situasi seperti itu tidak jarang menimbulkan adanya kekeliruan yang disebut sebagai “korelasi lancung”. Statistika tidak dapat mengenali korelasi semacam itu kecuali dengan menggunakan nalar yang mantis.
Sebab-sebab dalam suatu sistem kausal terhadap suatu atau beberapa peubah akibat mungkin merupakan sebab-sebab bebas, sebab-sebab tak-bebas (berinteraksi dalam pembangkitan akibat-akibat) dan sebab-sebab dengan lintasan-lintasan berantai: sebab-sebab dengan pengaruh-pengaruh jauh yang tersampaikan atau teredam, sebab-sebab tak-langsung, dan sebab-sebab langsung.
Perhatikan teladan bagan berikut:
Berdasarkan rumus yang diberikan, yaitu Cov(A, B) dibagi dengan hasilkali simpangan baku A dengan simpangan baku B, maka (i) koefisien korelasi Pearson tidak terdefinisikan jika salah satu dari atau kedua peubah acak A dan B bernilai seragam dan (ii) koefisien korelasi Pearson sama dengan nol jika Cov(A, B) = 0, berapapun besar nilai simpangan baku A maupun simpangan baku B (asalkan tidak sama dengan 0).
Dari teori statistika kita mengetahui bahwa jika A dan B bebas stokastik satu terhadap yang lainnya maka Cov(A, B) = 0. Tetapi, Cov(A, B) = 0 tidak selalu berimplikasi bahwa A dan B bersifat bebas satu terhadap yang lainnya. Hubungan antara kebebasan A dan B dengan Cov(A, B) bukanlah dalam bentuk pernyataan “jika dan hanya jika”. Jadi, orang harus hati-hati dalam menggunakan informasi besar-kecilnya nilai koefisien korelasi Pearson sebagai suatu ukuran dalam menguji kebebasan antara A dan B.
Satu lagi kekeliruan yang sering terjadi. Yaitu, menafsirkan harga mutlak koefisien korelasi yang dapat dianggap cukup kecil sebagai suatu petunjuk untuk menyimpulkan bahwa A tidak mempunyai hubungan dengan B. Simpulan seperti ini terlalu mekanistis dan dapat salah. A dan B mungkin saja mempunyai suatu hubungan yang cukup erat atau bahkan sangat erat, tetapi bentuk hubungannya tidak linear. Koefisien korelasi Pearson berbicara tentang hubungan linear, yaitu hubungan garis lurus.
Kemungkinan lain, data yang dihadapi sebenarnya bergrup. Jika koefisien korelasi dihitung untuk masing-masing grup maka mungkin saja akan didapat koefisien korelasi dalam grup yang cukup besar. Kemungkinan ketiga ialah karena hadirnya satu atau beberapa data pencilan, yaitu data ekstrim. Rataan dan dengan demikian juga kovarians maupun ragam peka terhadap adanya data pencilan, lebih-lebih jika bernilai sangat ekstrim atau terdapat dalam jumlah cukup banyak. Mengapa?
Tidak sedikit dari peneliti ada yang gegabah menyimpulkan adanya hubungan sebab-akibat dari dua macam kejadian berdasarkan adanya korelasi antara dua kejadian. Korelasi antara kejadian X dan kejadian Y dapat saja terjadi bila kedua kejadian itu masing-masing dipengaruhi oleh kejadian ketiga (Z), padahal sesungguhnya sama sekali tidak ada hubungan sebab-akibat antara kejadian X dan Y.
Kejadian X dan W mungkin berkorelasi, tetapi yang merupakan faktor sebab bagi Y sebenarnya ialah Z. Faktor pengaruh sisaan-sisaan biasanya dianggap dapat mempengaruhi Y tetapi bersifat bebas dari X maupun Z. Tetapi, dalam beberapa situasi ada kalanya X atau Z berasosiasi dengan Z. Kegagalan dalam menggunakan akal-sehat dalam memahami situasi seperti itu tidak jarang menimbulkan adanya kekeliruan yang disebut sebagai “korelasi lancung”. Statistika tidak dapat mengenali korelasi semacam itu kecuali dengan menggunakan nalar yang mantis.
Sebab-sebab dalam suatu sistem kausal terhadap suatu atau beberapa peubah akibat mungkin merupakan sebab-sebab bebas, sebab-sebab tak-bebas (berinteraksi dalam pembangkitan akibat-akibat) dan sebab-sebab dengan lintasan-lintasan berantai: sebab-sebab dengan pengaruh-pengaruh jauh yang tersampaikan atau teredam, sebab-sebab tak-langsung, dan sebab-sebab langsung.
Perhatikan teladan bagan berikut:
Peubah(-peubah) sebab untuk suatu peubah akibat tidak selalu mungkin dapat dikenali atau teramati. Sehingga, dalam suatu penelitian tidak jarang orang menggantikannya dengan satu atau beberapa peubah perantara atau indikator.
Peubah indikator tidak selalu tepat mencerminkan pengaruh peubah sebab, kecuali peubah tersebut merupakan proksi dari peubah sebab. Misalnya, pukul-rata besarnya pengeluaran rumahtangga penduduk dalam Rp/kepala/bulan ialah salah satu indikator pengukur tingkat kemiskinan, seperti halnya dengan pukulrata besarnya pendapatan (Rp/kepala/bulan) atau pukulrata besarnya konsumsi (kg setara beras/kepala/bulan). Tetapi, suatu rumahtangga dengan tingkat pengeluaran rendah belum tentu ialah rumahtangga miskin. Mungkin saja rumahtangga tersebut sangat hemat atau ‘pelit’ sehingga besar pengeluaran rumahtangga kecil. Kemungkinan lain ialah bahwa sebagian besar dari kebutuhan untuk konsumsi dapat dipenuhi dari produksi rumahtangga sendiri. Sebaliknya, rumahtangga dengan tingkat pengeluaran besar belum tentu mengindikasikan rumahtangga kaya. Mungkin saja rumahtangga tersebut sebenarnya adalah rumahtangga miskin yang ‘boros’ atau berani ‘berutang’.
Suatu peubah indikator mungkin berasosiasi dengan suatu atau beberapa peubah pembaur. Pengaruh suatu peubah pembaur terhadap suatu peubah akibat mungkin langsung atau tak-langsung, yaitu bersama-sama dengan pengaruh peubah indikator dan peubah penggubah, yaitu peubah intervensi atau perlakuan. Peubah pembaur ialah peubah yang pengaruhnya tidak terpisahkan dari pengaruh peubah yang dipautinya. Dengan perkataan lain kedua pengaruh merupakan alias satu terhadap yang lainnya.
Peubah indikator tidak selalu tepat mencerminkan pengaruh peubah sebab, kecuali peubah tersebut merupakan proksi dari peubah sebab. Misalnya, pukul-rata besarnya pengeluaran rumahtangga penduduk dalam Rp/kepala/bulan ialah salah satu indikator pengukur tingkat kemiskinan, seperti halnya dengan pukulrata besarnya pendapatan (Rp/kepala/bulan) atau pukulrata besarnya konsumsi (kg setara beras/kepala/bulan). Tetapi, suatu rumahtangga dengan tingkat pengeluaran rendah belum tentu ialah rumahtangga miskin. Mungkin saja rumahtangga tersebut sangat hemat atau ‘pelit’ sehingga besar pengeluaran rumahtangga kecil. Kemungkinan lain ialah bahwa sebagian besar dari kebutuhan untuk konsumsi dapat dipenuhi dari produksi rumahtangga sendiri. Sebaliknya, rumahtangga dengan tingkat pengeluaran besar belum tentu mengindikasikan rumahtangga kaya. Mungkin saja rumahtangga tersebut sebenarnya adalah rumahtangga miskin yang ‘boros’ atau berani ‘berutang’.
Suatu peubah indikator mungkin berasosiasi dengan suatu atau beberapa peubah pembaur. Pengaruh suatu peubah pembaur terhadap suatu peubah akibat mungkin langsung atau tak-langsung, yaitu bersama-sama dengan pengaruh peubah indikator dan peubah penggubah, yaitu peubah intervensi atau perlakuan. Peubah pembaur ialah peubah yang pengaruhnya tidak terpisahkan dari pengaruh peubah yang dipautinya. Dengan perkataan lain kedua pengaruh merupakan alias satu terhadap yang lainnya.
Tidak ada komentar:
Posting Komentar