WELCOME

Manusia tidak diberikan ilmu oleh Allah melainkan hanya sedikit.

Selasa, 03 April 2012

Cara membuang data

Dalam melakukan suatu analisa kimia, seringkali diperoleh bahwa data yang didapatkan sukar direproduksi dengan baik. Dari suatu kumpulan data hasil analisa, seringkali dijumpai salah satu data menyimpang relatif besar terhadap data-data lainnya, Dalam hal ini, sebelum dilakukan pengolahan data, sebaiknya diputuskan terlebih dahulu apakah data yang menyimpang tadi harus dibuang atau dapat dipertahankan.
Berhadapan dengan suatu kumpulan data yang mempunyai jumlah data (n) cukup besar, dibuang atau tidaknya salah satu data tidak akan memberikan pengaruh yang cukup berarti. Mengapa? Ada dua alasan yang dapat dikemukakan :
1.      Pengaruh dari haynya salah satu data saja, tidak akan memberikan efek penyimpangan yang besar terhadap harga pukul rata.
2.      Perhitungan-perhitungan statistika akan dapat memebrikan jawaban yang jelas mengenai kemungkinan apakah data yang menyimpang tadi masih berasal dari satu populasi yang sama atau berbeda dengan data-data lainnya.
Sebaiknya, berhadapan dengan suatu kumpulan data yang mempunyai jumlah data (n) relatif sedikit, akan menimbulkan suatu permasalahan. Bukan saja data yang menimpang tadi dapat memberikan pengaruh yang cukup besar terhadap harga pukul rata, tetapi juga, tidak terdapat jumlah data yang cukup untuk melakukan perhiyungan statistika, guna menyelesaikan data yang diragukan tadi.
Apa sebenarnya pengaruh dari data  yang menyimpang terhadap suatu kumpulan data? Diandaikan kita mempunyai suatu kumpulan data dari suatupenentuan kadar sodium oksida dalam soda abu sebagai berikut :
%Na2O  40,04  40,12  40,16  40,18 40,18  40,20
Data-data ini dapat digambarkan dalam bentuk grafik seperti tampak pada gambar 1. Pada gambar tersebut, harga pukulrata (X ) dihitung dengan jalan menjumlahkan semua data dan kemudian hasil penjumlah yang diperoleh dibagi dengan jumlah data. Dalam contoh di atas didapatkan harga pukulrata adalah 40,147. Sedangkan median (M) diperoleh  dengan jalan menghitung harga pertengahan dari keenam data di atas. Untuk itu, mula-mula data disusun mulai dengan urutan harga yang terendah hingga harga yang tertinggi. Data yang terletak di tengah-tengah semua data tadi disebut median. Jika jumlah data merupakan bilangan genap (pada contoh di atas, n = 6), maka tidak akan terdapat data yang letaknya tepat di tengah-tengah. Dalam hal ini median dihitung sebagai harga rata-rata kedua nilai data yang berada di tengah. Dari kumpulan data di atas, diperoleh median (M) = 40,17. Apabila kita amati Gambar 1, terlihat bahwa data 40,04 kelihatan meragukan. Apabila kemudian data 40,04 ini dibuang (Gambar 4), maka median (M) akan bergeser dari 40,17 menjadi 40,18 dan harga pululrata (x) bergeser dari 40,147 menjadi 40,168. 

 



 
Gambar 1.
Presentasi grafik dari keenam data dalam contoh





 
Gambar 2.
Presentasi grafik dengan membuang data yang “meragukan”


Dari kedua gambar di atas, dapat terlihat bahwa memang median (M) tidak akan banyak terpengaruh oleh adanya data yang menyimpang/meragukan. Tidak demikian halnya dengan harga pukulrata ( x), yang merupakan parameter yang umum digunakan dalam menetapkan suatu hasil analisa. Ternyata terdapatnya data yang menyimpang memberikan pengaruh yang cukup besar terhadap harga pukulrata (x).
Jika demikian, kriteria apa yang dapat digunakan untuk membuang atau mempertahankan suatu data? Sebelum data yang “meragukan” dibuang, perlu ditetapkan terlebih dahulu berapa besar toleransi terhadap perbedaan antara data yang diragukan dengan data-fata lainnya. Apabila perbedaan dibuat terlalu kecil, maka jumlah data yang harus dibuang akan relatif banyak. Sebaliknya menetapkan perbedaan yang terlalu besar juga tidak tepat, karena akan terlalu sering kita diharuskan mentoleransikan data yang jelas menyimpang.
Terdapat beberapa cara perhitungan yang dapat digunakan untuk mempertahankan atau membuang data. Cara yang pertama disebut ATURAN 2,5d. Cara ini mempunyai urutan pengerjaan sebagai berikut :
1.      Dihitung mula-mula harga pukulrata dan deviasi rata-rata dari semua data yang dianggap “baik”.
2.      Dihitung kemudian deviasi dari data yang “meragukan” terhadap harga pukulrata data yang dianggap “baik”.
3.      Apabila deviasi yang diperoleh pada butir 2 lebih besar atau sama dengan 2,5 kali deviasi rata-rata yang diperoleh pada butir 1, maka data yang “meragukan” harus dibuang. Sebaliknya apabila nilainya lebih kecil, maka data yang “meragukan” tadi dapat dipertahankan.

 

Deviasi dari data yang “meragukan” terhadap harga pukulrata data yang dianggap “baik” = /40,04 – 40,168/ = 0,128.

0,128 > 2,5 x 0,0224 = 0,056 (data harus dibuang)

Cara yang kedua disebut aturan 4d, yang mempunyai urut-urutan pengerjaan sama dengan aturan 2,5d.

0,128 > 4 x 0,0224 = 0,0896 (data harus dibuang)

Cara yang ketiga disebut Test-Q yang mempunyai urutan pengerjaan sebagai berikut :
1.      Duhitung mula-mula jarak data.
2.      Dihitung kemudian selisih antara data yang “meragukan” dengan tetangganya yang terdekat.
3.      Selisih yang didapatkan pada butir 2 dibagi kemudian dengan jarak data yang diperoleh pada butir 1. Hasil pembagiannya diberi notasi Q.
4.      Q hasil perhitungan dibandingkan dengan harga Q pada tabel. Apabila Q hasil perhitungan > Q tabel, maka data yang “meragukan” harus dibuang. Sedangkan apabila Q hasil perhitungan < Q tabel, data yang “meragukan” dapat dipertahankan.
TABEL Q




    =  0,50


 
Untuk jumlah data (n) = 6, Q tabel = 0,56. Karena Q = 0,50 < 0,56, data dapat dipertahankan.

Salah satu dari ketiga cara di atas dapat digunakan sebagai kriteria untuk membuang data. (Julia Kantasubrata, Puslitbang Kimia Terapan – LIPI).

















Tidak ada komentar:

Poskan Komentar