Dalam
melakukan suatu analisa kimia, seringkali diperoleh bahwa data yang didapatkan
sukar direproduksi dengan baik. Dari suatu kumpulan data hasil analisa,
seringkali dijumpai salah satu data menyimpang relatif besar terhadap data-data
lainnya, Dalam hal ini, sebelum dilakukan pengolahan data, sebaiknya diputuskan
terlebih dahulu apakah data yang menyimpang tadi harus dibuang atau dapat
dipertahankan.
Berhadapan
dengan suatu kumpulan data yang mempunyai jumlah data (n) cukup besar, dibuang
atau tidaknya salah satu data tidak akan memberikan pengaruh yang cukup
berarti. Mengapa? Ada dua alasan yang dapat dikemukakan :
1. Pengaruh dari haynya salah
satu data saja, tidak akan memberikan efek penyimpangan yang besar terhadap
harga pukul rata.
2. Perhitungan-perhitungan
statistika akan dapat memebrikan jawaban yang jelas mengenai kemungkinan apakah
data yang menyimpang tadi masih berasal dari satu populasi yang sama atau
berbeda dengan data-data lainnya.
Sebaiknya,
berhadapan dengan suatu kumpulan data yang mempunyai jumlah data (n) relatif
sedikit, akan menimbulkan suatu permasalahan. Bukan saja data yang menimpang
tadi dapat memberikan pengaruh yang cukup besar terhadap harga pukul rata,
tetapi juga, tidak terdapat jumlah data yang cukup untuk melakukan perhiyungan
statistika, guna menyelesaikan data yang diragukan tadi.
Apa
sebenarnya pengaruh dari data yang menyimpang terhadap suatu kumpulan
data? Diandaikan kita mempunyai suatu kumpulan data dari suatupenentuan kadar
sodium oksida dalam soda abu sebagai berikut :
%Na2O
40,04 40,12 40,16 40,18 40,18 40,20
Data-data
ini dapat digambarkan dalam bentuk grafik seperti tampak pada gambar 1. Pada
gambar tersebut, harga pukulrata (X ) dihitung dengan jalan menjumlahkan
semua data dan kemudian hasil penjumlah yang diperoleh dibagi dengan jumlah
data. Dalam contoh di atas didapatkan harga pukulrata adalah 40,147. Sedangkan
median (M) diperoleh dengan jalan menghitung harga pertengahan dari
keenam data di atas. Untuk itu, mula-mula data disusun mulai dengan urutan
harga yang terendah hingga harga yang tertinggi. Data yang terletak di
tengah-tengah semua data tadi disebut median.
Jika jumlah data merupakan bilangan genap (pada contoh di atas, n = 6), maka
tidak akan terdapat data yang letaknya tepat di tengah-tengah. Dalam hal ini
median dihitung sebagai harga rata-rata kedua nilai data yang berada di tengah.
Dari kumpulan data di atas, diperoleh median (M) = 40,17. Apabila kita amati
Gambar 1, terlihat bahwa data 40,04 kelihatan meragukan. Apabila kemudian data
40,04 ini dibuang (Gambar 4), maka median (M) akan bergeser dari 40,17 menjadi
40,18 dan harga pululrata (x) bergeser dari 40,147 menjadi 40,168.
Gambar 1.
Presentasi
grafik dari keenam data dalam contoh
Gambar
2.
Presentasi
grafik dengan membuang data yang “meragukan”
Dari
kedua gambar di atas, dapat terlihat bahwa memang median (M) tidak akan banyak
terpengaruh oleh adanya data yang menyimpang/meragukan. Tidak demikian halnya
dengan harga pukulrata ( x), yang merupakan parameter yang umum digunakan
dalam menetapkan suatu hasil analisa. Ternyata terdapatnya data yang menyimpang
memberikan pengaruh yang cukup besar terhadap harga pukulrata (x).
Jika
demikian, kriteria apa yang dapat digunakan untuk membuang atau mempertahankan
suatu data? Sebelum data yang “meragukan” dibuang, perlu ditetapkan terlebih
dahulu berapa besar toleransi terhadap perbedaan antara data yang diragukan
dengan data-fata lainnya. Apabila perbedaan dibuat terlalu kecil, maka jumlah
data yang harus dibuang akan relatif banyak. Sebaliknya menetapkan perbedaan
yang terlalu besar juga tidak tepat, karena akan terlalu sering kita diharuskan
mentoleransikan data yang jelas menyimpang.
Terdapat
beberapa cara perhitungan yang dapat digunakan untuk mempertahankan atau
membuang data. Cara yang pertama disebut ATURAN 2,5d. Cara ini mempunyai urutan
pengerjaan sebagai berikut :
1. Dihitung mula-mula harga
pukulrata dan deviasi rata-rata dari semua data yang dianggap
“baik”.
2. Dihitung kemudian deviasi
dari data yang “meragukan” terhadap harga pukulrata data yang dianggap “baik”.
3. Apabila deviasi yang
diperoleh pada butir 2 lebih besar atau sama dengan 2,5 kali deviasi
rata-rata yang diperoleh pada butir 1, maka data yang “meragukan” harus
dibuang. Sebaliknya apabila nilainya lebih kecil, maka data yang “meragukan”
tadi dapat dipertahankan.
Deviasi
dari data yang “meragukan” terhadap harga pukulrata data yang dianggap “baik” =
/40,04 – 40,168/ = 0,128.
0,128
> 2,5 x 0,0224 = 0,056 (data harus dibuang)
Cara
yang kedua disebut aturan 4d, yang mempunyai urut-urutan pengerjaan sama
dengan aturan 2,5d.
0,128
> 4 x 0,0224 = 0,0896 (data harus dibuang)
Cara
yang ketiga disebut Test-Q yang mempunyai urutan pengerjaan sebagai berikut :
1. Duhitung mula-mula jarak
data.
2. Dihitung kemudian selisih
antara data yang “meragukan” dengan tetangganya yang terdekat.
3. Selisih yang
didapatkan pada butir 2 dibagi kemudian dengan jarak data yang diperoleh
pada butir 1. Hasil pembagiannya diberi notasi Q.
4. Q hasil perhitungan
dibandingkan dengan harga Q pada tabel. Apabila Q hasil perhitungan > Q
tabel, maka data yang “meragukan” harus dibuang. Sedangkan apabila Q hasil
perhitungan < Q tabel, data yang “meragukan” dapat dipertahankan.
TABEL
Q
= 0,50
Untuk
jumlah data (n) = 6, Q tabel = 0,56. Karena Q = 0,50 < 0,56, data dapat
dipertahankan.
Salah
satu dari ketiga cara di atas dapat digunakan sebagai kriteria untuk membuang
data. (Julia Kantasubrata, Puslitbang Kimia Terapan – LIPI).
Tidak ada komentar:
Posting Komentar