July 12, 2007

Orangnya atau Software-nya ?

Perhitungan statistik seringkali terkesan rumit, terutama jika kita dihadapkan pada ratusan – n data. Karena kesan itulah, banyak orang yang memanfaatkan beberapa software untuk mempermudah perhitungan statistik. Tidak salah, namun anda harus berhati-hati.




Beberapa hari yang lalu rekan seprofesi, tiba-tiba memperbincangkan adanya perbedaan perhitungan di excel dengan nilai yang sebenarnya. Dari analisa yang dilakukannya, terbukti bahwa jika anda tidak “berhati-hati”, maka perhitungan melalui microsoft excel bisa menghilangkan informasi yang sebenarnya. Analisa ini juga marak di beberapa website hingga muncul ungkapan “Jangan pernah menggunakan excel pada saat anda mengolah data statistik”.


Sebenarnya Microsoft Excel merupakan software untuk yang memfasilitasi tabulasi data dan perhitungan matematis sederhana serta beberapa pengukuran statistik seperti : statistik deskriptif. Karena adanya multi fungsi dari excel (bukan dikhususkan untuk pengolahan data statistik), maka tentu jauh lebih baik jika anda mengolah data dengan software khusus seperti : SPSS, R, Minitab, SAS. Kenapa ?


- Beberapa formula yang ada di excel, tidak memperhitungkan skala data yang anda gunakan. Misal : jika anda mengkodekan 1 = laki-laki dan 2 = perempuan, maka angka 1 dan 2 tersebut berskala nominal dan sebenarnya tidak selayaknya anda menghitung rata-rata dengan data ini yang jika diformulasikan di excel maka akan keluar rata-rata.

- Beberapa grafik yang disajikan di excel, tidak memenuhi kaidah yang sebenarnya. Misal : Histogram kadang diperlukan agar kita dapat mengetahui visualisasi sebaran/ bentuk data. Jika anda menggunakan menu histogram pada excel, maka histogram yang ada tidak akan memiliki arti tertentu, dan tidak akan terlihat pola data, tidak ada kelas dan interval pada histogram dengan excel.

- Pada analisis inferensia seperti regresi dan perhitungan ANOVA seringkali perhitungan excel adalah perhitungan yang tidak benar terutama pada saat ada data missing/ not available. Pada regresi misalnya, regresi di excel tidak mengindahkan asumsi distribusi normal, ada atau tidaknya multikolinearitas sehingga perhitungan standar error pun menjadi kacau.


Dari beberapa pengalaman, memang tidak ”aman” jika pengolahan data statistik (terutama statistik inferensia) menggunakan microsoft excel, kecuali anda memahami dengan benar dasar formulasi yang ada di excel dan yakin benar bahwa data yang akan diolah sudah terkondisi dan memenuhi asumsi-asumsi pengolahan data di excel. Untuk itulah pengetahuan dasar tentang data dan statistik diperlukan.


Lebih disarankan menggunakan software khusus statistik untuk melakukan analisis inferensia statistik. Namun, bukan berarti tidak ada kondisi yang harus dipatuhi seperti :

  • analisis sesuai dengan skala data yang digunakan
  • perhatikan cara mentabulasikan data, karena masing-masing software memiliki ketentuan yang berbeda-beda
  • perhatikan asumsi-asumsi dasar statistik yang lain, seperti : distribusi data, independensi, heterogenitas, dll.


Mungkin beberapa software akan menolak analisis tertentu jika kondisi dan asumsi tidak dipenuhi, namun ada juga yang tidak demikian. Jadi, yang harus pintar dan cermat orangnya atau software-nya ?

3 komentar:

Anonymous said...

saya masi susah lepas dari software statistik bajakan..baiknya gemana ya bu..

Unknown said...

sebenrnya sudah banyak statistical packages yang free & open source. Memang konsekuensinya harus sedikit belajar & berpikir.

marmotji said...

bisa dimaklumi dengan beredarnya software bajakan apalagi jika basisnya adalah klik-klik-klik dan kliiiik...
tetapi ada kog yang free dan open source...memang harus diakui GUInya masih tertinggal jauh, tapi yang penting kan hasilnya tidak bias...hehehehehe...
Sejauh pengalaman sih, dan ini nyata, walau sudah dibuatin, tetap aja hasilnya gak bener, karena inputnya gak bener juga...