Data kini telah diyakini ibaratnya tambang emas untuk dapat memilah dan memilih strategi terbaik demi tercapainya sebuah cita. Semua berlomba mendapatkan data, mengumpulkan angka demi angka, membuat kategori, mencari respon dan sebagainya. Namun, seberapa jauh tindakan-tindakan ini bisa menghasilkan tambang emas yang dimaksud.
Jika, saya bertanya : "Berapa banyak data yang ada di sekitar anda?", pasti dengan mudah anda menyebutkannya, untuk menghitungnya bahkan mungkin tak terhitung. Di sebuah perusahaan, pasti para pimpinannya menyadari begitu banyak data yang mereka punyai. Namun, sebenarnya tak jarang kita hanya mengumpulkan sampah, bukannya mengumpulkan data. Seperti apakah rupa sampah itu, walaupun kita telah mencoba untuk memoles wajahnya dengan atribut yang cantik dan memukau?
Contoh 1 :

Gambar diatas ini adalah contoh informasi tentang data pekerjaan pelanggan yang sama sekali tidak bermakna. Anggap saja terdapat 100.000 pelanggan, 71% tidak dapat diketahui pekerjaan pelanggan. Perhatikan juga kelompok pekerjaan yang lain, misalnya kategori "Swasta" sebesar 2% atau kategori "Lainnya" sebesar 21%. Apa manfaat yang bisa diambil dari pekerjaan lainnya bagi perusahaan? Pekerjaan swasta yang seperti apa yang merupakan segmen perusahaan?. Data diatas, meskipun telah diolah dalam diagram pie, tak akan memberikan gambaran apapun tentang kelompok pelanggan dari sebuah perusahaan
Contoh 2 :

Gambar diatas adalah plot rata-rata jumlah penjualan dari dari 2 buah produk selama 4 tahun yang dihubungkan melalui garis, dan selanjutnya dimodelkan dengan model regresi linier. Model yang terjadi tidak memiliki makna apapun, karena walaupun data telah dikumpulkan selama 4 tahun, namun yang dipakai hanya rata-ratanya saja. Data tidak cukup, dan tidak tampak sebuah "history" apapun pada data tersebut. Apalagi ketika melihat model dari grafik berwarna merah muda, nampak sekali bahwa model dipaksakan linier. Informasi dari model ini pun tidak dapat dipakai sebagai prediksi penjualan pada periode ke depan.
Contoh 3 :

Pada grafik diatas, kita hanya dapat melihat trend dari produk A. Fluktuasi trend untuk produk B dan C tidak dapat kita amati. Ini karena rentang jumlah penjualan dari produk A jauh berbeda dengan produk B dan C. Kesalahan ini sering tidak disadari, ketika pembuat grafik tidak mengenal perbedaan rentang nilai dalam sebuah pengukuran
Contoh 4 :

Ketika ingin sekali menggambarkan pengelompokkan segmen, crosstab memang akan sangat membantu kita. Namun, jika pada crosstab diatas kemudian diinterpretasikan bahwa 100% segmen dari brand C adalah orang-orang dengan SES tingkat AB dan kemudian diinterpretasikan bahwa segmen dengan SES A+ hanya dimiliki 100% oleh brand A, maka informasi ini jelas salah dan menyesatkan. Hal ini dikarenakan tidak dipenuhinya syarat minimum sel dan asumsi untuk pengolahan melalui crosstab.
Kesalahan-kesalahan yang terjadi seperti diatas bukan hanya persoalan margin of error maupun persoalan validitas data, melainkan kecerobohan karena pemahaman yang sangat minim tentang pengelolaan data.
Tentunya kita semua tidak ingin menerima informasi dari sampah-sampah data walaupun telah tersaji dalam grafik dan pengolahan data seperti diatas. Apalagi, tersesat dalam mengambil sebuah kesimpulan dari data-data yang tak bermakna seperti diatas.
Semua grafik, semua metode statistik bisa saja dikenakan pada data. Semua software bisa digunakan, namun masing-masing metode, masing-masing software selalu mensyaratkan asumsi tertentu. Maka, jelaslah sebuah kewajiban untuk mempelajari metode, mendesain sebuah kerangka analisis dan memahami asumsi-asumsi untuk penggunaan sebuah tools, sebelum berani mengumpulkan data bahkan melakukan pengolahan, mempresentasikannya hingga mendapatkan tambang emas yang diinginkan dari sekumpulan data.
0 komentar:
Post a Comment