Pemodelan statistika dapat menjadi solusi ketidakpastian karena manfaatnya di berbagai kepentingan baik eksplorasi data guna mendapatkan informasi yang berguna di dalam data, prediksi, klasifikasi, klasterisasi, dan lain sebagainya.
Heri menambahkan, bahwa kondisi pada era
big data ini sudah tidak bisa lagi menggunakan model statistika klasik untuk hasil yang akurat. Hal ini dikarenakan data besar ini menimbulkan kemungkinan bias pada sampel dan tingkat interdependensi yang lemah, tapi meluas pada data yang menambah risiko ketidakpastian.
Akan tetapi, metode-metode statistika yang dikembangkan saat ini masih didominasi oleh prinsip pemilihan model terbaik atau
selection. Model ini dilakukan dengan cara membandingkan beberapa jenis metode dan mencari metode dengan nilai rata-rata eror terkecil.
Namun demikian, ini berarti ada pada satu atau beberapa titik tertentu bahwa model terpilih ini bukanlah model terbaik. “Hal ini menunjukkan bahwa dari sisi model, terdapat ketidakpastian dalam metode
selection tadi,” tandas Direktur Pascasarjana dan Pengembangan Akademik ITS ini.
Oleh karena itu, munculnya konsep kombinasi yang didasari pada kenyataan bahwa satu model tidak selamanya mendominasi model yang lain. Heri menyebutkan bahwa pada model kombinasi kita tidak akan memilih satu model terbaik.
Melainkan mengkombinasikan
output dari model-model yang ada dengan diberikan bobot tertentu sesuai dengan kinerjanya. Hal ini bertujuan untuk menangkap ketidakpastian dan konsep ini dinamakan
ensemble approach.
Terdapat banyak jenis metode dalam pendekatan
ensemb beberapa metode yang digunakan oleh Heri adalah Random Forest (RF), Logistic Regression Ensemble (Lorens), dan Bayesian Model Averaging (BMA). Metode pertama yakni RF adalah suatu algoritma yang digunakan pada klasifikasi data dalam jumlah yang besar.