Sales Forecasting Menggunakan Random Forest Regression Dengan Particle Swarm Optimization Pada Penjualan Superstore
Abstrak
Dalam era digital saat ini, jumlah data yang terus bertambah menandai pentingnya Big Data, yang mencakup data dengan skala besar, variasi, dan kompleksitas yang menantang untuk disimpan, dianalisis, dan divisualisasikan. Prediksi penjualan yang akurat, krusial dalam lingkungan bisnis yang kompetitif dan dinamis, memberikan wawasan krusial bagi perusahaan di berbagai sektor. Algoritma machine learning seperti Random Forest dan Gradient Boosting, yang berbasis pada struktur pohon, populer digunakan untuk tujuan ini. Pengoptimisasian metode menjadi penting untuk meningkatkan kualitas hasil dan relevansi dengan data yang digunakan. Particle Swarm Optimization (PSO) merupakan salah satu teknik yang dapat digunakan untuk tujuan ini. Metode Random Forest rentan terhadap overfitting, yang menjadi tantangan utama dalam penggunaannya. Penelitian ini mengevaluasi performa algoritma Random Forest Regression yang dioptimisasi menggunakan Particle Swarm Optimization (PSO) untuk prediksi penjualan Superstore, dibandingkan dengan Grid Search dan Randomized Search. Model yang dioptimisasi menggunakan PSO memiliki nilai error sebesar 187,68 pada seluruh data training dan 254,32 pada seluruh data testing. Grid Search memiliki nilai error yang lebih unggul dari PSO namun tidak terlalu signifikan. Disamping itu, PSO memiliki keunggulan dibandingkan algoritma optimisasi lainnya yang dimana memiliki waktu pengoptimasian yang paling singkat yaitu 40 menit 42 detik, dibandingkan Grid Search yang membutuhkan waktu hingga 710 menit 31,5 detik dan PSO memungkinkan pengguna untuk melakukan tuning pada hyperparameter algoritma optimisasi dengan mudah sehingga memungkinkan pengguna untuk mendapatkan hasil optimisasi yang lebih baik. Pengujian Black Box menunjukkan sistem berfungsi dengan baik sesuai kebutuhan pengguna.