Text
SISTEM KLASIFIKASI KOLEKSI PERPUSTAKAAN BERBASIS DEWEY DECIMAL CLASSIFICATION MENGGUNAKAN ALGORITMA TF-RF DAN K-NEAREST NEIGHBOR
Perpustakaan Politeknik Negeri Banyuwangi saat ini memiliki banyak koleksi buku dari berbagai bidang keilmuan, yang terus bertambah setiap tahunnya. Pertambahan koleksi ini menimbulkan tantangan dalam proses pengklasifikasian buku yang masih dilakukan secara manual, sehingga memakan waktu dan tenaga yang besar. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan sistem klasifikasi koleksi perpustakaan berbasis DDC menggunakan algoritma TF-RF dan K-Nearest Neighbor (KNN). Data yang digunakan berupa judul buku berbahasa Indonesia dengan jumlah 4056 data pada 73 label. Proses dimulai dari pre-processing, ekstraksi fitur menggunakan TF-RF untuk mengukur relevansi kata kunci dan pengklasifikasian model dengan KNN, serta evaluasi performa model dengan K-Fold Cross-Validation 10. Hasil penelitian ini menunjukkan bahwa sistem klasifikasi yang dikembangkan mampu meningkatkan akurasi dan presisi dalam pengelompokan buku berbasis DDC. Percobaan terbaik diperoleh pada skenario ketiga dengan 7 kelas dan 2831 data, di mana model KNN dengan parameter k=1 yang diperoleh melalui GridSearch menghasilkan akurasi sebesar 74,38% dan presisi sebesar 78,91%. Penelitian ini membuktikan bahwa kombinasi TF-RF dan KNN efektif diterapkan untuk klasifikasi teks koleksi buku, terutama pada data dengan jumlah kelas yang lebih sedikit dan distribusi data yang lebih seimbang.Perpustakaan Politeknik Negeri Banyuwangi saat ini memiliki banyak koleksi buku dari berbagai bidang keilmuan, yang terus bertambah setiap tahunnya. Pertambahan koleksi ini menimbulkan tantangan dalam proses pengklasifikasian buku yang masih dilakukan secara manual, sehingga memakan waktu dan tenaga yang besar. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan sistem klasifikasi koleksi perpustakaan berbasis DDC menggunakan algoritma TF-RF dan K-Nearest Neighbor (KNN). Data yang digunakan berupa judul buku berbahasa Indonesia dengan jumlah 4056 data pada 73 label. Proses dimulai dari pre-processing, ekstraksi fitur menggunakan TF-RF untuk mengukur relevansi kata kunci dan pengklasifikasian model dengan KNN, serta evaluasi performa model dengan K-Fold Cross-Validation 10. Hasil penelitian ini menunjukkan bahwa sistem klasifikasi yang dikembangkan mampu meningkatkan akurasi dan presisi dalam pengelompokan buku berbasis DDC. Percobaan terbaik diperoleh pada skenario ketiga dengan 7 kelas dan 2831 data, di mana model KNN dengan parameter k=1 yang diperoleh melalui GridSearch menghasilkan akurasi sebesar 74,38% dan presisi sebesar 78,91%. Penelitian ini membuktikan bahwa kombinasi TF-RF dan KNN efektif diterapkan untuk klasifikasi teks koleksi buku, terutama pada data dengan jumlah kelas yang lebih sedikit dan distribusi data yang lebih seimbang.
Tidak ada salinan data
Tidak tersedia versi lain