Minggu, 21 Maret 2021

Tugas 1 - Konsep Data Mining

 KONSEP DATA MINING


 Alzahabighalih
 50417582
 4IA23

 


1.Sumber Jurnal

Heri Susanto, 
Sudiyatno, 2014 Jurnal Pendidikan VokasiJurnal Pendidikan Vokasi, Vol 4, Nomor 2, Juni 2014DATA MINING UNTUK MEMPREDIKSI PRESTASI SISWA BERDASARKAN SOSIAL EKONOMI, MOTIVASI, KEDISIPLINAN DAN PRESTASI MASA LALU, Yogyakarta, SMK Negeri 4 Surakarta, Universitas Negeri Yogyakarta.

               


2.Tahap-Tahap

1. Tipe Data 


            Memeriksa tiap variabel independen menggunakan uji chi-square, menentukan variabel independen mana yang paling sig-nifikan, membagi data menggunakan kategori variabel independen
            Membentuk model hubungan antara variabel terikat (dependen) dengan satu atau lebih variabel bebas (inde-penden). Menyatakan suatu parameter yang dibuat sebagai kriteria dalam pembentukan tree. Salah satu atribut yang merupakan atributyang menyatakan data solusi per-item data yang disebut dengan target atribut. Terhadap keseluruhan data yang diteliti yang berjumlah 416 siswa, teknik pengumpulan data yang digunakan adalah dokumentasi dan angket. Hasil penelitian menunjukkan bahwa analisis prediksi menggunakan decision tree algoritma J48 memiliki akurasi sebesar 95,7%, sedangkan analisis prediksi menggunakan CHAID memiliki tingat akurasi 82,1% dan analisis regresi ganda menghasilkan tingkat signifikansi sebesar 90,6%.

2. Preprocessing 

    
        Dilakukan proses
cleaning pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain mem-buang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak (tipografi); Transformation, coding adalah proses trans-formasi pada data yang telah dipilih, sehingga data tersebut sesuai untuk proses data mining

3. Task Mining

             Pembelajaran secara positif disiplin memberi dukungan lingkungan yang tenang dan tertib bagi proses pembelaja-ran, disiplin merupakan jalan bagi siswa untuk sukses dalam belajar dan kelak ketika bekerja karena kesadaran pentingnya norma, aturan, kepatuhan dan ketaatan merupakan kesuksesan seseorang.

4. Hasil

            Pendidikan merupakan salah satu faktor kemajuan dan kemandirian bangsa. Semakin maju pendidikan suatu bangsa, maka akan se-makin maju dan mandiri bangsa tersebut. Dan hasil penelitian berdasarkan tahapan-tahapan proses dalam KDD (Knowledge Data Discovery) sebagai berikut: (1) Data Selection, tahapan ini dilakukan untuk memilih data yang sesuai dengan variabel yang dibutuhkan dalam penelitian. Caranya adalah dengan memilih atau menentukan atribut-atribut data mana yang akan digunakan dalam penelitian dari sekelompok data operasional yang ada. Salah satunya adalah menentukan atribut-atribut un-tuk variabel Sosial Ekonomi Orang Tua yang diambil dari data operasional yaitu Data Priba-di Siswa yang ada di BP/BK sekolah; (2) Pre-processing/Cleaning, proses cleaning tersebut dilakukan terhadap keseluruhan data yang diteliti yang berjumlah 416 siswa. Setelah di-lakukan proses cleaning data sejumlah 416, di-hasilkan data bersih sebanyak 346 record data yang digunakan untuk proses analisis berikut-nya; (3) Transformation, tahap ini menghasil-kan satu recordset data yang siap untuk analisis data; (4) Analisis data.

5. Tools

            Framework untuk mengaplikasikan data mining pada penelitian tanah nasional diusulkan meliputi pengemban-gan database tanah, seleksi dataset, aplikasi al-goritma, dan penyajian dan interpretasi hasil

 
Kesimpulan

        Berdasarkan analisis data menggunakan decision tree data mining untuk memprediksi prestasi belajar siswa berdasarkan status sos-ial ekonomi orang tua, motivasi, kedisiplinan siswa dan prestasi masa lalu menggunakan metode data mining
 
-
variabel motivasi adalah variabel yang menentukan potensi seorang siswa berha-sil atau tidak prestasi belajarnya di waktu yang akan datang.

-
Hasil akurasi klasifikasi menggu-nakan metode CHAID dengan data yang sama memperoleh hasil rata-rata prediksi 82,1. Hal ini menunjukkan bahwa berdasarkan hasil kla-sifikasi menggunakan metode CHAID tersebut memiliki tingkat akurasi yang tergolong baik

disimpulkan bahwa penggunaan metode data mining dengan algoritma decision tree memiliki tingkat akurasi yang lebih baik