Materi Tentang Data Mining Lengkap

  • On May 27, 2019 ·
  • By ·
Materi Tentang Data Mining Lengkap

Materi Tentang Data Mining Lengkap – Banyak definisi tentang apa itu data mining. Penambangan data adalah alat yang memungkinkan pengguna untuk dengan cepat mengakses data dalam jumlah besar. Pemahaman yang lebih spesifik tentang penambangan data, yang merupakan alat dan aplikasi yang menggunakan analisis data statistik.

Penambangan data adalah proses mengekstraksi atau mengekstraksi sejumlah besar data dan informasi yang belum diketahui, tetapi dapat dipahami dan bermanfaat dari basis data besar dan digunakan untuk membuat keputusan bisnis yang sangat penting.

Penambangan data menggambarkan serangkaian metode untuk menemukan pola yang tidak diketahui dalam data yang dikumpulkan. Penambangan data memungkinkan pengguna untuk menemukan pengetahuan dalam database yang tidak mungkin diketahui oleh pengguna.

Memahami Penambangan Data

Materi Tentang Data Mining Lengkap

Analisis data cerdas adalah proses pengambilan informasi secara otomatis yang berguna untuk menyimpan sejumlah besar data. Istilah lain yang umum digunakan termasuk penemuan pengetahuan (penambangan) dalam database (KDD), ekstraksi pengetahuan, analisis data / pola, data arkeologi, penambangan data, pengumpulan informasi dan analisis bisnis. Teknik penambangan data digunakan untuk mempelajari basis data besar untuk menemukan templat yang baru dan bermanfaat. Tidak semua pekerjaan untuk pencarian informasi dinyatakan sebagai data mining.

Misalnya, mencari catatan individual menggunakan sistem manajemen basis data atau mencari halaman tertentu menggunakan kueri untuk semua mesin pencari adalah pekerjaan mencari informasi, terkait erat dengan pencarian informasi. Teknik penambangan data dapat digunakan untuk meningkatkan kemampuan sistem pencarian informasi. Input data dapat disimpan dalam berbagai format, seperti file datar, spreadsheet atau tabel relasional, dan dapat mengambil penyimpanan data terpusat atau didistribusikan di banyak tempat.

Tujuan preprocessing adalah untuk mengubah data input mentah menjadi format yang sesuai untuk analisis lebih lanjut. Tahap preprocessing data meliputi penggabungan data dari berbagai sumber, pembersihan (clearing) data untuk menghilangkan noise dan duplikasi pengamatan, serta memilih catatan dan fungsi yang sesuai untuk penggalian data. Karena ada banyak cara untuk mengumpulkan dan menyimpan data, langkah preprocessing adalah level yang membutuhkan banyak waktu di KDD.

Hasil penambangan data sering diintegrasikan dengan sistem pendukung keputusan (DSS). Misalnya, dalam aplikasi bisnis, informasi yang dihasilkan melalui penambangan data dapat diintegrasikan dengan alat manajemen kampanye iklan untuk menerapkan dan menguji kampanye pemasaran yang efektif. Integrasi ini membutuhkan langkah-langkah pasca pemrosesan yang memastikan bahwa hanya hasil yang valid dan berguna yang dikombinasikan dengan DSS. Salah satu tugas dan pasca-pemrosesan adalah visualisasi, yang memungkinkan analis untuk mengeksplorasi data dan analisis data dari berbagai sudut pandang. Pengukuran statistik dan metode pengujian hipotesis dapat digunakan selama pasca pemrosesan untuk menyingkirkan hasil analisis data palsu.

Batas waktu dalam Penambangan Data

  • Presentasi pengetahuan (di mana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah diperoleh pengguna).
  • Pemilihan data (ketika data yang terkait dengan tugas analisis dikembalikan ke database)
  • Transformasikan data (ketika data berubah atau bergabung ke dalam bentuk yang benar untuk analisis dengan ringkasan kinerja atau operasi agresi)

Fungsi penambangan data

Fungsi data mining adalah untuk mengidentifikasi fakta atau kesimpulan yang diajukan berdasarkan penyaringan data untuk mempelajari pola atau anomali data. Data mining memiliki fungsi:

  • Klasifikasi yang melengkapi definisi karakteristik kelompok. Contoh: pelanggan perusahaan yang telah mengalihkan persaingan ke perusahaan lain.
  • Clustering, yang mengidentifikasi kelompok barang atau produk yang memiliki karakteristik khusus (clustering berbeda dari klasifikasi, ketika tidak ada definisi karakteristik kru dalam clustering yang diberikan selama klasifikasi.)

Lihat Juga :