Pengertian Data Mining

Data mining adalah pembelajaran berbasis induksi (induction-based learning) adalah proses pembentukan definisi-definisi konsep umum yang dilakukan dengan cara mengobservasi contoh-contoh spesifik dari konsep-konsep yang akan dipelajari.

Data mining berisi pencarian trend atau pola yang diinginkan dalam database yang besar untuk membantu pengambilan keputusan di waktu yang akan datang. Harapannya, perangkat data mining mampu mengenali pola-pola ini dalam data dengan masukan yang minimal.Pola-pola ini dikenali oleh perangkat tertentu yang dapat memberikan suatu analisa data yang berguna dan berwawasan yang kemudian dapat dipelajari dengan lebih teliti, yang mungkin saja menggunakan perangkat pendukung keputusan yang lainnya.

Sumber Gambar: datawarehouse4u.info

Baca Juga: Definisi Data Mining

Pengertian data Warehouse pada Data Mining

Data mining berpotensi tinggi jika data yang tepat dikumpulkan dan disimpan dalam sebuah gudang data (data warehouse). Sebuah gudang data merupakan suatu sistem manajemen basisdata relasional (RDMS) yang didesain khusus untuk memenuhi kebutuhan akan sistem pengolahan transaksi. Data Warehouse, secara bebas dapat didefinisikan sebagai tempat penyim'panan data terpusat yang dapat di-query untuk manfaat bisnis. Data warehousing merupakan teknik baru yang powerful yang membuatnya mungkin untuk mengekstrak data operasional yang diarsipkan dan mengatasi ketidakkonsistensian dari format-format data warisan yang berbeda. Data warehouse baik untuk mengintegrasikan keseluruhan data sebuah perusahaan,tanpa memperhatikan lokasi, format atau kebutuhan komunikasi yang memungkinkan untuk memasukkan informasi tambahan atau ahli. Ini berarti menghubungkan secara logis antara apa yang dilihat oleh manajer dalam aplikasi 

Baca Juga: Operasi dan tahapan Proses Data Mining 

sistem informasi pendukung keputusan dan aktifitas operasional perusahaan. Dengan kata lain, data warehouse menyediakan data yang siap ditransformasi dan disimpulkan sedemikian hingga membuatnya sesuai untuk aplikasi DSS dan SIM yang lebih efisien.  Gudang data biasanya berisi data sejarah, terkumpul dari sumber yang berbeda-beda seperti sistem proses transaksi online — Online Data Transaction Processing (0LTP), system warisan, file-file teks dan spreadsheets. Pada data-tersebut kemudian dilakukan proses pembersihan untuk aku'rasi dan konsistensi dan mengelolanya untuk memudahkan dan efisiensi pada query.