Daftar Isi :

  1. Proses Knowledge Discovery pada Data Mining Berserta Tahapannya
  2. Data Preprocessing
  3. Data Warehouse
  4. Teknik database pada Data Mining
  5. Proses Knowledge Discovery

Pada Data Mining ada Proses Knowledge Data Dicovery. Knowledge Dicovery pada Database ada Keseluruhan Proses untuk mencari dan mengidentifikasi pola ( pattern ) dalam data yang dimana pola yang ditemukan bersifat sah , baru dan dapat bermanfaat dan mudah dimengerti. Dengan Proses Knwoledge Dicovery ini berguna sebagai proses menemukan pengetahuan yang berguna dari kumpulan data. Biasanya Teknik Data mining yang digunakan meliput penyiapan Data , Seleksi / Pembersihan data, menggabungkan pengetahuan sebelumnya pada set data dan menafsirkan solusi yang akurat dari hasil yang diamati. Berikut Tahapan Proses Knowledge Data Discover yaitu :

  1. Data Preprocessing
  2. Data Warehouse
  3. Teknik Data Mining

Data Preprocessing

Data Preprocessing adalah proses mempersiapkan data mentah untuk proses prosedur yang lainnya. Dalam Data Mining mentransformasi data ke suatu format yang prosesnya lebih mudah dan efektif untuk kebutuhan pemakai. Salah Satu Contohnya Neural Network.

Dalam Preprocessing terdapat beberapa alat dan metode yang berbeda seperti :

  1. Sampling : menyeleksi subset representatif dari populasi data yang besar.
  2. Transformation :  memanipulasi data mentah untuk menghasilkan input tunggal.
  3. Denoising :  menghilangkan noise dari data
  4. Normalization : mengorganisasi data untuk pengaksesan yang lebih spesifik
  5. Feature extration : membuka spesifikasi data yang signifikan dalam konteks tertentu.

Data Warehouse

Data Warehouse adalah Pusat Repositor informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung Decision Support System ( DSS) dan Executive Information System ( EIS )

Pada Data Warehouse biasanya salinan dari transaksi data yang terstruktur secara spesifik pada query, analisa dan laporan.

Dengan adanya Data Warehouse bertujuan untuk meningkatkan kualitash dan akurasi informasi bisnis dan mengirimkan informasi ke pemakai dalam bentuk yang dimengerti dan dapat diakses dengan mudah.

Adapun Karakterisitk Data Warehouse yaitu :

  1. Subject Oriented
  2. Integrated
  3. Time Variant
  4. Non Volatile

Subject Oriented

Karakterisitik ini biasanya Data yang disusun menurut Subjek dan hanya berisi informasi yang penting bagi pemrosesan Decisison Support. Karakterisitik pada Database biasanya yang semua informasi yang tersimpat dikelompokkan berdasarkan subyek tertentu misalnya : pelanggan , gudang, pasar dan sebagainya. Semua informasi tersebut disimpan dalam suatu sistem data Warehouse. Selain Itu Data – Data disetiap Subyek dirangkum ke dalam dimensi, sebagai contoh : periode waktu , produk , wilayah dan sebagainya sehingga dapat memberikan nilai sejarah untuh bahan analisa.

Integrated

Karakteristik ini biasanya terlihat jika data terletak pada berbagai aplikasi yang terpisah dalam suatu lingkungan operational, encoding data sering tidak seragam sehingga bila data dipindahkan ke data warehouse maka coding akan diasumsikan sama seperti lazimnya.

Time Variant

Karakteristik ini dimana Data Warehouse adalah sebagai tempat untuk storing data ( penyimpanan Data ) selama 5 sampai 10 tahun lebih, dan biasanya data digunakan untuk perbandingan atau perkiraan

Non Volatile

Karakteristik ini dimana data tidak dapat diperbaharui atau dirubah tetap hanya dapat ditambah dan dilihat.

Masalah – Masalah yang biasanyanya terjadi dalam menerapkan Data Warehouse yaitu :

  1. Dokumentasi dan pengelolaan metadata dari data warehouse.
  2. Penentuan aturan dalam proses transformasi untuk memetakan berbagai sumber legacy data yang akan dimasukkan ke dalam data warehouse.
  3. Pencapaian proses pengembangan yang handal, baik dalam membangun,  mempimplementasikan, maupun memelihara data warehouse.

Adapun Teknik Database ( Datamining ) dalam Proses Knowledge Discovery. Secara Umum teknik – Teknik Database ( Data Mining ) meliputi :

  1. Searching
  2. Indexing
  3. Data Reduction

Searching

Pada Teknik Ini dilakukan untuk memeriksa serangkaian Item yang memiliki sifat – sifat yang diinginkan. Tindakan yang dilakukan untuk menemukan suatu item tertentuk baik yang diketahui keberadaannya maupun tidak.  Teknik ini bekerja dengan memasukkan kata dalam suatu program komputer untuk membandingkan dengan informasi yang ada dalam database.

Indexing.

Pada Teknik Ini adalah melakukan Struktur – Struktur Akses yang digunakan untuk mempercepat respon dalam mendapatkan record – record pada kondisi – kondisi pencarian tertentu. Pada Indexing Sebuah Kolom disebut dengan Indexing Field yang dimana suatu struktur akses index yang biasanya menjelaskan field tunggal dari suatu file. Adapun juga Indexing Organization memberikan efisiensi akses ke record-record secara berurut atau random.

Data Reduction

Teknik Data Reduction adalah Transformasi suatu masalah ke masalah lain dan dapat digunakan untuk mendefinisikan serangkaian masalah yang kompleks. Yang dimana Teknik ini yang digunakan untuk mentransformasi dari data mentah ke bentuk format data yang lebih bergunan. Sebagai contoh Groupping , sum dan Average Data.

Data Reduction juga dilakukan untuk mengatasi ukuran data yang terlalu besar. Ukuran data yang terlalu besar dapat mnimbukan ketidakefisieanan proses dan peningkatan biaya pemrosesan.

Teknik Data Reduction biasanya dilakukan dalam tahap data preprocessing pada rangakian proses Knwoledge Discovery Database  sebelum dilakukan data Mining dengan tujuan mengurangi ukuran data yang besar. Jadi Jika Disimpulkan Proses Knowledge Dicovery ada 3  Tahapan yaitu :

  1. Pre-processing  (data selection, cleaning, coding )
  2. Data Mining  (select a model, apply the model )
  3. Analysis of results and assimilation ( Take action and measure the results )

Jika Dibuat Dalam bentuk Visual / Gambar Seperti berikut :

Demikian Pembahasan mengenai Proses Knowledge Discovery pada Data Mining Beserta Tahapannya. Semoga bermanfaat untuk Anda Kedepannya. Terima Kasih

Referensi :

  1. Berry,Michael JA, Linoff, Gordon S., Mastering Data Mining: The Art and Science of Customer Relationship Management, John Willey, Canada, 2000
  2. Chakrabarti, Soumen, Mining the Web: Discovering Knowwledge from Hypertext Data, Morgan Kaufman Series, San Fransisco, 2003

  3. Dilly, Ruth, Student Notes: Data Mining:An Introduction, Queens University, Belfast, www.pcc.qub.ac.uk/tec/courses/datamining/stu_notes/dm_book_1.html

  4. Diktat Workshop Data Mining, ITS, Surabaya, 2003