Jumat, 05 Maret 2010

Sekilas Data Mining

Data mining adalah suatu proses pengambilan pola dari sekumpulan data yang dianalisa. Data mining menjadi sebuah alat ataupun tool yang sangat penting dalam menggali sebuah informasi dari sekumpulan data. Pada umumnya banyak digunakan di dalam bidang-bidang Profiling seperti marketing, surveillance, fraud detection , dll.
Data mining bisa digunakan untuk mengungkap pola-pola informasi dari sebuah data ataupun juga dari sebuah sampel data yang memiliki kemiripan variabel. Proses data mining tersebut akan menjadi tidak efektif (tidak menemukan jawaban yang diharapkan) jika sampel data yang diambil tidak merepresentasikan data secara keseluruhan. Data mining tidak akan menemukan pola informasi dalam keseluruhan data jika keseluruhan data tersebut tidak direpresentasikan dalam sampel data yang sedang kita teliti.

Web Mining
Salah satu aplikasi dari data mining adalah web mining, dimana tehnik data mining digunakan untuk menemmukan pola-pola informasi yang terkandung dari sebuah web (operasional website). Web mining dibedakan menja:
  • Web usage mining adalah proses untuk menemukan pola tentang informasi apa saja yang dicari user dari internet. Misal data tekstual, data multimedia, dll. Web usage mining juga bisa digunakan untuk menemukan pola perilaku dari kumpulan pengguna yang adalam sebuah area tertentu.
  • Web structure mining adalah proses penggunaan teori graph untuk menganalisa simpul-simpul dan struktur hubungan dari sebuah web site. Berdasarkan dari tipe struktur data nya maka dibedakan menjadi dua. Pertama pengambila pola dari hyperlink yang ada dalam sebuah web. Hyperlink adalah sebuah kompponen yang menghubungkan web dengan lokasi lainnya. Keduaadalah structur dokumen. Yang kedua ini menggunakan tree-like struktur(struktur pohon) untuk menganalisa dan menggambarkan HTML ataupun XML didalam sebuah web.
  • Web content mining adalah proses pengabilan informasi yang terdapat dalam sebuah web dari sisi konten

Tidak ada komentar:

Posting Komentar