Friday, January 21, 2011

Part IX | DBase System, Data Mining Clasification and Clustering

1. DBASE SYSTEM
dBase, adalah suatu paket Data Base Management System (DBMS) untuk pengelolaan database, pada Personal Computer
Perkembangan dBase
a. dBase II versi 2.4
b. dBase III, III+
c. dBase IV
d. dBase 5.0, versi DOS dan Windows
e. dBase 5.5, Visual
f. dBase 7.0, Visual

File-file untuk pengelolaan data pada dBase
A. File Penyimpan Data
1. File Database (DBF)
2. File Memo (DBT)
3. File Memori (MEM)
B. File Utility Data
1. File Indeks (NDX)
2. File Query/View (QBE)
C. File Untuk Pengelolaan/Menghasilkan Output
1. File Command atau Prosedure (PRG)
2. File REPORT (FRM)
3. File Label (LBQ)
4. File Output Teks, (TXT)
5. File Screen (SCR)
D. Jenis/Type field data
No Type Data Keterangan
1 Karakter u/ data alpa numerik mak 256 karakter
2 Numerik Menyatakan bilangan mak 20 Digit
3 Date Menyatakan tanggal default 8
4 Memo u/ menyatakan ket. yang panjang
5. Logikal u/ logika benar atau salah



OPERATOR PADA DBASE
1. Operator Matematika
a) Operator Aritmetik
-Pangkat ( ^ )
-Perkalian ( * ) atau Pembagian ( / )
-Pejumlahan ( + ) – Pengurangan ( – )
b) Operator Relasi
-untuk Aritmetik : <, >, =, <=, >=, # atau <>
-untuk String : $
2. Operator Logika
AND , OR , NOT

FUNGSI-FUNGSI
1. Fungsi Database
2. Fungsi Date
3. Fungsi Numerik
4. Fungsi String
5. Environment Function, adalah fungsi-fungsi untuk memberikan informasi tentang sistem yang aktif atau kondisi periperal, diantaranya:

DATA MINING
  • “Mining”: proses atau usaha untuk mendapatkan sedikit barang berharga dari sejumlah besar material dasar yang telah ada.
  • Beberapa faktor dalam pendefinisian data mining:
  • Data mining adalah proses otomatis terhadap data yang dikumpulkan di masa lalu
  • objek dari data mining adalah data yang berjumlah besar atau kompleks
  • Tujuan dari data mining adalah menemukan hubungan-hubungan atau pola-pola yang mungkin memberikan indikasi yang bermanfaat.
  • Definisi data mining
  • Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual.
  • Data mining adalah analisa otomatis dari data yang berjumlah besar atau kompleks dengan tujuan untuk menemukan pola atau kecenderungan yang penting yang biasanya tidak disadari keberadaannya

KATEGORI DALAM DATA MINING
- Classification
- Clustering

CLASIFICATION
  • Klasifikasi adalah suatu proses pengelom-pokan data dengan didasarkan pada ciri-ciri tertentu ke dalam kelas-kelas yang telah ditentukan pula.
  • Dua metode yang cukup dikenal dalam klasifikasi, antara lain:
- Naive Bayes
- K Nearest Neighbours (kNN)

K-NEAREST NEIGHBOURS
  • Konsep dasar dari K-NN adalah mencari jarak terdekat antara data yang akan dievaluasi dengan K tetangga terdekatnya dalam data pelatihan.
  • Penghitungan jarak dilakukan dengan konsep Euclidean.
  • Jumlah kelas yang paling banyak dengan jarak terdekat tersebut akan menjadi kelas dimana data evaluasi tersebut berada.

ALGORITMA
  • Tentukan parameter K = jumlah tetangga terdekat.
  • Hitung jarak antara data yang akan dievaluasi dengan semua data pelatihan.
  • Urutkan jarak yang terbentuk (urut naik) dan tentukan jarak terdekat sampai urutan ke-K.
  • Pasangkan kelas (C) yang bersesuaian.
  • Cari jumlah kelas terbanyak dari tetangga terdekat tersebut, dan tetapkan kelas tersebut sebagai kelas data yang dievaluasi.

CLUSTERING
  • Clustering adalah proses pengelompokan objek yang didasarkan pada kesamaan antar objek.
  • Tidak seperti proses klasifikasi yang bersifat supervised learning, pada clustering proses pengelompokan dilakukan atas dasar unsupervised learning.
  • Pada proses klasifikasi, akan ditentukan lokasi dari suatu kejadian pada klas tertentu dari beberapa klas yang telah teridentifikasi sebelumnya.
  • Sedangkan pada proses clustering, proses pengelompokan kejadian dalam klas akan dilakukan secara alami tanpa mengidentifikasi klas-klas sebelumnya.
  • Suatu metode clustering dikatakan baik apabila metode tersebut dapat menghasilkan cluster-cluster dengan kualitas yang sangat baik.
  • Metode tersebut akan menghasilkan cluster-cluster dengan objek-objek yang memiliki tingkat kesamaan yang cukup tinggi dalam suatu cluster, dan memiliki tingkat ketidaksamaan yang cukup tinggi juga apabila objek-objek tersebut terletak pada cluster yang berbeda.
  • Untuk mendapatkan kualitas yang baik, metode clustering sangat tergantung pada ukuran kesamaan yang akan digunakan dan kemampuannya untuk menemukan beberapa pola yang tersembunyi.

No comments:

Post a Comment

Terimakasih Anda Telah berkunjung di di blog kami...