Oleh: antoniusrc | 25 Mei 2008

Web Categorization : Thesis

Mau nulis ah tentang tesisku, aku membuat sebuah web categorization dengan metode text mining, yaitu metode pembobotan TFIDF dan metode klasifikasi decision tree. Jadi, admin akan dapat menambahkan web-web tertentu dengan kategori yang sudah didefinisikan terlebih dahulu, lalu dengan data pembelajaran itu, akan dibuat decision treenya. Metode TFIDF digunakan untuk memboboti tingkat kepentingan kata-kata yang muncul pada setiap dokumen dan kategori-kategorinya. Lalu user dapat memasukkan sebuah URL web tertentu dan dapat diketahui kategori webpage tersebut berdasarkan kata-kata dan decision tree yang sudah terbentuk sebelumnya. Tahapan-tahapannya:

1. Tokenisasi / Scanner per web page
2. Stopword (800-an kata)
3. Stemming (Porter Stemming)
4. TFIDF
5. Decision Tree
6. Testing

Saya mendapat ide dari Google Directory

Semoga menarik bagi pembaca…


Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s

Kategori

%d blogger menyukai ini: