Please use this identifier to cite or link to this item: http://ptsldigitalv2.ukm.my:8080/jspui/handle/123456789/513520
Title: Model Markov Tersembunyi tak terselia untuk penandaan golongan kata Bahasa Melayu
Authors: Hassan Mohamed (P52679)
Supervisor: Nazlia Omar, Prof. Madya Dr.
Keywords: Model Markov Tersembunyi
Bahasa Melayu
Golongan kata
Korpus beranotasi
Dissertations, Academic -- Malaysia
Universiti Kebangsaan Malaysia -- Dissertations
Issue Date: 16-Feb-2015
Description: Isu utama dalam penandaan golongan kata (GK) adalah untuk mengendalikan perkataan kabur dan perkataan yang tidak diketahui atau dikenali sebagai perkataan anu. Idea pendekatan Model Markov Tersembunyi (MMT) tak terselia berbanding dengan yang terselia adalah untuk mengelak daripada keperluan menyediakan korpus beranotasi yang besar kerana memerlukan tenaga kerja intensif terutamanya bagi bahasa kekurangan sumber seperti Bahasa Melayu. Dalam proses latihan penandaan MMT tak terselia, satu-satunya bahagian yang diselia adalah kamus bertanda yang mengehadkan kemungkinan tanda perkataan. Oleh itu, perkataan anu akan terdiri daripada sama ada perkataan yang tidak disenaraikan dalam kamus atau perkataan yang tidak terdapat dalam korpus latihan. Perkara yang sukar dalam mengendalikan perkataan sedemikian dalam penandaan MMT tak terselia adalah bagaimana untuk menghampirkan kebarangkalian pelepasannya. Kajian ini bertujuan untuk mengenal pasti kaedah pengendalian perkataan anu dalam penandaan MMT tak terselia bagi Bahasa Melayu. Kaedah tersebut merangkumi penggunaan model konteks perkataan yang dicadangkan berbanding dengan morfem imbuhan Bahasa Melayu dan model abstraksi aksara berturut-turut yang kesemuanya bertujuan untuk menghampirkan kebarangkalian pelepasan perkataan anu. Penyelidikan ini berbentuk eksperimental yang perlu melalui aliran proses MMT tak terselia. Aliran proses tersebut bermula dengan pemberian nilai awal pelepasan dan juga pemberian nilai awal peralihan. Pemberian nilai awal pelepasan menggunakan model konteks perkataan yang mana konteks perkataan tersebut diandaikan memiliki ciri yang serupa dengan model Kaca Spin Pott (Potts Spin Glasses). Aliran seterusnya adalah latihan MMT menggunakan algoritma Baum-Welch yang membuat pelarasan parameter MMT. Algoritma tersebut diubahsuai untuk menganggarkan marginal kebarangkalian tanda GK serta menganggarkan bilangan pasangan 'perkataan-tanda GK'. Aliran terakhir adalah penandaan Viterbi yang menggunakan hasil daripada latihan untuk menanda ayat baharu. Algoritma Viterbi diubahsuai untuk memasukkan kemudahan morfem imbuhan Bahasa Melayu, model abstraksi aksara berturut-turut serta model konteks perkataan untuk menangani perkataan anu. Korpus Bahasa Melayu tak bertanda yang mengandungi 995,240 perkataan digunakan untuk melatih kesemua model. Keupayaan penandaan diuji dengan membandingkan penandaan berkomputer dengan korpus beranotasi yang mengandungi 121,090 perkataan yang telah ditandai dengan empat puluh tanda GK. Berdasarkan keputusan eksperimen, gabungan penghampiran pelepasan melalui pemberian penalti dan abstraksi aksara berturut-turut menampakkan keputusan yang baik (82.16%). Penalti pelepasan dihampirkan melalui taburan margin berkadar tanda adalah sesuai untuk perkataan anu yang mengandungi morfem imbuhan. Sebaliknya, pelepasan dihampirkan melalui kebarangkalian bersyarat tanda diberi aksara berturut-turut daripada akhiran perkataan sesuai untuk perkataan anu yang tidak mengandungi morfem imbuhan. Walau bagaimanapun, dengan menggunakan model konteks perkataan untuk menghampirkan pelepasan, keupayaan penandaan keseluruhan mencapai 83.61%. Peratus ini disumbangkan oleh peningkatan yang ketara bagi penandaan perkataan yang tidak disenaraikan di dalam kamus dan juga perkataan kabur. Oleh itu, model konteks perkataan yang dicadangkan dalam MMT tak terselia telah menunjukkan kaedah yang baik dalam penandaan GK Bahasa Melayu.,Ph.D.
Pages: 245
Publisher: UKM, Bangi
Appears in Collections:Faculty of Information Science and Technology / Fakulti Teknologi dan Sains Maklumat

Files in This Item:
File SizeFormat 
ukmvital_80421+SOURCE1+SOURCE1.0.PDF
  Restricted Access
534.32 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.