Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/83297
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | Attapol Thamrongrattanarit | - |
dc.contributor.author | Sumana Sumanakul | - |
dc.contributor.other | Chulalongkorn University. Faculty of Arts | - |
dc.date.accessioned | 2023-08-04T08:20:37Z | - |
dc.date.available | 2023-08-04T08:20:37Z | - |
dc.date.issued | 2022 | - |
dc.identifier.uri | https://cuir.car.chula.ac.th/handle/123456789/83297 | - |
dc.description | Independent Study (M.A.)--Chulalongkorn University, 2022 | - |
dc.description.abstract | Zero pronoun resolution is an actively challenging NLP task in Thai. However, only a few previous studies have focused on this topic. Therefore, we explore a modern approach that could outperform existing state-of-the-art methods on various datasets and downstream tasks, the transformer-based, pre-trained language model, to apply to the Thai zero pronoun resolution task. We conduct two experiments on a small corpus, which are (1) using a pre-trained masked language model to predict zero pronominal expressions and (2) fine-tuning Wangchanberta on a token classification task to classify persons of pronouns. Based on our experiments, the results demonstrate the effectiveness of the pre-trained language model (1), which successfully encodes not only the grammatical features but also the system of Thai pronoun usage at the discourse level. | - |
dc.description.abstractalternative | การไขสรรพนามไร้รูปเป็นหนึ่งในงานที่ท้าทายในการประมวลผลภาษาธรรมชาติในภาษาไทย อย่างไรก็ตามงานศึกษาในหัวข้อดังกล่าวในทางภาษาศาสตร์คอมพิวเตอร์นั้นยังไม่เป็นที่แพร่หลายและยังไม่มีการนำข้อมูลภาษาไทยมาทดลองด้วยวิธีการใหม่ ๆ จากวิทยาการทางด้านนี้ ด้วยเหตุนี้ผู้วิจัยจึงสนใจประยุกต์แบบจำลองทางภาษาที่ผ่านการฝึกฝนมาแล้วจากสถาปัตยกรรมแบบทรานฟอร์เมอร์ ซึ่งเป็นวิธีใหม่ที่มีความแม่นยำสูงที่สุดในการทำงานประมวลผลภาษาธรรมชาติรูปแบบต่าง ๆ และยังสามารถใช้งานกับชุดข้อมูลที่หลากหลาย เพื่อมาใช้ในการไขสรรพนามไร้รูปภาษาไทย ผู้วิจัยทำการทดลองกับชุดข้อมูลขนาดเล็ก โดยออกแบบเป็น 2 การทดลอง คือ (1) ใช้แบบจำลองทางภาษาแบบพรางคำที่ผ่านการฝึกฝนมาแล้วเพื่อทำนายคำสรรพนามไร้รูป และ (2) ปรับแต่งการจำแนกคำในโมเดล Wangchanberta เพื่อให้จำแนกบุรุษของสรรพนามไร้รูป ผลลัพธ์จากการทดลองทั้งสองแสดงให้เห็นถึงประสิทธิภาพของแบบจำลองทางภาษาที่ผ่านการฝึกฝนมาแล้ว ที่ไม่เพียงแค่สามารถจับคุณลักษณะทางไวยากรณ์ของคำสรรพนามไร้รูปในภาษาไทยได้ แต่ยังสามารถเข้าใจระบบการเลือกใช้คำสรรพนามภาษาไทยในระดับปริจเฉทอีกด้วย | - |
dc.language.iso | en | - |
dc.publisher | Chulalongkorn University | - |
dc.relation.uri | http://doi.org/10.58837/CHULA.IS.2022.32 | - |
dc.rights | Chulalongkorn University | - |
dc.subject.classification | Arts and Humanities | - |
dc.subject.classification | Information and communication | - |
dc.subject.classification | Mother tongue | - |
dc.title | Resolving Thai zero pronoun using masked language model | - |
dc.title.alternative | ไขสรรพนามไร้รูปภาษาไทยโดยใช้แบบจำลองทางภาษาแบบพรางคำ | - |
dc.type | Independent Study | - |
dc.degree.name | Master of Arts | - |
dc.degree.level | Master's Degree | - |
dc.degree.discipline | Linguistics | - |
dc.degree.grantor | Chulalongkorn University | - |
dc.identifier.DOI | 10.58837/CHULA.IS.2022.32 | - |
Appears in Collections: | Arts - Independent Studies |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
6380049722.pdf | 869.63 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.