Please use this identifier to cite or link to this item:
https://cuir.car.chula.ac.th/handle/123456789/81551
Title: | Using graph evolutionary to retrieve related tweets |
Other Titles: | การใช้วิวัฒนาการของกราฟสำหรับสืบค้นข้อมูลทวิตเตอร์ |
Authors: | Patta Yovithaya |
Advisors: | Sukree Sinthupinyo |
Other author: | Chulalongkorn University. Faculty of Engineering |
Issue Date: | 2022 |
Publisher: | Chulalongkorn University |
Abstract: | Due to its popularity and daily active users, social media has become powerful and influential in the last decade. With the nature of a micro-blogging platform, instant messages and the latest short posts are sent throughout the network on Twitter. Therefore, most users utilize Twitter to update breaking news or the latest events. Since a huge volume of tweet messages have been published on Twitter, event evolution has also rapidly developed into related events within similar topics. In this study, we present a novel method to retrieve tweets that relate to a given query term. Not only perfectly matched tweets, but more related tweets will be retrieved. The collected tweet data are processed and constructed as an original network. With the benefits of social network analysis, a simplification-based summarization approach is applied to ignore information that has less importance while preserving significant information in the network based on centrality measurement and clustering coefficient. Using the evolutionary of graph-based representation extends the relationship diffusion to assist related information retrieval. Experiments were performed using Thai news datasets and the framework performance was evaluated by precision, recall, and f-score. The experimental results show that our framework outperformed the baseline methods which derived a similarity score based on the word-embedded vector to find relevant documents. |
Other Abstract: | เนื่องด้วยความนิยมและจำนวนผู้ใช้งานแต่ละวันทำให้โซเชียลมีเดียจึงมีอิทธิพลอย่างมากในช่วงทศวรรษที่ผ่านมา ด้วยลักษณะการใช้ข้อความโต้ตอบและบันทึกข้อความสั้น ๆ ผู้ใช้งานส่วนใหญ่จึงใช้ทวิตเตอร์เพื่ออัปเดตข่าวสารหรือเหตุการณ์ต่าง ๆ ที่เกิดขึ้นล่าสุด จากข้อความจำนวนมากที่ถูกส่งบนทวิตเตอร์ทำให้วิวัฒนาการของเหตุการณ์ใดเหตุการณ์หนึ่ง สามารถพัฒนาไปสู่เหตุการณ์ที่เกี่ยวข้องโดยที่เป็นหัวข้อเดียวกัน โดยงานวิจัยนี้ได้นำเสนอวิธีการใหม่ในการสืบค้นข้อมูลทวิตเตอร์ที่เกี่ยวข้องกับคำที่ใช้ค้นหา นอกจากข้อมูลทวิตเตอร์ที่คล้ายคลึงกันจะถูกสืบค้นแล้ว ข้อมูลทวิตเตอร์อื่น ๆ ที่เกี่ยวข้องจะถูกสืบค้นขึ้นมาด้วย งานวิจัยนี้ใช้วิธีการ Simplification Summarization เพื่อลดทอนข้อมูลที่มีความสำคัญน้อยและคงไว้เพียงข้อมูลที่มีความสำคัญมากในกราฟเครือข่าย โดยใช้มาตรวัดค่ากลางและค่าสัมประสิทธิ์จากทฤษฎีการวิเคราะห์กราฟเครือข่าย ในขณะที่การใช้วิวัฒนาการของกราฟสามารถช่วยแสดงการแพร่กระจายของความสัมพันธ์ของ ข้อมูลที่เกี่ยวข้อง การศึกษานี้นำข้อมูลจากทวิตเตอร์ของสำนักข่าวไทย เพื่อใช้วัดผลการสืบค้นข้อมูลที่เกี่ยวข้องและพบว่าการใช้วิวัฒนาการของกราฟสามารถสืบค้น ข้อมูลที่เกี่ยวข้องได้มากขึ้น เมื่อเทียบกับการใช้คะแนนความคล้ายคลึงเพื่อสืบค้นข้อมูล |
Description: | Thesis (M.Eng.)--Chulalongkorn University, 2022 |
Degree Name: | Master of Science |
Degree Level: | Master's Degree |
Degree Discipline: | Computer Science |
URI: | http://cuir.car.chula.ac.th/handle/123456789/81551 |
URI: | http://doi.org/10.58837/CHULA.THE.2022.102 |
metadata.dc.identifier.DOI: | 10.58837/CHULA.THE.2022.102 |
Type: | Thesis |
Appears in Collections: | Eng - Theses |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
6370220721.pdf | 1.55 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.