Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/16053
Title: วิธีการเลือกฐานหลักสำหรับเทคนิคการลดมิติ
Other Titles: An approach to basis selection for dimensional reduction techniques
Authors: พีรธรรม วิริยธรรมภูมิ
Advisors: บุญเสริม กิจศิริกุล
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะวิศวกรรมศาสตร์
Advisor's Email: boonserm@cp.eng.chula.ac.th, Boonserm.K@chula.ac.th
Subjects: การลดมิติ (สถิติ)
การเรียนรู้ของเครื่อง
การรู้จำรูปแบบ
Issue Date: 2552
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: การลดมิติถือเป็นงานสำคัญในงานการเรียนรู้ของเครื่องและการรู้จำ เนื่องจากในปัจจุบันนี้เรามีความสามารถในการเก็บข้อมูลทุกๆ คุณลักษณะที่เราพอจะนึกถึงได้ ซึ่งนำไปสู่ข้อมูลขนาดใหญ่ที่มีคุณลักษณะมากเกินกว่าที่จะประมวลผลได้ เทคนิคการลดมิติช่วยลดความซ้ำซ้อน ระหว่างคุณลักษณะและช่วยขจัดความห่างมากในชุดข้อมูล การเลือกฐานหลักถือเป็นปัญหาเปิด ว่าเราจะสามารถลดมิติเพื่อให้ได้เซตย่อยของข้อมูลที่เหมาะที่สุดอย่างอัตโนมัติได้อย่างไร ในงานรู้จำบนชุดข้อมูลรูปภาพนั้น เทคนิคการลดมิติได้รับการพิสูจน์ว่าเป็นตัวประมวลผลก่อนที่สำคัญ เทคนิคแบบสองมิติและสองมิติสองทิศทาง เป็นส่วนขยายของเทคนิคการลดมิติสำหรับชุดข้อมูลรูปภาพโดยเฉพาะ เทคนิคแบบสองมิติและสองมิติสองทิศทางให้ค่าความแม่นที่สูงกว่า และมีปริมาณการคำนวณที่น้อยกว่าเมื่อเทียบกับเทคนิคดังเดิม เราได้โต้แย้งว่ากระบวนการเลือกฐานหลักในเทคนิคแบบสองมิตินัน ไม่เหมาะที่สุดและไม่ชัดเจนในเทคนิคแบบสองมิติสองทิศทาง เราได้นำเสนอเทคนิคตัวกรองแบบคะแนนเพื่อช่วยทำให้การเลือกฐานหลักเหมาะที่สุดโดยการทำให้เป็นบรรทัดฐานและจัดเรียงฐานหลักใหม่ที่ให้ผลเป็นค่าความแม่นที่สูงขึ้นในการจำแนก นอกจากนี้เรายังนำเสนอวิธีการเลือกฐานหลักใหม่ในเทคนิคแบบสองมิติสองทิศทางสองวิธี ได้แก่ วิธีใช้เทคนิคคัดเลือกคุณลักษณะแบบผสมและวิธีอัลกอริทึมเชิงละโมบที่ใช้ควบคู่กับการตัดออก ซึ่งทั้งสองวิธีนี้จะใช้ปริมาณการคำนวณน้อยกว่าวิธีดั้งเดิม ที่ใช้การตรวจสอบไขว้ทั้งหมด อีกทั้งยังให้ค่าความแม่นในการจำแนกสูงกว่าวิธีตัดออกโดยอ้างอิงค่าลักษณะเฉพาะ ที่มักจะติดในหุบเขาของปริภูมิค่าความแม่น เราได้ประยุกต์ใช้แนวคิดกับงานในโลกจริง ได้แก่ งานรู้จำใบหน้าและงานรู้จำลายมือ
Other Abstract: Dimensional reduction is an important task in machine learning and pattern recognition. Nowadays, we have gained an ability to collect every feature in our imaginable aspect which leads to massive data that have too many features to process. Dimensional reduction techniques reduce the redundancy among features and conquer the sparseness of the data set. Basis selection is an open problem of how much we should reduce the dimension to be an optimal dataset automatically. In pattern recognition tasks of image data sets, techniques for dimensional reduction have been proven to be an important preprocessing step. 2D and (2D)2 techniques are the extensions of Dimensional Reduction techniques tailored for image data sets. 2D and (2D)2 techniques provide more classification accuracy with less computational cost compared to original techniques. We argue that the step in basis selection of 2D techniques is not optimal and the method of basis selection is not obvious in (2D)2 techniques. We propose the score-based filter techniques to further optimize the basis selection by performing a normalizing and reordering step which results in higher classification accuracy. Moreover, we also introduce a novel basis selection method in (2D)2 techniques based on a greedy algorithm and score metrics which requires less computational cost compared to cross validation based techniques and provides more classification accuracy than eigenvalue-based cut-off techniques which stuck in the valley of accuracy space. We have applied our proposed method to several real world applications, face recognition and hand written recognition.
Description: วิทยานิพนธ์ (วศ.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2552
Degree Name: วิศวกรรมศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: วิศวกรรมคอมพิวเตอร์
URI: http://cuir.car.chula.ac.th/handle/123456789/16053
URI: http://doi.org/10.14457/CU.the.2009.2107
metadata.dc.identifier.DOI: 10.14457/CU.the.2009.2107
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
Peratham_Wi.pdf1.65 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.