Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/6719
Title: การเปรียบเทียบเกณฑ์การคัดเลือกตัวแบบการถดถอยเชิงเส้นเมื่อตัวอย่างมีขนาดเล็ก
Other Titles: A comparison of model selection criteria on linear regression with small sample size
Authors: ภัทรสุดา สุดแสน
Advisors: ธีระพร วีระถาวร
Other author: จุฬาลงกรณ์มหาวิทยาลัย. คณะพาณิชยศาสตร์และการบัญชี
Advisor's Email: fcomtvr@acc.chula.ac.th
Subjects: การวิเคราะห์การถดถอย
Issue Date: 2548
Publisher: จุฬาลงกรณ์มหาวิทยาลัย
Abstract: เปรียบเทียบเกณฑ์การคัดเลือกตัวแบบการถดถอยเชิงเส้นเมื่อตัวอย่างมีขนาดเล็ก โดยจะเปรียบเทียบเกณฑ์การคัดเลือกตัวแบบการถดถอย 4 เกณฑ์ ได้แก่ เกณฑ์การคัดเลือกตัวแบบโดยใช้ข้อสนเทศของอาไคเคะที่ปรับแก้ (Corrected Akaike's Information Criterion (AlC[subscript c])) เกณฑ์การคัดเลือกตัวแบบโดยใช้ข้อสนเทศของชวาร์ซที่ปรับแก้ (Corrected Schwarz's Information Criterion (SIC[subscript c])) เกณฑ์การคัดเลือกตัวแบบ โดยใช้ข้อสนเทศของแฮนแนนและควินน์ที่ปรับแก้ (Corrected Hannan and Quinn's Information Criterion (HQ[subscript c])) และเกณฑ์การคัดเลือกตัวแบบโดยใช้ข้อสนเทศของคูลส์แบล็คที่ปรับแก้ (Corrected Kullback's Information Criterion (KIC[subscript c])) เกณฑ์การตัดสินใจคือค่าเฉลี่ยของค่าคลาดเคลื่อนกำลังสองเฉลี่ย (Average of Mean Squares Error (AMSE)) และใช้อัตราส่วนผลต่างของค่าเฉลี่ยของค่าคลาดเคลื่อนกำลังสองเฉลี่ย (Ratio of Different Average Mean Squares Error (RDAMSE)) เพื่อเปรียบเทียบประสิทธิภาพของเกณฑ์การคัดเลือกตัวแบบทั้ง 4 เกณฑ์ การแจกแจงของความคลาดเคลื่อนสุ่มที่ศึกษาคือ การแจกแจงแบบปกติที่มีค่าเฉลี่ย 0 และความแปรปรวนเป็น 1, 2, 4, 8 และ 16 ขนาดตัวอย่างที่ใช้คือ 12, 15, 18, 21, 24, 27 และ 30 และจำนวนตัวแปรอิสระในตัวแบบการถดถอยคือ 3, 5 และ 7 ตัวแปร ข้อมูลที่ใช้ในการวิจัยใช้โปรแกรมคอมพิวเตอร์จำลองด้วยเทคนิคมอนติคาร์โลกระทำซ้ำ 1,000 ครั้ง ในแต่ละสถานการณ์ ซึ่งผลการวิจัยสรุปได้ดังนี้ ปัจจัยที่มีผลต่อค่าเฉลี่ยของค่าคลาดเคลื่อนกำลังสองเฉลี่ย (AMSE) ของทุกเกณฑ์การคัดเลือกตัวแบบได้แก่ จำนวนตัวแปรอิสระ และความแปรปรวนของความคลาดเคลื่อนสุ่ม (sigma[superscript 2]) และขนาดตัวอย่าง ตามลำดับ โดยที่ AMSE แปรผันตามจำนวนตัวแปรอิสระและความแปรปรวนของความคลาดเคลื่อนสุ่ม (sigma[superscript 2]) แต่ AMSE แปรผกผันกับขนาดตัวอย่าง ปัจจัยดังกล่าวข้างต้นส่งผลกระทบกับเกณฑ์การคัดเลือกตัวแบบดังกรณีต่อไปนี้ 1. กรณีขนาดตัวอย่างเท่ากับ 12 ถึง 15 เกณฑ์การคัดเลือกตัวแบบที่ดีที่สุดคือ เกณฑ์ HQ[subscript c] รองลงมาคือ เกณฑ์ AlC[subscript c], SIC[subscript c] และ KIC[subscript c] ตามลำดับ สำหรับทุกระดับความแปรปรวนของความคลาดเคลื่อนสุ่มและจำนวนตัวแปรอิสระ 2. กรณีขนาดตัวอย่างเท่ากับ 18 เกณฑ์การคัดเลือกตัวแบบที่ดีที่สุดมีสองเกณฑ์คือ เกณฑ์ HQ[subscript c] และเกณฑ์ AlC[subscript c] และรองลงมาคือเกณฑ์ KIC[subscript c] และ SIC[subscript c] มีค่า AMSE ต่ำกว่า SIC[subscript c] เพียงเล็กน้อย สำหรับทุกระดับความแปรปรวนของความคลาดเคลื่อนสุ่มและจำนวนตัวแปรอิสระ 3. กรณีขนาดตัวอย่างเท่ากับ 21 ถึง 30 เกณฑ์การคัดเลือกตัวแบบที่ให้ค่า AMSE น้อยที่สุดคือ เกณฑ์ AIC[subscript c] รองลงมาคือ เกณฑ์ HQ[subscript c], KIC[subscript c] และ SIC[subscript c] ตามลำดับ สำหรับทุกระดับความแปรปรวนของความคลาดเคลื่อนสุ่มและจำนวนตัวแปรอิสระ เมื่อพิจารณาค่า RDAMSE พบว่า ประสิทธิภาพในการคัดเลือกตัวแบบของเกณฑ์การคัดเลือกตัวแบบจะแบ่งออกเป็นสองกลุ่มอย่างเห็นได้ชัด คือกลุ่มที่ 1 ได้แก่ เกณฑ์ HQ[subscript c] และเกณฑ์ AlC[subscript c] มีประสิทธิภาพใกล้เคียงกันและดีที่สุดสำหรับทุกขนาดตัวอย่างและความแปรปรวนของความคลาดเคลื่อนสุ่ม ส่วนกลุ่มที่ 2 ได้แก่ เกณฑ์ KlC[subscript c] และ SlC[subscript c] ซึ่งมีประสิทธิภาพใกล้เคียงกัน แต่แตกต่างและต่ำกว่ากลุ่มแรกสำหรับทุกขนาดตัวอย่างและความแปรปรวนของความคลาดเคลื่อนสุ่ม
Other Abstract: To compare model selection criteria for linear regression with small sample size. The four model selection criteria in this comparison are composed of Corrected Akaike's Information Criterion (AIC[subscript c]), Corrected Schwarz's Information Criterion (SIC[subscript c]), Corrected Hannan and Quinn's Information Criterion (HQ[subscript c]) and Corrected Kullback's Information Criterion (KIC[subscript c]). The criterion of comparison is the Average of Mean Squares Error (AMSE) using Ratio of Different Average Mean Squares Error (RDAMSE) to compare the efficiency of these model selection criteria. The distribution of random errors are normal distribution with zero mean and variances are 1, 2, 4, 8 and 16, respectively. The sample sizes used in this study are 12, 15, 18, 21, 24, 27 and 30, respectively. The number of independent variables in regression model are 3, 5 and 6, respectively. The data for this experiment are generated through the Monte Carlo simulation technique, repeating 1,000 times for each case. The results of this research are as follow : The factors that affected AMSE of all model selection criteria are the number of independent variables, the variance of random errors and sample size, respectively. The AMSE vary with, most to least, respectively, the number of independent variables and the variance of random errors but AMSE is converse to sample size. These factors affected model selection criteria as follow. 1. In case of sample size is 12 to 15. For all the number of independent variables and all variance of random errors, the HQ[subscript c] is the best, the AIC[subscript c], the SIC[subscript c] and the KIC[subscript c], respectively. 2. In case of sample size is 18ํ For all the number of independent variables and all variance of random errors, the HQ[subscript c] and the AIC[subscript c] are the best, the KIC[subscript c] and the SIC[subscript c], respectively. The KIC[subscript c] give AMSE slightly lower than the SIC[subscript c]. 3. In case of sample size is 21 to 30ํ For all the number of independent variables and all variance of random errors, the AIC[subscript c] is the best, the HQ[subscript c], the SIC[subscript c] and the KIC[subscript c], respectively. Furthermore, the four model selection criteria efficiency is separated into two groups by RDAMSE. The first group is composed of the HQ[subscript c] and the AIC[subscript c]. Their RDAMSE are close and they are the best for all cases. The second group is composed of the SIC[subscript c] and the KIC[subscript c]. Their RDAMSE are close but their RDAMSE are clearly different from the first group for all cases.
Description: วิทยานิพนธ์ (สต.ม.)--จุฬาลงกรณ์มหาวิทยาลัย, 2548
Degree Name: สถิติศาสตรมหาบัณฑิต
Degree Level: ปริญญาโท
Degree Discipline: สถิติ
URI: http://cuir.car.chula.ac.th/handle/123456789/6719
ISBN: 9741422601
Type: Thesis
Appears in Collections:Acctn - Theses

Files in This Item:
File Description SizeFormat 
Pattarasuda_Su.pdf1.25 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.