Please use this identifier to cite or link to this item: https://cuir.car.chula.ac.th/handle/123456789/83174
Title: Analyzing impact of economic indicators on Vietnam stock market with machine learning techniques
Other Titles: การวิเคราะห์ผลของตัวบ่งชี้ทางเศรษฐศาสตร์ต่อตลาดหลักทรัพย์เวียดนามด้วยเทคนิคการเรียนรู้ของเครื่อง
Authors: Nuttawan Sangsawai
Advisors: Daricha Sutivong
Other author: Chulalongkorn University. Faculty of Engineering
Issue Date: 2022
Publisher: Chulalongkorn University
Abstract: The study provides an analysis of the Vietnamese stock market using statistical and machine learning models. The dataset shows that all features have a positive linear relationship with the VN Index, but exhibit different scales and degrees of skewness. The Augmented Dickey-Fuller (ADF) unit root test was conducted to identify whether the variables were stationary or non-stationary, and most variables were transformed into stationary data through first differencing. The OLS method was used to construct a short run model, and the results indicated that only three variables, namely CPI, exchange rate, and S&P500 index, exhibited statistical significance. The ARDL Bound test was conducted, and the results indicated that there is a long-run relationship between the variables under consideration, and the results indicated that only three variables, namely CPI, GDP, and S&P500 index, exhibited statistical significance. The decision tree, random forest, and XGBoost models were used to study short and long run relationships. The findings suggest that the random forest model performed the best in the short run, while the XGBoost model performed the best in the long run. The three statistically significant variables of both OLS and ARDL were ranked as the top-three influential variables on Random Forest and XGBoost, respectively.
Other Abstract: การศึกษานี้วิเคราะห์ตลาดหลักทรัพย์เวียดนามโดยใช้ตัวแบบทางสถิติและการเรียนรู้ของเครื่อง ชุดข้อมูลแสดงให้เห็นว่าคุณลักษณะของข้อมูลทั้งหมดมีความสัมพันธ์เชิงเส้นในทางบวกกับดัชนี VN-Index และชุดข้อมูลทั้งหมดมีขนาด หน่วย และระดับความเบ้ที่แตกต่างกัน จากการทดสอบรากหน่วย Augmented Dickey-Fuller (ADF) เพื่อดูว่าตัวแปรมีลักษณะนิ่งหรือไม่ พบว่าตัวแปรส่วนใหญ่ถูกแปลงเป็นข้อมูลลักษณะนิ่งหลังผ่านความแตกต่างครั้งแรก จึงเลือกใช้วิธี OLS เพื่อสร้างโมเดลหาความสัมพันธ์ระยะสั้นและผลการวิเคราะห์แสดงว่ามีเพียงสามตัวแปรคือ ดัชนีราคาผู้บริโภค (CPI), อัตราแลกเปลี่ยน และดัชนี S&P500 ที่มีนัยยะสำคัญทางสถิติ นอกจากนี้ยังได้ดำเนินการทดสอบ ARDL Bound Test และผลการวิเคราะห์แสดงให้เห็นว่ามีความสัมพันธ์ระยะยาวระหว่างตัวแปรที่พิจารณาและแสดงว่ามีเพียงสามตัวแปรคือ ดัชนีราคาผู้บริโภค (CPI), ผลิตภัณฑ์มวลรวมในประเทศ (GDP) และดัชนี S&P500 ที่มีนัยยะสำคัญทางสถิติ ในส่วนของตัวแบบจากการเรียนรู้ของเครื่อง โดยใช้ตัวแบบ Decision tree, Random forest และ XGBoost เพื่อประเมินความสัมพันธ์ระยะสั้นและระยะยาว ผลการวิเคราะห์แสดงให้เห็นว่าตัวแบบ Random forest มีความถูกต้องมากที่สุดในตัวแบบระยะสั้น ในขณะที่ตัวแบบ XGBoost มีความถูกต้องที่สุดในตัวแบบระยะยาว โดยตัวแปรที่มีนัยสำคัญทางสถิติทั้งสามของทั้งจากวิธี OLS และ ARDL ได้รับการจัดอันดับให้เป็นตัวแปรที่มีอิทธิพลสูงสุดสามอันดับแรกใน Random Forest และ XGBoost ตามลำดับ
Description: Thesis (M.Eng.)--Chulalongkorn University, 2022
Degree Name: Master of Engineering
Degree Level: Master's Degree
Degree Discipline: Industrial Engineering
URI: https://cuir.car.chula.ac.th/handle/123456789/83174
URI: http://doi.org/10.58837/CHULA.THE.2022.194
metadata.dc.identifier.DOI: 10.58837/CHULA.THE.2022.194
Type: Thesis
Appears in Collections:Eng - Theses

Files in This Item:
File Description SizeFormat 
6470339921.pdf1.57 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.