ỨNG DỤNG MÔ HÌNH TRÍ TUỆ NHÂN TẠO TRONG VIỆC LỰA CHỌN ĐẶC TRƯNG: CHỈ SỐ HIỆU SUẤT HỒI QUY VÀ CÁC YẾU TỐ KINH TẾ

0
225

Phạm Thị Anh Thư, Hồ Minh Trung, Trần Ngọc Bảo Trâm
Sinh viên K61 – Kinh tế đối ngoại
Trường Đại học Ngoại thương Cơ sở II, TP Hồ Chí Minh

Đặng Lê Quan
Giảng viên Cơ sở II
Trường Đại học Ngoại thương Cơ sở II, TP Hồ Chí Minh

Tóm tắt
Nghiên cứu này tập trung vào cách khai thác dữ liệu kinh tế thực tế để xác định các yếu tố kinh kế ảnh hưởng đến hiệu suất Logistics, được đo lường bằng chỉ số Hiệu suất Logistics (LPI). Phương pháp phân tích sử dụng các kỹ thuật học máy (ML) tiên tiến kết hợp với các phương pháp lựa chọn đặc trưng cho mô hình dự báo và hồi quy dựa trên các yếu tố kinh tế có liên quan. Mục tiêu chính là xác định bộ các yếu tố kinh tế tối ưu nhất để dự đoán hiệu suất logistics của một quốc gia. Ngoài ra, các thuât toán hồi quy khác cũng được nhóm tác giả thử nghiệm nhằm nâng cao độ chính xác của dự báo. Các kỹ thuật được lựa chọn bao gồm các phương pháp lọc dựa trên tương quan và phân tích thành phần chính (PCA), cùng với các phương pháp như hồi quy LASSO và Elastic-net. Các phương pháp khác như kiểm định ANOVA F-test, loại bỏ đặc trưng đệ quy (RFE) và phương pháp cây quyết định cũng được thử nghiệm nhưng cho ra kết quả ít ý nghĩa hơn so với PCA. Dựa trên các đặc trưng được chọn từ PCA, biến phụ thuộc (LPI) được dự đoán bằng các phương pháp hồi quy như mô hình Cây Quyết định, XGB Regressor, K-Nearest Neighbors, Hồi quy Rừng ngẫu nhiên, MLP (Multi-Layer Perceptron) và Hồi quy Máy Vectơ Hỗ trợ (SVM). Hiệu suất mô hình được đánh giá qua các chỉ số MAE, MAPE, RMSE, R² và R² điều chỉnh. Kết quả chỉ ra rằng bộ đặc trưng PCA và Elastic-net cung cấp hiệu suất đáng tin cậy nhất dựa trên các tiêu chí đo lỗi. Một chiến lược phù hợp nhất được áp dụng để tinh chỉnh lựa chọn kết hợp với các bộ đặc trưng mang lại kết quả tốt nhất. Các phát hiện cho thấy rằng các thuật toán học máy hỗ trợ hiệu quả trong việc lựa chọn các yếu tố kinh tế có liên quan nhất để đánh giá hiệu suất logistics của một quốc gia. Hơn nữa, nghiên cứu cũng chỉ ra rằng Rừng ngẫu nhiên là mô hình dự đoán hiệu quả nhất.
Keywords: Lựa chọn đặc trưng, hồi quy học máy, chỉ số Hiệu suất Logistics, thuộc tính kinh tế.

Abstract
This study highlights how to leverage real-time dynamic economic big data to identify key economic factors influencing logistics performance, as measured by the Logistics Performance Index (LPI). The analytical approach utilizes advanced machine learning (ML) techniques and feature selection methods for predictive modeling and regression using relevant economic attributes. The primary objective is to determine the optimal set of economic indicators that best predict a country’s logistics performance. Additionally, various ML regression algorithms are explored to enhance prediction accuracy. Feature selection techniques include correlation-based filter methods and principal component analysis (PCA), alongside embedded methods such as LASSO and Elastic-net regression. Other methods like the ANOVA F-test, Recursive Feature Elimination, and tree-based approaches are also tested but yield less significant results compared to PCA. Based on the selected PCA features, the dependent variable (LPI) is predicted using Decision Tree Regression, XGB Regressor, K-Nearest Neighbors, Random Forest Regressor, Multi-Layer Perceptron, and Support Vector Machine regressions. Model performance is assessed using MAE, MAPE, RMSE, R², and adjusted R² metrics. The results indicate that PCA and Elastic-net feature sets provide the most reliable performance based on error measurement criteria. A feature union and intersection strategy are applied to refine the selection, with the union of feature sets yielding the best outcomes. The findings suggest that ML algorithms effectively aid in selecting the most relevant economic factors for assessing a country’s logistics performance. Moreover, the study identifies Random Forests as the most effective prediction model.
Keywords: Feature selection, machine learning regression, Logistics Performance Index, economic attributes.

Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments