Price Prediction Using Machine Learning Methods on the European Market of Used Cars
Predikce cen ojetých automobilů na Evropském trhu s použitím metod strojového učení
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/182499Identifiers
Study Information System: 248526
Collections
- Kvalifikační práce [18349]
Author
Advisor
Referee
Vácha, Lukáš
Faculty / Institute
Faculty of Social Sciences
Discipline
Economics and Finance with specialisation in Financial Markets and Data Analysis
Department
Institute of Economic Studies
Date of defense
21. 6. 2023
Publisher
Univerzita Karlova, Fakulta sociálních vědLanguage
English
Grade
Excellent
Keywords (Czech)
strojové učení, ojetá auta, predikce cenyKeywords (English)
machine learning, used cars, price predictionTato diplomová práce poskytuje přesné predikce cen ojetých vozidel. Tato studie staví své základy na dostupných poznatcích a rozšiřuje akademickou literaturu svým zaměřením na evropský trh s ojetými automobily. Navíc je zde použito několik metod strojového učení a unikátní metoda sběru dat, díky kterým byla dosažena vysoká přesnost. Přesná predikce cen by měla být přínosná jak pro kupující, tak i pro prodávající. Měla by také zmírňovat neefek- tivity na trhu s ojetými automobily. Autor si není vědom žádné podobné práce se zaměřením na evropský trh ojetých automobilů. Aplikační programové rozhraní bylo využito pro sběr dat. Tímto způsobem byla získána obsáhlá datová sada tvořena 221 704 inzeráty ojetých automo- bilů. Tato datová sada byla následně použita jako vstup do několika ekonomet- rických modelů - mnohonásobné lineární regrese, regrese hlavních komponent, lasso regrese, rozhodovacího stromu, náhodných lesů a umělých neuronových sítí. Tato studie se pomocí několika statistických metrik pokouší najít model, který je schopný co nejpřesněji předpovědět zbytkovou cenu ojetého auta. Mezi tyto výkonnostní statistiky patří koeficient determinace, směrodatná odchylka chyb a střední absolutní odchylka. Tato studie je v souladu s dostupnou liter- aturou a z vybraných metod považuje techniku náhodných...
This master's thesis proposes accurate predictions of the prices of used cars. It builds its fundamentals on the available research and broadens the academic literature by applying several modern techniques to the European market. Us- ing machine learning models and unique data, high accuracy of predictions was obtained. The precise prediction of the residual value of a used car might benefit both the buyers and the sellers, and also reduce market inefficiencies. We are not aware of any similar work in the particular field focusing on the European market. An application programming interface (API) was exploited in order to col- lect the data. Therefore, a large set of data consisting of 221,704 used car classifieds was gathered and used in various models (MLR, PCR, LASSO, De- cision Tree, Random Forests, and ANNs). This study aims to find the most precise model for estimating the prices of used cars with the help of several performance statistics (R2, RMSE, and MAE). We support the available lit- erature as the random forest approach provided the highest accuracy when predicting the used car prices. A model using ANNs seemed to be the second best in terms of predictive performances, however, required comparably much more computing power. The effects of various attributes of used vehicles on their...