DOI: 10.32702/2307-2105-2022.1.81
УДК: 330.4, 519.2
І. В. Мірошниченко, О. В. Крашеніннікова
Прогнозування вартості нерухомості є важливим економічним показником. Точний прогноз ціни на житло важливий для майбутніх власників будинків, забудовників, інвесторів, оцінювачів, податкових департаментів та інших учасників ринку нерухомості, таких як іпотечні кредитори та страховики. Тому наявність моделі прогнозування ціни на житло допомагає заповнити важливу інформаційну прогалину та підвищити ефективність ринку нерухомості.
Стаття присвячена застосуванню методів машинного навчання для побудови моделей прогнозування ціни на заміську нерухомість. Виконано критичний аналіз ринку житлової нерухомості України та визначено фактори, які впливають на формування ціни заміської нерухомості. Встановлено доцільність використання алгоритмів машинного навчання для прогнозування ціни на заміську нерухомість. Побудовано чотири моделі прогнозування ціни та визначено, що найбільшу ефективність має алгоритм XGBoost. Проведено порівняння результатів прогнозування алгоритму XGBoost та множинної лінійної регресії на основі випадково обраного будинку з вибірки. Визначено, що модель XGBoost краще описує дані і ймовірність спрогнозувати справжню ціну є вищою.
Ключові слова: ринок житлової нерухомості; ціна на заміську нерухомість; лінійна множинна модель; регуляризація; випадковий ліс; XGBoost; прогнозування.
I. Miroshnychenko, O. Krasheninnikova
The subject of structural analysis and active development of the real estate market is of great importance for the country's economy. For this reason, modeling and prediction of real estate prices are important and relevant areas of research. A practical and accurate model for predicting house prices would become a valuable tool for homeowners, developers, property investors, appraisers, mortgage lenders, insurers, tax agencies, and other players in the real estate market. Lately, machine learning techniques have become the primary source for advanced analysis, forecasting, and visualization of real estate prices. Therefore, having in place an accurate price prediction model helps fill in an important information gap and improve the efficiency of the real estate market.
The article focuses on the appropriate use of machine learning methods to build models for predicting suburban real estate prices. For this purpose, a critical analysis of Ukraine’s residential real estate market was carried out. The study found that Ukraine’s suburban real estate market revived against the backdrop of the COVID-19 pandemic and the lockdown in the spring of 2020, leading to an increase in property prices and the number of houses built. In addition, several factors affecting price formation for suburban real estate at the macro and micro levels were identified. It was found that the use of machine learning algorithms for predicting prices of suburban real estate is advisable. The following four price prediction models were built: multiple linear regression, regularization, random forest, and XGBoost. After checking the efficiency of the models on the test dataset and comparing the results with each other, it was determined that in terms of RMSE and MAPE, the XGBoost algorithm provides the most accurate and efficient method. A comparison was made between the predicted results of the XGBoost algorithm and the multiple linear regression algorithm based on a randomly selected house from the sample. It was found that the XGBoost model better describes the data and is more likely to accurately predict real-life prices.
The article summarizes the findings of the data analysis and testing and finds that the XGBoost model can effectively predict and analyze housing prices to a certain degree. At the same time, the accuracy and efficiency of the RE price modeling can be further improved by using more advanced machine learning techniques.
Keywords: esidential real estate market; suburban real estate price; multiple Linear Regression; regularization; random forest; XGBoost; forecasting.
№ 1 2022
Дата публікації: 2022-01-27
Кількість переглядів: 13270