English • На русском
Електронний журнал «Ефективна економіка» включено до переліку наукових фахових видань України з питань економіки (Категорія «Б», Наказ Міністерства освіти і науки України від 11.07.2019 № 975)
Ефективна економіка № 1, 2015
УДК 311.3:331.5
А. В. Хмелюк,
к. е. н., доцент, доцент кафедри обліку і аудиту,
Дніпродзержинський державний технічний університет, м. Дніпродзержинськ
СТАТИСТИЧНА ОЦІНКА РИНКУ ПРАЦІ В УКРАЇНІ: ВИОКРЕМЛЕННЯ РЕГІОНАЛЬНИХ ТАКСОНІВ
A. V. Khmelyuk,
Ph.D., assistant professor of accounting and auditing
Dneprodzerzhinsk State Technical University
STATISTICAL EVALUATION OF THE LABOUR MARKET IN UKRAINE: SELECTION OF HOMOGENEOUS REGIONAL CLUSTERS
Здійснено апріорний аналіз ринку праці в Україні. Виявлені динамічні зміни щодо рівня безробіття та потреби у працівниках, що призводять до загострення ситуації на ринку праці. Апробовано сукупності зайнятих, безробітних, працевлаштованих у регіональному розрізі на нормальність розподілу. Удосконалено методику статистичного аналізу ринку праці шляхом застосування кластерного аналізу та виокремлення якісно-однорідних таксонів з метою здійснення комплексної статистичної оцінки регіонального ринку праці в Україні
Priori analysis of the labour market in Ukraine has been carried out. Dynamic changes in unemployment level and need of workers, leading to a deterioration of the situation in the labour market have been revealed. Aggregation of the employed, the unemployed, the employed in the regions according to the normality of distribution have been tested. The technique of statistical analysis of the labour market through the use of cluster analysis and extraction of qualitative homogeneous clusters aimed to the realization of a comprehensive statistical evaluation of the regional labour market in Ukraine has been improved.
Ключові слова: ринок праці, статистичний аналіз, кластери, однорідні регіональні таксони.
Keywords: labour market, statistical analysis, clusters, homogeneous regional clusters.
І. Постановка проблеми. Піднесення національної свідомості населення України відбувається на фоні економічної кризи, яка зумовлена як світовими проявами так і внутрішніми конфліктами: анексія Криму та військові дії на сході України. Загострення економічної ситуації відбувається на фоні поглиблення диспропорцій між попитом і пропозицією робочої сили на ринку праці. Однією із основних характеристик ринку праці в Україні є збільшення рівня безробіття та зменшення потреби у працівниках. Так, рівень безробіття у 2014 році за даними вибіркового обстеження з питань економічної активності склав 9,3%, що на 1,6% більше ніж у попередньому році [1] і це враховуючи, що дані по Луганській та Донецькій областях мають уточнюватися. Попри досить суттєві динамічні зміни рівень безробіття в Україні є найнижчим, ніж у середньому по країнах Євросоюзу, зокрема, у Франції – 9,7%, Болгарії – 9,9%, Португалії – 11,0%, Угорщині – 11,2%, Греції – 12,0%, Ірландії – 13,5%, Словаччині – 14,5%, Естонії – 16,9%, Литві – 17,8%, Латвії – 19,3%, Іспанії – 20,1% [2].
За таких умов необхідно всебічне дослідження ситуації ринку праці в Україні з метою розробки стратегії щодо оздоровлення економіки та зниження соціальної напруги населення. Такий підхід потребує впровадження нових методологічних підходів, які мають ілюмінувати внутрішні регіональні диспропорції ринку праці та достовірно, а отже адекватно і точно відобразити ситуації на ринку праці в Україні.
II. Аналіз останніх досліджень і публікацій. Дослідження ринку праці, а також окремих аспектів його статистичної оцінки знайшло відображення у працях багатьох українських вчених таких як С.Бандури, З.Бараник, Л.Колешні, Е.Лібанової, В.Яценко, В.Приймака. Однак питання комплексного підходу методологічних засад виокремлення якісно однорідних регіональних таксонів потребують подальшого розвитку та вдосконалення.
ІІІ. Постановка завдання. Мета статті полягає в удосконаленні методики статистичної оцінки ринку праці в Україні шляхом виокремлення регіональних таксонів та утворення якісно однорідних зон щодо функціонування ринку праці.
ІV. Виклад основного матеріалу. Будь-яка статистична інформація, в тому числі і що до функціонування ринку праці створюється, передається і зберігається у вигляді показників (чисельність безробітних, зайнятих, потреба підприємств у працівниках, працевлаштування безробітних). Тому, вірогідність такої статистичної інформації залежить від того, наскільки об’єктивно статистичний показник відображає соціально-економічну суть явища чи процесу, що вивчається. Вірогідність статистичної інформації щодо показників ринку праці розкривається через адекватність і точність. Тому, досліджуючи сукупність безробітних, зайнятих, працевлаштованих у регіональному розрізі в першу чергу необхідно здійснити перевірку на нормальність розподілу. З цією метою було здійснено аналіз сукупностей щодо економічної активності на ринку праці за областями та Автономною Республікою Крим у 2013 році. Зауважимо, що джерелом даних є результати вибіркових обстежень з питань економічної активності населення за методологією МОП [1].
У нашому випадку мінливість сукупності населення з питань економічної активності за регіонами обумовлена впливом великого числа незалежних різних факторів, але результат повинен приблизно підкорятися закону нормального розподілу.
Нормальний розподіл являє собою одну з емпірично перевірених істин щодо загальної природи дійсності і його положення може розглядатися як один з фундаментальних законів природи [3, с.130]. Нормальний розподіл представляє собою дуже простий тип розподілу, оскільки він завжди приймає одну і ту ж форму. Її можна описати, вибравши як міру розсіювання показника стандартного відхилення. Для нормального розподілу характерні наступні співвідношення: крива розподілу симетрична відносно максимальної ординати, яка відповідає значенню середньої арифметичної ; 68% спостережень укладені в межах + 1 стандартне відхилення від середньої; 95% спостережень укладені в межах + 2 стандартних відхилень від середньої; 99,7% спостережень укладені в межах + 3 стандартних відхилень від середньої. Результати аналізу представлені на рис.1-4.
Рис. 1. Розподіл регіонів України за обсягом потреби у працівниках
Джерело: власні розрахунки автора за даними Держкомстату України [1]
Рис. 2. Розподіл регіонів України за чисельністю зайнятих
Джерело: власні розрахунки автора за даними Держкомстату України [1]
Рис. 3. Розподіл регіонів України за кількістю працевлаштованих зареєстрованих безробітних
Джерело: власні розрахунки автора за даними Держкомстату України [1]
Рис. 4. Розподіл регіонів України за кількістю безробітних
Джерело: власні розрахунки автора за даними Держкомстату України [1]
Побудову рядів розподілу регіонів України за чисельністю населення з питань економічної активності здійснено за допомогою пакету прикладних програм STATISTICA|W, а саме модуля описової статистики Detailed descriptive statistics [4].
Як наглядно ілюструють графіки, оцінка сукупностей з питань економічної активності за регіонами на однорідність та перевірка наближеності емпіричного розподілу до теоретичного є негативною. Аналіз показників центра розподілу свідчить про наявність асиметрії та ексцесу.
Зауважимо, що однієї із причин неоднорідності сукупностей з питань економічної активності за регіонами України є внутрішня їх розшарованість. Це зумовлено нерівномірністю розвитку окремих регіонів і своєрідністю умов, у яких вони функціонують, зокрема природних, технологічних тощо.
Таким чином, апріорний аналіз досліджуваних сукупностей показав, що вона є неоднорідною та не підпорядковується нормальному розподілу. Тому для отримання моделей, що дійсно будуть відображати якісно однорідні групи необхідно за допомогою багатомірних статистичних методів перегрупувати регіональний розподіл за чисельністю безробітних з встановленням певних якісно однорідних зон.
З метою отримання якісно однорідних сукупностей, пропонуємо використовувати кластерний аналіз. Кластерний аналіз належить до класу багатовимірних математичних і статистичних методів, які призначенні для формування відносно далеких одна від одної груп об’єктів і водночас близьких між собою на базі інформації про відстані або зв’язок (ступінь близькості) між ними [6, 77]. На відміну від комбінаційних групувань кластерний аналіз приводить до розбивки на групи з урахуванням усіх групувальних ознак одночасно. Необхідність розвитку методів кластерного аналізу і їхнього використання продиктована насамперед тим, що вони допомагають побудувати науково обґрунтовані класифікації, виявити внутрішні зв'язки між одиницями сукупності, що спостерігається.
Методи кластерного аналізу можна розділити на дві великі групи: агломеративні (об'єднуючі); дивізимні (поділяючі) [6]. Агломеративні методи послідовно поєднують окремі об'єкти в групи (кластери), а дивізимні методи розчленовують групи на окремі об'єкти.
У кластерному аналізі існують також методи, що важко віднести до першого чи до другої групи. Це стосується ітеративних методів, зокрема, метод k – середніх і метод пошуку згущень. Їхня характерна риса в тім, що кластери формуються виходячи з умов розбивки, що задаються, (параметрів), що у процесі роботи алгоритму можуть бути змінені користувачем для досягнення бажаної якісної розбивки. Інтеративні методи відносяться до швидкодіючих, що дозволяє використовувати їх для обробки великих масивів вихідної інформації.
Необхідно відмітити, що на відміну від агломеративних і дивізимних методів ітеративні алгоритми можуть привести до утворення пересічних кластерів, коли один об'єкт може одночасно належати декільком кластерам.
У кластерному аналізі використовується принцип утворення груп – політетичний підхід. Усі групувальні ознаки одночасно беруть участь в угрупуванні, тобто вони враховуються всі відразу при віднесенні спостереження в ту чи іншу групу. При цьому, як правило, не зазначені чіткі границі кожної групи, а також не відомо заздалегідь, скільки ж груп доцільно виділити в досліджуваній сукупності. Техніка кластерного аналізу базується на поняттях подібності об'єктів або подібності ознак, якщо в однорідні групи поєднуються ознаки. При відносній формалізації методів кластерного аналізу вони носять евристичний характер.
Для проведення класифікації регіонів України щодо економічної активності населення необхідно визначити подібні об'єкти за досліджуваними змінними. У кожен кластер (клас, таксон) повинні потрапити об'єкти, що мають подібні характеристики за наступними ознаками: чисельність безробітних; попит на робочу силу; чисельність зайнятих; чисельність працевлаштованих безробітних.
Техніка кластерного аналізу базується на поняттях подібності об'єктів або подібності ознак, якщо в однорідні групи поєднуються ознаки. При відносній формалізації методів кластерного аналізу вони носять евристичний характер.
Отже, кластерний аналіз передбачає регіональний розподіл сукупності безробітних та їх причинно-наслідкових факторів на однорідні групи. При цьому під сукупністю безробітних розуміють поєднання регіонів, що характеризуються набором m ознак. Для оцінки подібності елементів використовують три типи мір: коефіцієнти подібності; коефіцієнти зв'язку; показники відстані.
З метою характеристики ступеня взаємної віддаленості елементів та кластеризації регіонів для розрахунків використаємо показники відстані. Відстані між об’єктами, як правило оцінюється метрикою Евкліда. Так, для визначеності близькості пари точок у багатовимірному просторі використовують евклідову відстань – корінь квадратний із суми квадратів різниці значень однойменних показників для кожної пари об’єктів. Отже евклідова відстань між об’єктами і та j:
, (1)
де - значення к-го показника для і-го об’єкта.
Обчисливши відстані, дістаємо симетричну квадратну матрицю n x m. Вона є основою для реалізації методів кластерного аналізу. Так, на першому етапі групуються найближчі об’єкти, а потім більш віддалені один від одного. Тобто процедура побудови класифікації – це послідовність кроків, на кожному з яких об’єднуються дві найближчі групи об’єктів.
Мінімізація середньої відстані між кластерами, яка відбувається на кожному кроці, еквівалентна мінімізації деякого критерію “якості” класифікації, який оцінює ступінь однорідності кластерів, що формуються.
При використанні процедури кластерного аналізу з метою розподілу регіонів України на однорідні групи скористуємось алгоритмом “Ближнього сусіда ”- приєднується той об’єкт, значення відстані до якого найменша. Алгоритм формує ланцюгові кластери; вважається, проте, єдиним математично коректним, оскільки результати не залежать від переставлення рядків чи стовпчиків у матриці відстаней.
Таким чином, загальну схему агломеративної кластер-процедури на матриці відстаней можна представити як повторення трьох операцій: пошук мінімальної відстані між j –им і k – им кластерами; об’єднання j та k в один кластер і надання останньому спеціального індексу g ; розрахунок відстаней від сформованого кластера g до інших одиниць сукупності. Графічним вираженням процесу класифікації є дендрит, що у нашому випадку має досить складну структуру. На рис.5 представлено вертикальну дендрограму класифікації регіонів України.
Рис. 5. Дендрограма класифікації регіонів України за чисельністю безробітних, зайнятих, працевлаштованих та потребою у працівниках
Джерело: власні розрахунки автора за даними Держкомстату України [1]
Ознакова множина класифікації включає попит на робочу силу, вивільнення працівників, чисельність зайнятих та безробітних. На графіку чітко виділяються 2 кластери. В перший кластер ввійшли 7 регіонів (Автономна Республіка Крим, Луганська, Львівська, Запорізька, Одеська, Харківська, м.Київ), в другий – 17 регіонів (Вінницька, Волинська, Кіровоградська, Миколаївська, Житомирська, Закарпатська, Івано-Франківська, Київська, Херсонська, Хмельницька, Черкаська, Полтавська, Рівненська, Сумська, Тернопільська, Чернівецька, Чернігівська), і в 2 області (Дніпропетровська, Донецька) не ввійшли в жоден із формованих таксонів, тому ми об’єднаємо їх в окремий кластер. Таким чином, в результаті застосування алгоритму кластер – процедури маємо три регіональні кластери.
Після одержання варіантів розбивки регіональної сукупності що до економічної активності населення необхідно перевірити їх якість. З цією метою використаємо функціонал якості кластеризації. Відмітимо, що оптимальним вважається розбиття, яке забезпечить досягнення екстремуму вибраного функціоналу.
Функціонал якості одержаних кластерів розрахуємо за наступною формулою:
, (2)
де - функціонал якості R – кластерів;
i,j – 1,2,...,n.
Мета класифікації при даному функціоналі якості – одержання таких R кластерів, для яких величина була би мінімальною.
Розрахуємо функціонал якості для 3 –х кластерів регіонального розподілу сукупностей з питань економічної активності та довільно розбиття областей на 4 кластери. В результаті одержали:
Порівняння знайдених значень функціоналів якості розбиття показує, що Q(3)< Q(4), тобто з точки зору цільової функції слід віддати явну перевагу результатам багатомірної класифікації регіонів України з допомогою алгоритмів ієрархічної кластеризації та k – середніх.
На наступному, заключному етапі дослідження протестуємо результати з погляду надійності (значимості) виділених кластерів. Відзначимо, що таке тестування чи перевірка здійснюється на основі пропозицій щодо характеру розподілу досліджуваних ознак у гіпотетичній чи генеральній сукупності [5, с.145].
Таким чином, усі спостереження розглядаються як вибіркові незалежно від того, яким чином вони в дійсності були отримані. Тоді статистична значимість (істотність) розходження між виділеними групами тестується в такий спосіб: нульова гіпотеза базується на припущенні, що в генеральній сукупності групові центри ваги рівні між собою, тобто що об'єкти розглянутих груп витягнуті з однієї однорідної генеральної сукупності. Альтернативною гіпотезою в даному випадку виступає протилежна пропозиція, тобто що об'єкти даних груп у дійсності витягнуті з різних генеральних сукупностей.
У математичній статистиці доведено, що за умови справедливості нульової гіпотези величина (яка звичайно іменується статистичним критерієм чи просто статистикою) підкоряється розподілу Фішера (формула 3):
, (3)
де - відстань Махаланобіса між центрами тяжіння і-ї та j – ї груп;
- кількість об’єктів у відповідних групах.
Для тестування справедливості нульової гіпотези використаємо критерій - статистика Уілкса. У випадку, якщо = 0 – ідеальний випадок розбиття сукупності на групи. Слід зауважити, що в реальних соціально-економічних дослідженнях невеликі значення свідчать про успішне розбиття сукупності об’єктів на групи. Їм відповідають високі значення F – критерію та низькі величини імовірності помилково відхилити нульову гіпотезу H0, що тестується. У випадку, коли значення надто високі та низькі значення F – критерію, то необхідно визначити результати дослідження як помилкові, тобто було визначено раніше вихідну сукупність неоднорідною, коли насправді вона була однорідною.
Вище перераховані величини розрахуємо в системі STATISTICA, підмодулі “Дискримінантний аналіз” (Discriminant Analysis). Отже, в результаті здійснених розрахунків лямбда Уілкса 0,10834, значення пов’язаного з нею F – критерію 94,645, тобто розбиття сукупності на три кластери є обґрунтованим та надійним.
Висновки і перспективи подальших досліджень. В результаті проведеного дослідження визначено три якісно однорідних регіональних зони з питань економічної активності. Кластеризація регіонів України надасть змогу поглиблено вивчити прояви безробіття в регіональному розрізі; розробити заходи щодо пожвавлення тенденцій на ринку праці, виходячи із класифікацій регіональних зон; прогнозувати ситуацію на регіональному ринку праці.
Такий підхід сприятиме розробці ефективної програми сприяння зайнятості в регіонах, які в першу чергу потребують підтримки держави. Регіональні диспропорції між попитом і пропозицією на ринку праці мають стати необхідною інформаційною базою при розробці програм розвитку держави та адекватно відображувати реальні процеси щодо економічної активності населення України.
Література.
1. Сайт Державної служби статистики України [Електрон. ресурс]. – Режим доступу: http://www.ukrstat.gov.ua.
2. Волохова Л.Ф., Євсєєнко О.Ф.Статистичне оцінювання соціальної напруги на ринку праці в Україні// Вісник ОНУ імені І.І.Мечникова. 2013. – Т.18. – С.68-71.
3. Общая теория статистики: Учебник/ Т.В.Рябушкин, М.Р. Ефимова, И.И. Игнатова, Н.И. Яковлева. – М.: Финансы и статистика, 1981. -279с.
4. Боровиков В. STATISTICA. Искусство анализа данных на компьютере: для профессионалов. – 2-е изд. –СПб.: Питер, 2003. -688с.
5. Янковой А.Г. Многомерный анализ в системе STATISTICA. – Одеса: Оптимум, 2001. Вып.1. – 216 с.
6. Глинский В.В., Ионин В.Г. Статистический анализ. Учебное пособие. Издание 2-е, переработанное и дополненное – М.: Информационно-издательский дом «Филинъ», 1998. – 264с.
References.
1. The official site of the State Statistics Service of Ukraine, available at: http://vvv.ukrstat.gov.ua.
2. Volokhova L.F. and Yevsyeyenko O.F.(2013), “Statistical evaluation of social tension in the labor market in Ukraine”, Visnyk ONU I.I.Mechnikova, vol.18, pp.68-71.
3. T.V.Ryabushkin, MR Efimov, II Ignatov, NI Yakovlev (1981), Obshhaja teorija statistiki [General Theory of Statistics], Finansy i statistika, Moskva.
4. Borovikov V. (2003), STATISTICA [STATISTICA. Art of data analysis on the computer: for professionals]. 2nd ed, SPb Piter, Moskva.
5. Yankovoy A.G. (2001) Mnogomernyj analiz v sisteme STATISTICA [Multivariate analysis system STATISTICA], Optimum, Odesa, Ukraine.
6. Glinsky V.V., Ionin V.G. (1998), Statisticheskij analiz [Statistical analysis], 2nd ed, Informacionno-izdatel'skij dom «Filin"», Moskva.
Стаття надійшла до редакції 13.01.2015 р.