Прогнозирование заработной платы в России

Данные о среднемесячной заработной платы в России, начиная с января 1993 года и заканчивая настоящим моментом, находятся в публичном доступе, например, по ссылке: http://sophist.hse.ru/exes/tables/WAG_M.htm

К этим данным можно применить инструменты анализа данных и построить, к примеру, прогноз на следующие 3 года.

В данном случае мы имеем дело с временным рядом, поэтому для построения прогноза можно применить модель ARIMA (https://ru.wikipedia.org/wiki/ARIMA), а точнее её модификацией, которую также можно встретить под названием SARIMAX и которая в том числе используется в подобного рода задачах.

Путем подбора была выбрана модель SARIMAX(1, 1, 0)x(1, 1, 1, 12), которая неплохо описывает имеющиеся данные.

salary-prediction_2

На рисунке синей линией показаны фактические данные среднемесячной заработной платы. Красной линией построен прогноз, который нам дает выбранная модель. По горизонтальной оси отложено время, по вертикальной — значение заработной платы в рублях.

    Для построения данного прогноза использовались:

  • язык программирования: Python 3.5.2;
  • удобная среда интерактивной разработки: Jupyter Notebook;
  • библиотеки для предобработки и анализа данных: pandas, scipy, statsmodels;
  • пакет для построения графиков: matplotlib.

Данный пример является лишь небольшой демонстрацией наших возможностей в сфере «анализа данных«.