Modeling and prediction of age-specific mortality rates using the Lee–Carter model
- Authors: Borschuk E.L.1, Begun D.N.1, Bolodurina I.P.1,2, Menshikova L.I.3, Kolesnik S.V.2, Duisembaeva A.N.2
-
Affiliations:
- Orenburg State Medical University
- Orenburg State University
- Northern State Medical University
- Issue: Vol 31, No 1 (2024)
- Pages: 61-76
- Section: ORIGINAL STUDY ARTICLES
- Submitted: 20.10.2023
- Accepted: 09.07.2024
- Published: 13.09.2024
- URL: https://hum-ecol.ru/1728-0869/article/view/611099
- DOI: https://doi.org/10.17816/humeco611099
- ID: 611099
Cite item
Full Text
Abstract
BACKGROUND: High mortality remains one of the most significant health concerns in Russia. One of the priorities of the state policy is to reduce mortality rates among the working-age population and increase life expectancy. Predicting population mortality rates serves as a valuable tool for effectively allocating the available resources.
AIM: To perform mathematical modeling and prediction of mortality rates of the population of the Orenburg region using the Lee–Carter model.
MATERIAL AND METHODS: The age- and sex-specific mortality rates and the population size of the Orenburg region for the period 1991–2020 was used as a study base. The Lee–Carter method was applied to model and predict population mortality. By deriving key parameters, a random walk model with drift was developed, and an accuracy assessment was performed.
RESULTS: The Lee-Carter model has been utilized to analyze the mortality rates of the male population in the Orenburg region. Through this modeling process, an accuracy rate of 87% was achieved, providing a reliable basis for long-term prediction. Mortality forecasts have been generated up to the year 2035, allowing for a comprehensive evaluation of future trends in the region.
CONCLUSION: The analysis of the results indicates that the pandemic's impact on population mortality is expected to be short-term. In the upcoming years, the mortality rate of the male population in the Orenburg region is projected to continue decreasing.
Keywords
Full Text
ОБОСНОВАНИЕ
Высокий уровень смертности является основной демографической проблемой [1]. Сегодня наиболее остро стоит вопрос смертности населения трудоспособного возраста как экономически активной части общества [2], в результате преждевременной смертности которого экономика страны несёт колоссальные потери [3, 4]. При этом следует отметить, что большинство учёных, занимающихся данной тематикой, отмечают потери именно трудоспособной рабочей силы страны [5, 6].
Снижение уровня смертности населения — одна из главенствующих целей демографической политики России [7]. Достичь этого можно путём сокращения заболеваний системы кровообращения, новообразований, внешних причин, которые занимают лидирующие места в причинах смерти во всем мире и в Российской Федерации [8, 9].
Одним из основных показателей здоровья населения любого государства является ожидаемая продолжительность жизни [10] — интегральный показатель состояния здоровья населения и уровня социально-экономического развития, который активно используется как индикатор качества человеческих ресурсов.
Как известно, для расчёта данного показателя строятся таблицы смертности [11]. Если известны повозрастные коэффициенты смертности, то появляется возможность рассчитать вероятность дожития до определенного возраста — непосредственно её и экстраполируют на будущее, определяя среднюю ожидаемую продолжительность жизни для различных возрастных когорт.
Интерес к моделированию и прогнозированию показателя смертности населения обусловлен необходимостью её снижения для достижения более высоких показателей качества жизни и благосостояния [12], сохранения доли экономически активного населения и многими другими причинами, в том числе потребностью формирования механизмов снижения смертности [13]. Обострило проблему получения точных прогнозов смертности существенное старение населения в экономически развитых странах [14].
Таким образом, прогнозирование смертности в настоящее время является актуальной задачей. Для реализации мероприятий демографической политики в решении проблемы необходим мультидисциплинарный подход [15], позволяющий осуществлять аналитическую оценку и прогнозирование эффективности принимаемых решений для обоснования наиболее оптимальных мер как для краткосрочной, так и для более продолжительной перспективы [16]. Статистические модели позволяют разрабатывать рекомендации по рациональному перераспределению финансовых и других ресурсов для повышения эффективности и результативности оказания медицинской помощи [17]. Для эффективного решения задачи поэтапной трансформации системы оказания первичной медико-санитарной помощи были использованы методы математической статистики [18], что позволило разработать рекомендации по управлению изменениями в процессе перехода к новой модели медицинской организации [19]. Результаты моделирования показателей деятельности онкологической службы показали возможности прогнозирования числа случаев смерти от злокачественных новообразований, что позволяет более эффективно и рационально распределять бюджет на диагностику и лечение [20].
Наиболее интересной для прогнозирования возрастных коэффициентов смертности является модель, разработанная демографами Р.Д. Ли и Л.Р. Картером в 1992 г. для прогнозирования смертности в США [21]. Особенностью данной модели является учёт возрастной структуры населения. Преимущества модели Ли–Картера по сравнению с другими прогнозными моделями возрастной смертности состоят в её относительно простой конструкции и устойчивости. Модель включает минимум параметров, каждый из которых можно демографически интерпретировать. Для их оценки требуется сравнительно небольшое количество информации.
Цель исследования. Моделирование и прогноз показателей смертности населения Оренбургской области на основе модели Ли–Картера.
МАТЕРИАЛ И МЕТОДЫ
Данные численности населения по полу и возрасту взяты из базы территориального органа Федеральной службы государственной статистики по Оренбургской области. Из ежегодных сборников медицинского информационного-аналитического центра Оренбургской области выкопировали абсолютные данные о количестве смертей в 1991–2020 гг. по полу и по возрастам. На основе собранных данных рассчитали повозрастные коэффициенты смертности. К полученным значениям применяли метод Ли–Картера. Рассчитали параметры модели методом сингулярного разложения, в том числе индекс смертности населения Оренбургской области, представляющий собой временной ряд. Все вычисления и расчёты, в том числе проверку статистических гипотез, проводили с помощью библиотек языка программирования Python.
Для моделирования и прогнозирования индекса смертности применяли интегрированные модели авторегрессии — скользящего среднего (ARIMA-модели). ARIMA определяется тремя параметрами (p, d, q):
- p — порядок авторегрессии (AR), позволяющий включить предыдущие значения временнÓго ряда в модель;
- d — порядок интегрирования (I), отражающий количество шагов, требуемых для приведения ряда к стационарному виду;
- q — порядок скользящего среднего (MA), позволяющий учесть погрешность модели как линейную комбинацию наблюдавшихся ранее значений ошибок.
Проверку временнÓго ряда на стационарность осуществляли на основе анализа автокорреляционной и частной автокорреляционной функции, а также на основе расширенного теста Дики–Фуллера.
Подбор параметров ARIMA-модели производили на основе анализа автокорреляционной и частной корреляционной функции, качество модели оценивали с помощью информационных критериев Акаике, Шварца, Ханнана–Куина.
Адекватность выбранной модели оценивали на основе коэффициента детерминации. Коэффициент детерминации — доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью АРИМА:
Чем ближе эта доля к единице, тем лучше качество модели.
Точность прогнозирования оценивали на основе МАPE — средней абсолютной процентной ошибки:
В качестве исходных данных для построения модели использовали возрастные коэффициенты смертности за 1991–2020 гг. отдельно для мужского и женского населения Оренбургской области. Возрастные коэффициенты смертности представлены для 5-летних возрастных групп ( ): 0–4, 5–9, 10–14, 15–19, 20–24, 25–29, 30–34, 35–39, 40–44, 45–49, 50–54, 55–59, 60–64, 65–69, 70–74, 75–79, 80–84, 85–89, 90–94, 95–99, 100+ лет, их рассчитывали по формуле:
где — среднегодовая численность мужчин/женщин в возрастной группе x в году t (t = (1991, 2020)).
Dx,t — абсолютное число умерших мужчин/женщин в возрастной группе x в году t.
Для дальнейшего моделирования из вычисленных коэффициентов смертности составляли матрицу M, где каждая строка отражает определённую возрастную группу, а каждый столбец представляет годы исследования. Размер полученной матрицы составил 21×30.
К полученной матрице повозрастных коэффициентов смертности применяли метод Ли–Картера. Согласно методу, матрица подгоняется с помощью простой модели для описания изменений общей смертности как функции одного временнÓго параметра kt:
или ,
где mx,t — наблюдаемая повозрастная смертность в возрасте x в течение времени t, коэффициенты ax, bx, kt — параметры модели, εx,t — ошибки, имеющие нормальное распределение с нулевой средней и постоянной дисперсией. Интерпретация параметров довольно проста: ax — средние значения ln(mx,t) в возрасте x в течение времени t, bx представляет собой характер изменения смертности по возрасту, а индекс kt — тенденцию изменений смертности во времени.
Эта модель явно недоопределена, то есть bx и kt можно выбрать множеством способов. Так, один из этих двух элементов можно умножить на константу, а другой разделить на ту же константу без изменения прогнозируемых значений, заданных моделью. Мы использовали нормализующее ограничение на bx:
Для полной идентификации также необходимо потребовать
Параметры не могут быть найдены методами регрессии, так как в модели отсутствуют объясняющие переменные, в правой части уравнения у нас есть только оцениваемые параметры. Для решения этой проблемы расчёт параметров модели осуществляли при помощи метода сингулярного разложения (SVD).
Сингулярным разложением матрицы M порядка m×n является разложение следующего вида:
,
где Λ — матрица размера m×n с неотрицательными элементами, у которой элементы, лежащие на главной диагонали, — это сингулярные числа (все элементы не на главной диагонали являются нулевыми), а матрицы U (порядка m×m) и V (порядка n×n) — это две унитарные матрицы, состоящие из левых и правых сингулярных векторов соответственно, VT — это транспонированная матрица к V.
Метод SVD применяется для уменьшения размерности во многих практических задачах, где требуется приближать матрицу некоторой другой матрицей Mk с заранее заданным рангом k:
,
где матрицы Uk, Λk, Vk получаются из соответствующих матриц в сингулярном разложении матрицы M обрезанием до ровно k первых столбцов. Таким образом, приближая матрицу M матрицей меньшего ранга, мы выполняем своего рода сжатие информации, содержащейся в M: матрица M размера m×n заменяется меньшими матрицами размеров m×k и k×n и диагональной матрицей с k элементами. При этом сжатие происходит с потерями — в приближении сохраняется лишь наиболее существенная часть матрицы M. Применительно к нашей задаче метод сингулярного разложения записывается в виде:
,
где , .
Таким образом, мы приближаем матрицу смертности матрицей, представленной в виде произведения первого левого (первый столбец матрицы U) и первого правого (первая строка матрицы VT) сингулярных векторов, а в качестве Λ выбираем первое (наибольшее) сингулярное число λ1.
Расчёт сингулярного разложения производили с помощью функции linalg.svd(), входящей в состав библиотеки scipy языка программирования Phyton.
Для оценки точности подгонки вычисляли объяснённую дисперсию. Это отношение дисперсии различий между фактическими и подобранными показателями к дисперсии фактических показателей:
.
Для данных по Оренбургской области точность модели представлена в табл. 1.
Таблица 1. Точность построенной модели для возрастных коэффициентов смертности Оренбургской области с 1991 по 2020 г.
Table 1. Accuracy of the constructed model for age-specific mortality rates in the Orenburg region from 1991 to 2020
Возрастные группы Age groups | Объяснённая дисперсия σ, % The explained variance σ, % | |
Мужчины Males | Женщины Females | |
0–4 | 89,82 | 58,28 |
5–9 | 73,06 | 57,75 |
10–14 | 78,44 | 69,68 |
15–19 | 84,61 | 92,31 |
20–24 | 87,91 | 81,94 |
25–29 | 61,80 | 63,27 |
30–34 | 66,74 | 34,18 |
35–39 | 66,13 | 52,59 |
40–44 | 72,51 | 65,03 |
45–49 | 79,07 | 63,40 |
50–54 | 68,17 | 51,99 |
55–59 | 73,14 | 51,34 |
60–64 | 62,03 | 62,62 |
65–69 | 53,93 | 36,88 |
70–74 | 65,73 | 51,14 |
75-79 | 54,32 | 10,46 |
80–84 | 27,06 | 29,89 |
85–89 | 30,71 | 53,39 |
90–94 | 35,16 | 22,58 |
95–99 | 10,27 | 18,40 |
100+ | 33,13 | 23,13 |
Анализ остатков построенной ARIMA-модели осуществлялся на основе критерия Льюинга–Бокса на уровне значимости p=0,05.
В результате предварительного анализа исходных данных построили графики зависимостей коэффициентов смертности мужского и женского населения от времени и от возраста. На рис. 1 изображена динамика общих коэффициентов смертности для мужского и женского населения за 1991–2020 гг.
Рис. 1. Общие коэффициенты смертности мужского и женского населения Оренбургской области на 1000 населения.
Fig. 1. Mortality rates of the male and female population of the Orenburg region per 1000 population.
Анализ приведённых зависимостей позволил сделать вывод о том, что смертность населения региона имеет нестабильную динамику, обусловленную различными факторами. К примеру, распад СССР, экономический кризис и ухудшение показателей уровня и качества жизни привели к резкому росту смертности в 1993–1994 гг. С 2005 до 2020 г. в Оренбургской области наблюдалась тенденция к снижению смертности населения, причём снижение смертности мужского населения имело более выраженный характер. Темп снижения среди мужчин с 2005 по 2019 г. составил 22,0%, а среди женщин — 10,5%. Скачок смертности в 2020 г., отражённый на рис. 1, связан с начавшейся пандемией COVID-19, темп прироста среди мужчин в 2020 г., по сравнению с 2019 г., составил 19,5%, среди женщин — 28,5%.
РЕЗУЛЬТАТЫ
На рис. 2, 3 приведены зависимости коэффициентов смертности мужского и женского населения по различным возрастным группам для 2005, 2019 и 2020 гг. Анализ приведённых зависимостей показал, что смертность как мужского, так и женского населения снижалась до 2019 г. для всех возрастных групп. В 2020 г. смертность мужского населения превысила смертность 2019 г. для возрастных групп старше 25 лет, а женского населения — для возрастных групп старше 15 лет.
Рис. 2. Возрастные показатели смертности мужского населения Оренбургской области на 1000 населения.
Fig. 2. Age-specific mortality rates among males in the Orenburg region per 1000 population.
Рис. 3. Возрастные показатели смертности женского населения Оренбургской области на 1000 населения.
Fig. 3. Age-specific mortality rates among females in the Orenburg region per 1000 population.
Расчёт параметров модели осуществляли при помощи метода сингулярного разложения.
Результаты расчёта параметров модели представлены в табл. 2, 3.
Таблица 2. Параметры ax, bx для мужского и женского населения Оренбургской области для базисного периода 1991–2020 гг.
Table 2. Parameters ax, bx for male and female population of the Orenburg region for the baseline period of 1991–2020
Возрастные группы Age groups | Мужское население | Male population | Женское население | Female population | ||
ax | bx | ax | bx | |
0–4 | -5,83 | 0,11 | -6,10 | 0,16 |
5–9 | -7,77 | 0,10 | -8,19 | 0,18 |
10–14 | -7,64 | 0,09 | -8,26 | 0,25 |
15–19 | -6,45 | 0,09 | -7,32 | 0,32 |
20–24 | -5,73 | 0,11 | -7,00 | 0,25 |
25–29 | -5,32 | 0,06 | -6,62 | 0,06 |
30–34 | -4,97 | 0,03 | -6,28 | -0,06 |
35–39 | -4,74 | 0,01 | -5,98 | -0,03 |
40–44 | -4,48 | 0,02 | -5,73 | 0,04 |
45–49 | -4,21 | 0,04 | -5,40 | 0,09 |
50–54 | -3,91 | 0,04 | -5,05 | 0,03 |
55–59 | -3,64 | 0,03 | -4,63 | -0,05 |
60–64 | -3,25 | 0,03 | -4,20 | -0,05 |
65–69 | -2,92 | 0,03 | -3,84 | 0,09 |
70–74 | -2,60 | 0,03 | -3,30 | 0,16 |
75–79 | -2,27 | 0,02 | -2,85 | 0,01 |
80–84 | -1,92 | 0,01 | -2,28 | -0,05 |
85–89 | -1,55 | 0,02 | -1,77 | -0,14 |
90–94 | -1,17 | 0,02 | -1,32 | -0,10 |
95–99 | -0,87 | 0,02 | -0,85 | -0,06 |
100+ | -1,21 | 0,09 | -0,87 | -0,09 |
Таблица 3. Параметр kt для мужского и женского населения Оренбургской области
Table 3. Parameter kt for male and female population of the Orenburg region
Год | Year | 1991 | 1992 | 1993 | 1994 | 1995 | 1996 |
Мужчины | Males | 4,31 | 2,54 | 3,34 | 4,31 | 3,73 | 2,35 |
Женщины | Females | 2,04 | 1,99 | 2,41 | 2,30 | 2,52 | 2,75 |
Год | Year | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 |
Мужчины | Males | 2,47 | 3,75 | 3,22 | 2,00 | 4,49 | 3,14 |
Женщины | Females | 1,41 | 1,91 | 1,26 | 1,57 | 2,85 | 1,07 |
Год | Year | 2003 | 2004 | 2005 | 2006 | 2007 | 2008 |
Мужчины | Males | 2,86 | 2,05 | 2,39 | 0,20 | 0,52 | 1,61 |
Женщины | Females | 0,89 | 0,41 | 0,43 | 0,34 | 0,61 | -0,08 |
Год | Year | 2009 | 2010 | 2011 | 2012 | 2013 | 2014 |
Мужчины | Males | -0,24 | -0,74 | -1,99 | -2,29 | -1,47 | -3,06 |
Женщины | Females | -0,72 | -1,54 | -0,50 | -1,53 | -1,93 | -1,11 |
Год | Year | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 |
Мужчины | Males | -4,34 | -6,72 | -5,73 | -6,52 | -8,25 | -7,94 |
Женщины | Females | -2,68 | -3,08 | -2,12 | -4,24 | -3,43 | -3,80 |
Рассматривая соответствие для каждой возрастной группы отдельно, наблюдаем самую низкую точность для мужчин в возрастной группе 95–99 лет (10,27%), для женщин — 75–79 лет (10,46%). В целом точность модели составила 70,69% для мужчин и 51,91% для женщин.
Дальнейшее исследование было сфокусировано на мужской части населения, так как точность подгонки для женского населения оказалась недостаточной для дальнейшего прогнозирования.
Результаты расчёта параметров модели для мужского населения представлены графически на рис. 4–6.
Рис. 4. Значения параметра aₓ для базисного периода 1991–2020 гг.
Fig. 4. Values of the aₓ parameter for the baseline period 1991–2020.
Рис. 5. Значения параметра bₓ для базисного периода 1991–2020 гг.
Fig. 5. Values of the bₓ parameter for the baseline period 1991–2020.
Рис. 6. Значения параметра kt для базисного периода 1991–2020 гг.
Fig. 6. Values of the kt parameter for the base period 1991–2020.
Анализ зависимости на рис. 6 показал, что индекс смертности не подчиняется линейной зависимости, поэтому точность модели оказалась недостаточной. На рис. 6 показано уменьшение индекса смертности kt, начиная с 2001 г. Предположительно точность подгонки можно увеличить, сократив период наблюдений. Также большой вклад в точность подгонки внесло разбиение на возрастные группы.
Таблица 4. Ошибки модели для каждой возрастной группы
Table 4. Model errors for each age group
Возрастные группы Age groups | Сумма квадратов остатков по возрастам | Sum of squared residuals by age |
0–4 | 0,64 |
5–9 | 1,61 |
10–14 | 0,91 |
15–19 | 0,72 |
20–24 | 0,71 |
25–29 | 1,07 |
30–34 | 0,94 |
35–39 | 0,45 |
40–44 | 0,22 |
45–49 | 0,19 |
50–54 | 0,35 |
55–59 | 1,63 |
60-64 | 0,21 |
65–69 | 0,32 |
70–74 | 0,15 |
75–79 | 0,17 |
80–84 | 0,16 |
85–89 | 0,38 |
90–94 | 0,33 |
95–99 | 2,05 |
100+ | 7,85 |
Для увеличения точности подгонки последовательно отбросили возрастные группы и моменты наблюдения, которые внесли наиболее большой вклад в необъяснённую дисперсию модели.
Ниже приведены ошибки модели, определённые как сумма квадратов отклонений реальных и модельных данных отдельно для каждой возрастной группы и каждого года наблюдения. Они представлены в табл. 4, 5. Для увеличения точности подгонки удалим из периода наблюдений возрастные группы и года, соответствующие максимальной ошибке модели. В результате серии вычислительных экспериментов в качестве базисного периода выбран интервал с 1999 по 2020 г. Из возрастных групп исключили группы 0–4, 5–9, 10–14, 95–99, 100+, которые имеют слишком маленькую численность умерших, что приводит к статистической неточности и ошибкам в моделировании и прогнозировании.
Таблица 5. Ошибки модели для каждого наблюдаемого года
Table 5. Model errors for each observed year
Годы Years | Сумма квадратов остатков по годам Sum of squared residuals by year |
1991 | 2,20 |
1992 | 2,38 |
1993 | 0,38 |
1994 | 0,30 |
1995 | 0,31 |
1996 | 0,90 |
1997 | 1,11 |
1998 | 0,86 |
1999 | 0,33 |
2000 | 2,45 |
2001 | 0,43 |
2002 | 0,24 |
2003 | 0,39 |
2004 | 0,39 |
2005 | 0,47 |
2006 | 1,05 |
2007 | 0,40 |
2008 | 1,13 |
2009 | 0,26 |
2010 | 0,46 |
2011 | 0,57 |
2012 | 0,42 |
2013 | 0,76 |
2014 | 0,41 |
2015 | 0,24 |
2016 | 0,63 |
2017 | 0,30 |
2018 | 0,29 |
2019 | 0,35 |
2020 | 0,67 |
Точность подгонки построенной модели на выбранном периоде составила 87,21%.
Следующим этапом исследования является получение прогнозов показателей смертности. Прогнозирование, как правило, является основной целью моделирования показателей смертности. Главным преимуществом модели Ли–Картера является её простота для прогнозирования будущих значений показателей смертности и ожидаемой продолжительности жизни, поскольку значения коэффициентов ax и bx постоянны и не зависят от времени. Для этого необходимо построить экстраполяцию индекса смертности kt. Прогнозы возрастных коэффициентов смертности выводятся из прогнозов kt.
На практике для моделирования и прогнозирования коэффициента kt используют интегрированные модели авторегрессии — скользящего среднего ARIMA (p, d, q), модель АРПСС, модель Бокса–Дженкинса.
Перед применением ARIMA-модели необходимо провести предварительный анализ временнóго ряда, определить присутствие трендов, цикличности, сезонных колебаний и прочих особенностей, которые могут повлиять на результаты моделирования. По результатам анализа сделан вывод о нестационарности исходного ряда, что подтверждается расширенным тестом Дики–Фуллера (ADF=1,699, p=0,998). Однако после применения операции взятия первой разности ряд стал стационарным, что также отражено в расширенном тесте Дики–Фуллера (ADF=-6,908817, p <0,0001). Таким образом, определено, что параметр модели d должен быть равен 1, то есть динамика временнÓго ряда может быть описана моделью ARIMA (p, l, q).
Для подбора параметров модели p и q произвели визуальный анализ корреляционной и частной корреляционной функции. Коэффициенты корреляционной и частной автокорреляционной функции близки к нулю, p-уровень Q-статистики для первых трёх коэффициентов автокорреляционной функции: 0,26; 0,51; 0,64. Для более точного определения p и q выполнили перебор по сетке, качество модели оценили с помощью информационных критериев Акаике, Шварца и Ханнана–Куина. Наилучшей моделью с минимальными значениями критериев оказалась модель случайного блуждания ARIMA с параметрами p=0, d=1, q=0. В результате получена следующая модель случайного блуждания с дрейфом для описания индекса смертности:
где kt — индекс смертности в году t, εt — случайные возмущения.
Параметр дрейфа θ=-0,338 оказался значимым, его знак определяет убывание индекса смертности. Анализ остатков на основании критерия Льюнга–Бокса на уровне значимости 0,05 показал отсутствие автокорреляции (p >0,2). Анализ автокорреляционной и частной автокорреляционной функций и тест на нормальность остатков подтвердили их соответствие процессу белого шума, то есть в остатках отсутствуют зависимости, модель пригодна для прогнозирования. Применение модели случайного блуждания с дрейфом для индекса смертности оказалось эффективным и показало высокий уровень достоверности, так как коэффициент детерминации R2=0,951.
С использованием ARIMA-модели получили прогнозы индекса смертности (рис. 7).
Рис. 7. Прогноз индекса смертности до 2035 г.
Fig. 7. Forecast of the mortality index until 2035.
Для дальнейшей оценки качества модели прогнозирования произвели сравнение прогнозируемых коэффициентов смертности с реальными данными. Элементы таблиц смертности найдены по формулам:
,
где t =1999, 2020, x =15–19, 20–24, …, 90–94, ax, bx — постоянные во времени параметры модели Ли–Картера, kt = kt-1 – 0,338. Средняя абсолютная процентная ошибка на базисном периоде (t=1999, 2020): MAPE=6,1%.
На основе полученных прогнозов индекса смертности kt составили таблицы смертности мужского населения на 2022–2023 г.:
,
где t =2022, 2023, x =15–19, 20–24, …, 90–94.
На прогнозируемом периоде также рассчитали метрику MAPE: MAPE(2022)=5,6%, MAPE(2023)=4,9%.
Таким образом, предложенная модель случайного блуждания с дрейфом пригодна для среднесрочного прогнозирования смертности мужского населения.
ОБСУЖДЕНИЕ
Пандемия COVID-19 значительно повлияла на жизнь людей по всему миру. К сожалению, многие страны столкнулись с увеличением числа смертей и болезней. Несмотря на эти трудности, стоит отметить положительные моменты. Прогнозы индекса смертности показывают, что в ближайшие годы смертность среди мужского населения в Оренбургской области продолжит падать, несмотря на неблагоприятное влияние пандемии. Это свидетельствует о росте уровня медицинского обслуживания в регионе, а также о высоком уровне медицинской подготовки и профессионализме медицинских работников.
С использованием прогнозов индекса смертности можно составить таблицы смертности на несколько ближайших лет и сделать вывод о том, какие группы населения могут испытывать определённые проблемы со здоровьем. Также можно провести анализ и прогнозирование для определённых возрастных групп, что даст возможность проводить более целенаправленную работу по предоставлению определённой категории населения качественной медицинской помощи.
В статье J. Cerda-Hern'andez и соавт. проиллюстрирована эффективность применения модели Ли–Картера при моделировании показателей смертности в Перу. В качестве панели данных были использованы показатели смертности населения за 14-летний период, составлен прогноз смертности и ожидаемая продолжительность жизни изучаемого населения, однако доверительные границы захватывали большой интервал значений, что, возможно, связано с вариабельностью прогноза [21].
В статье M. Belliard и соавт. описаны результаты прогноза ожидаемой продолжительности жизни к 2050 г. с помощью модели Ли–Картера. Модель имела высокий прогностический потенциал, но при увеличении зоны анализа прогностический уровень отличался от фактического [22].
В ходе исследования были выявлены серьёзные ограничения. При увеличении исследуемого диапазона данных прогностическая ценность модели снижалась. В связи с этим некоторые возрастные группы были исключены. Кроме того, особенностью полученной модели явилось то, что при высоком темпе прироста показателя смертности в определённой возрастной группе также резко снижалась прогностическая ценность модели. Возможно, это связано с влиянием неизвестных факторов, которые оказывают воздействие на уровень смертности и на прогноз модели.
Кроме того, прогнозирование индекса смертности и составление на его основе таблиц смертности необходимо для определения средней ожидаемой продолжительности жизни в Оренбургской области. Будучи одним из наиболее важных показателей уровня жизни населения, средняя ожидаемая продолжительность жизни является важным критерием, для которого область может наметить различные социально-экономические цели и задачи. Таким образом, можно сделать вывод, что анализ показателей смертности имеет большое значение для определения приоритетов в работе медицинских учреждений, а также даёт возможность получить много полезной информации о здоровье и жизненном уровне населения области.
По результатам исследования может быть отмечено, что применение модели Ли–Катера для оценки данных по смертности не всегда является универсальным решением и может быть недостаточно точным. Так, модель Ли–Катера смогла описать только смертность мужского населения в Оренбургской области, но при этом описательная способность модели стала недостаточной для полного анализа данных. Возможно, проблема заключается в том, что базисный период, использованный для построения модели, был слишком коротким, поскольку метод изначально разработан и протестирован на данных о смертности населения США в течение столетия.
ЗАКЛЮЧЕНИЕ
Несмотря на вышеуказанные сложности, точность подгонки при моделировании смертности мужского населения Оренбургской области составила около 87%, что позволяет использовать этот результат для долгосрочного прогнозирования.
Наиболее подходящей ARIMA-моделью, описывающей полученный временной ряд — индекс смертности, оказалась модель случайного блуждания с дрейфом, что согласуется с результатами других авторов.
Исследование показало, что пандемия не оказывает долгосрочного влияния на смертность, поскольку, согласно полученным прогнозам, смертность мужского населения в Оренбургской области продолжит снижаться в ближайшие годы.
Дополнительная информация
Вклад авторов: Е.Л. Борщук — существенный вклад в концепцию и дизайн исследования, утверждение окончательного варианта статьи; Д.Н. Бегун — существенный вклад в концепцию исследования, утверждение окончательного варианта статьи; И.П. Болодурина — разработка концепции и дизайна исследования, подготовка окончательного варианта статьи; Л.И. Меньшикова — существенный вклад в концепцию исследования, окончательное утверждение присланной в редакцию рукописи; С.В. Колесник — обработка и интерпретация данных, моделирование, подготовка первичного варианта статьи; А.Н. Дуйсембаева — сбор статистических данных, подготовка первичного варианта статьи. Все авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией).
Финансирование. Авторы заявляют об отсутствии внешнего финансирования при проведении исследования.
Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.
Additional information
Authors’ contribution: E.L. Borshchuk — a significant contribution to the concept and design of the study, approval of the final version of the article; D.N. Begun — a significant contribution to the concept of the study, approval of the final version of the article; I.P. Bolodurina — development of the concept and design of the study, preparation of the final version of the article; L.I. Menshikova — a significant contribution to the concept of the study, final approval of the manuscript; S.V. Kolesnik — data processing and interpretation, modeling, preparation of the first draft; A.N. Duisembayeva — collection of statistical data, preparation of the first draft. All authors confirm that their authorship meets the international ICMJE criteria (all authors have made a significant contribution to the development of the concept, research and preparation of the article, read and approved the final version before publication).
Funding sources. No external funding.
Competing interests. The authors declare no conflicts of interest.
About the authors
Evgenii L. Borschuk
Orenburg State Medical University
Email: be@nm.ru
ORCID iD: 0000-0002-3617-5908
PhD, Professor, Head of the Department of Public Health and Healthcare No. 1
Russian Federation, 7 Park Ave., Orenburg, 460000Dmitrii N. Begun
Orenburg State Medical University
Email: be@nm.ru
ORCID iD: 0000-0002-8920-6675
SPIN-code: 8443-4400
MD, Dr. Sci. (Medicine), Professor of the Department of Public Health and Healthcare No. 1
Russian Federation, 7 Park Ave., Orenburg, 460000Irina P. Bolodurina
Orenburg State Medical University; Orenburg State University
Email: prmat@mail.osu.ru
ORCID iD: 0000-0003-0096-2587
SPIN-code: 4848-0669
Dr. Sci. (Engineering), Professor
Russian Federation, 7 Park Ave., Orenburg, 460000; OrenburgLarisa I. Menshikova
Northern State Medical University
Email: menshikova1807@gmail.com
ORCID iD: 0000-0002-1525-2003
SPIN-code: 9700-6736
MD, Dr. Sci. (Med.), Professor
Russian Federation, ArkhangelskSvetlana V. Kolesnik
Orenburg State University
Email: svkolesnik_osu@mail.ru
ORCID iD: 0009-0009-3008-0308
SPIN-code: 7548-3688
Russian Federation, Orenburg
Aislu N. Duisembaeva
Orenburg State University
Author for correspondence.
Email: k.kro1@yandex.ru
ORCID iD: 0000-0001-5762-4277
SPIN-code: 7164-7107
Scopus Author ID: 58149835100
Russian Federation, Orenburg
References
- Zemlyanova EV. Attitude of population and experts to the measures for reduction of mortality in Russia (literature review). Social Aspects of Population Health. 2013;(3):3. EDN: QINGER
- Bolotova EV, Samorodskaya IV, Dudnikova AV. The structure of mortality and potential years life lost from respiratory diseases of the population of economically active age (15–72 years) of the Russian Federation in 2019. Vrach (The Doctor). 2021;32(11):5–10. EDN: EHMGSS doi: 10.29296/25877305-2021-11-01
- Kozlova OA, Makarova MN, Tukhtarova EH, Belenkova TV. The labour conditions as a factor of the working age population mortality. Fundamental Research. 2015;(7-1):161–165. EDN: UDXTXB
- Nizamov IG, Sadykova TI. Health of economically active population as a basis of social-and-economical development of Russia and its regions. Public Health and Health Care. 2012;(4):28–33. EDN: PMSMIT
- Rodionova LA, Kopnova ED. Statistical approaches to analysis and modeling of seasonality in demographic data. Demographic Review. 2019;6(2):104–141. EDN: FJVXKS
- Denisenko MB, Varshavskaya EYa. Working life expectancy in Russia. Higher School of Economics Economic Journal. 2017;21(4):592–622. EDN: YLBIWS
- Ivanova AE, Kondrakova EV. Grounds for life expectancy projections in Russian regions up to 2025. Social Aspects of Population Health. 2008;(1):8. EDN: JVWSNB
- Lazarev AV, Kalininskaya AA, Vasilieva TP. Organizational reserves saving the population's health from diseases of the circulatory system. Problems of Social Hygiene, Public Health and History of Medicine. 2020;28(S):762–765. EDN: DGCWUU doi: 10.32687/0869-866X-2020-28-s1-762-765
- Temeshova NV. Implementation of the concept of demographic policy of the Russian Federation for the period till 2025 in 2016–2020. In: State and municipal administration in the Kamchatka territory: problems and solutions. Petropavlovsk-Kamchatsky; 2018. P. 70–78. EDN: YTTQTJ
- Soyan ShCh. Life expectancy as an indicator of the quality of life of the population. Natural Resources, Environment and Society. 2021;(3):42–46. EDN: KXIIUS doi: 10.24412/2658-4441-2021-3-42-46
- Lakman IA, Askarov RA, Prudnikov VB, et al. Predicting mortality by causes in the Republic of Bashkortostan using the Lee–Carter model. Problemy Prognozirovaniya. 2021;(5):124–138. EDN: ISEHRS doi: 10.47711/0868-6351-188-124-138
- Booth H. Demographic forecasting: 1980 to 2005 in review. International Journal of Forecasting, 2006;22(3):547–581. doi: 10.1016/j.ijforecast.2006.04.001
- Cancho-Candela R, Llano JMA, Ardura-Fernández J. Decline and loss of birth seasonality in Spain: analysis of 33,421,731 births over 60 years. Journal of Epidemiology & Community Health. 2007;61(8):713–718. doi: 10.1136/jech.2006.050211
- Lee RD, Carter LR. Modeling and forecasting U.S. mortality. Journal of the American Statistical Association. 1992;87(419):659–671. doi: 10.1080/01621459.1992.10475265
- Haberman S, Russolillo M. Lee–Carter mortality forecasting: application to the Italian population. 2005. Actuarial Research Paper No. 167.
- Khubaev G. Regression models for forecasting life period of population of administrative-territorial education: construction and evaluation of quality. Bulletin of Science and Practice. 2018;4(9):206–217. EDN: XZBZZR doi: 10.5281/zenodo.1418761
- Supraniuk SB, Toprak S. Forecast of mortality from cardiovascular and cerebrovascular diseases of working-age residents of the region. In: Current Issues of Scientific Knowledge. Kurgan; 2020, P. 255–261. EDN: DHZBVD
- Edeleva AN, Starodubov VI, Fedotkin MA, et al. Mathematical modeling in performance management of medical organizations providing inpatient care to the elderly. Social Aspects of Population Health. 2018;(2):2. EDN: XUFBWH
- Buleshov MA, Alipbekova SN, Tuktibayeva SA. Modern medical and social aspects of morbidity and mortality rates in the working age population. Bulletin of the Kazakh National Medical University. 2021;(1):285–288. EDN: TJDVBJ
- Zaitseva NV, Kiryanov DA, Kamaltdinov MR, et al. Health risks analysis and complex procedure for estimating the effectiveness of targeted activities performed within regional public healthcare systems and aimed at reducing mortality among the population caused by cardiovascular diseases and oncological diseases. Health Care of the Russian Federation. 2021;65(4):302–309. EDN: DVUUDG doi: 10.47470/0044-197X-2021-65-4-302-309
- Cerda-Hern'andez J, Sikov A. Lee-Carter method for forecasting mortality for Peruvian Population. 2018. Papers 1811.09622, arXiv.org.
- Belliard M, Williams I. Proyección estocástica de la mortalidad. Una aplicación de Lee-Carter en la Argentina. Revista Latinoamericana de Población. 2013;7(13):129–148.
Supplementary files
