2.4. Поиск закона распределения продолжительности жизни
Один из подходов к изучению природы индивидуальных различий по срокам жизни состоит в анализе особенностей наблюдаемых распределений по этому признаку. Такая задача может решаться двумя способами: либо путем проверки уже готовых теорий и моделей на соответствие фактическим данным, либо путем обработки результатов наблюдений с последующим обобщением обнаруженных закономерностей. Первый путь является стандартным для большинства точных наук, и его методы хорошо отработаны. Второй же путь предполагает развитую интуицию у исследователя и глубокое знание специфики проблемы. И прежде всего возникает вопрос, какой именно показатель, характеризующий распределение продолжительности жизни, следует положить в основу подобных исследований.
Проблема выбора "правильного"показателя. Как известно, таблица продолжительности жизни содержит ряд показателей, важнейшими из которых являются:- - вероятность дожития до возраста x (обычно умноженная на 100 000)*, - число умерших в возрастном интервале от - вероятность смерти в этом же возрастном интервале - средняя продолжительность предстоящей жизни в возрасте x. Итак, для каждого возраста имеются четыре показателя. Возникает вопрос: какой же из них следует выбрать для дальнейшей работы? На первый взгляд подобный вопрос может показаться праздным, поскольку каждый из этих показателей содержит одну и ту же информацию. Пересчет элементов одного столбца в элементы другого - не более чем арифметическое упражнение. Следовательно, эти четыре показателя отражают четыре разных формы записи одной и той же информации. Однако для целей нашего исследования эти показатели оказываются неравноценными. Действительно, из всех повозрастных показателей следует отдать предпочтение такому, который отражал бы события, происходящие только в изучаемой возрастной группе, и не менялся бы с неизбежностью при произвольном изменении смертности в других возрастах. Так, например, избиение младенцев царем Иродом неизбежно изменило бы все повозрастные значения двух первых показателей таблицы продолжительности жизни даже если бы смертность всех остальных возрастных групп населения оставалась неизменной. С другой стороны, умерщвление стариков, практиковавшееся в некоторых диких племенах и древних обществах [см.: Россет, 1981], должно было приводить к снижению значений продолжительности предстоящей жизни () для всех возрастных групп населения. Таким образом, из четырех показателей таблицы смертности только один - вероятность смерти () - является элементарным в том смысле, что его величина может отражать ситуацию, специфичную только для изучаемой возрастной группы. Поэтому разумно отдать предпочтение именно этому показателю, так как его величина определяется наименьшим числом факторов, что принципиально важно при поиске законов смертности.
* (В таблицах выживания лабораторных животных иногда просто указывают число особей, доживающих до данного возраста.)
Вместе с тем вероятность смерти - это не самый удобный для анализа показатель. Прежде всего значения вероятности смерти зависят от величины возрастного интервала (), для которого они рассчитаны. В случае человека такой расчет проводится обычно для возрастных интервалов в 1 год или в 5 лет. Пересчет значений вероятности смерти с одного возрастного интервала на другой с целью сопоставления данных должен проводиться в соответствии с алгеброй теории вероятностей, а не путем простого умножения или деления чисел. Таким образом, при расчетах с использованием вероятности смерти приходится постоянно контролировать соответствие выкладок алгебре теории вероятностей. При этом постоянно возникает проблема выбора возрастного интервала. Рассматривая эту проблему Э. Ле Бра приводит следующий пример [Le Bras, 1976]. Если допустить, что вероятность смерти, рассчитанная для однолетнего возрастного интервала, растет с возрастом по закону геометрической прогрессии (закон Гомперца), то оказывается, что вероятность смерти, рассчитанная для любого другого возрастного интервала, этому закону следовать уже не может. В этом нетрудно убедиться на примере основанной на теории вероятностей формулы расчета вероятности смерти для пятилетнего возрастного интервала по значениям вероятности смерти для однолетних возрастных интервалов:
где - вероятность смерти в течение года в возрасте , а - соответствующая вероятность для пятилетнего возрастного интервала. Проведя расчеты по этой формуле, Ле Бра показал, что даже в том случае, когда вероятность смерти в течение года растет с возрастом строго по закону Гомперца, вероятность, рассчитанная для 5-летнего возрастного интервала, растет с возрастом уже значительно медленнее, чем это предсказывает данный закон. Итак, получается, что вид возрастной зависимости вероятности смерти определяется выбором возрастного интервала. Между тем у нас нет никаких принципиальных оснований предпочитать один возрастной интервал другому как более правильный.
Наконец, поскольку вероятность смерти не может быть больше единицы, использование шкалы вероятностей в области больших значений смертности может привести к ошибочным выводам. Действительно, изучая рост вероятности смерти с возрастом, мы почти с неизбежностью обнаружим снижение темпов роста этого показателя, по мере того как он будет приближаться к своему верхнему пределу. Поскольку последний всегда равен единице, мы также "обнаружим" стирание различий в смертности сравниваемых популяций. Ясно, однако, что подобные "открытия" отражают природу не явления, а природу показателя.
Поэтому, вместо вероятности смерти, которая не может быть больше единицы, лучше использовать показатель интенсивности смертности (синонимы: сила смертности, удельная скорость смертности), который не ограничен сверху. Эта величина определяется следующим образом.
Для оценки интенсивности смертности в возрасте x можно использовать формулу, предложенную Сэчером [Sacher, 1956; 1966]:
Этой формулой можно пользоваться при достаточно малых интервалах . когда изменением интенсивности смертности на столь малом интервале можно пренебречь или считать это изменение близким к линейному.
Имеются и другие способы оценки интенсивности смертности. Так, при статистическом анализе выживаемости часто используют оценку, предложенную Катлером и Эдерером [Cutler, Ederer, 1958].
Гехан и Сиддики [Gehan, Siddiqui, 1973], используя метод Монте-Карло, пришли к выводу, что оценка Катлера и Эдерера предпочтительнее оценки Сэчера, поскольку она дает меньшее смещение. Впоследствии этот вывод стал широко цитироваться и послужил основанием для преимущественного использования оценки Катлера и Эдерера в большинстве публикаций и даже в пакетах прикладных программ (например, в пакете BMDP), посвященных анализу выживаемости. Однако если внимательно проанализировать работу [Gehan, Siddiqui, 1973], то можно обнаружить, что оценка интенсивности смертности, которую они называли оценкой Сэчера. на самом деле не совпадает с приведенной выше формулой, предложенной им в своей работе [Sacher, 1956], а имеет следующий вид:
Нетрудно заметить, что для стареющих систем с монотонно возрастающей интенсивностью смертности данная оценка, приписываемая Сэчеру, всегда будет приводить к смещенным (заниженным) оценкам интенсивности смертности, поскольку эта оценка относится не к середине возрастного интервала, как в случае истинной оценки Сэчера, а к началу возрастного интервала. Таким образом, и без метода Монте-Карло очевидно, что проверяемая Геханом и Сиддики формула будет давать смещенные оценки интенсивности смертности. Однако вопрос о том, какая же оценка лучше - истинная оценка Сэчера или оценка Катлера и Эдерера, остается открытым. Если же сравнивать эти оценки по их применимости в области больших значений интенсивности смертности, то становится очевидным, что оценка, предложенная Сэчером. намного лучше оценки Катлера и Эдерера. Действительно, оценка Катлера и Эдерера имеет тот недостаток, что она в принципе не может превышать величину, равную 2/, в то время как сама интенсивность смертности априори может расти неограниченно. Поэтому есть все основания при анализе интенсивности смертности пользоваться формулой Сэчера [Sacher, 1956], что и было сделано в данной книге.
Интенсивность смертности, так же как и вероятность смерти, отражает смертность лишь в изучаемой возрастной группе и не меняется с неизбежностью при произвольном изменении смертности в других возрастах. Однако в отличие от вероятности смерти интенсивность смертности не зависит от величины возрастного интервала, а расчеты с использованием этого показателя необычайно просты и не требуют применения алгебры теории вероятностей. Поскольку интенсивность смертности в отличие от вероятности смерти в принципе может принимать сколь угодно большие значения, этот показатель хорошо отражает динамику высокой смертности в старческом и младенческом возрастах. Наконец, следует отметить, что интенсивность смертности определяется совершенно так же, как интенсивность отказов в математической теории надежности. Поэтому использование данного показателя значительно облегчает применение идей и методов теории надежности при построении и проверке математических моделей смертности. Все это делает интенсивность смертности наиболее удачным и "правильным" показателем при поиске законов распределения продолжительности жизни.
Краткий обзор функций, описывающих распределение продолжительности жизни. Анализ работ, посвященных поиску "законов" смертности и продолжительности жизни, подтверждает, что именно интенсивность смертности обычно выбирается в качестве изучаемого показателя.
Одна из первых и наиболее удачных попыток математически выразить зависимость смертности от возраста была предпринята английским актуарием (специалистом по страхованию жизни) Б. Гомперцем еще в 1825 г. [Gompertz, 1825]:
где - интенсивность смертности в возрасте - число доживающих до возраста - параметры уравнения. Эта формула, описывающая смертность людей старше 20 лет, была названа законом Гомперца, а ее параметры - параметрами Гомперца. Впоследствии этот закон стал широко использоваться для описания смертности лабораторных животных.
Гомперц предложил следующее теоретическое обоснование этой эмпирической закономерности. Допустим, что скорость уменьшения "сопротивляемости смерти" пропорциональна самой сопротивляемости. Поскольку интенсивность смертности служит мерой человеческой подверженности смерти, Гомперц принял в качестве меры сопротивляемости обратную ей величину получив уравнение.
где α - неотрицательный параметр. После интегрирования и упрощения этого уравнения получается формула (10).
В своей работе Гомперц отмечал, что наряду со смертностью, экспоненциально растущей с возрастом, может существовать и компонента смертности, от возраста не зависящая. Возможно, что смерть может быть следствием двух сосуществующих причин: одна из них случайная без предшествующей предрасположенности к смерти или износу; другая - износ или повышенная неспособность противостоять деструкции [Gompertz, 1825]. Однако при анализе имевшихся тогда таблиц смертности Гомперц счет возможным ограничиться лишь экспоненциальной составляющей смертности. Лишь через 35 лет, в 1860 г., другой актуарий - У. Мей кем добавил в формулу Гомперца это не зависящее от возраста слагаемое [Makeham, 1860]. Данное слагаемое (обозначаемое обычно буквой А) получило название параметра Мейкема. Таким образом, появилась формула, известная сейчас как закон Гомперца-Мейкема:
В дальнейшем было предпринято много попыток модификации закона Гомперца. Так в некоторых работах использовалась квадратичная форма уравнения [El Shaarawi et al., 1974; Мамаев, Наджарян, 1987]:
Риссер предложил вместо квадратичной зависимости использовать полином [см.: Le Bras, 1976]:
Сам Мейкем впоследствии дополнил формулу Гомперца-Мейкема слагаемым, линейно зависящим от возраста [см.: Henderson, 1915]:
Другая модификация формулы Гомперца-Мейкема выглядит следующим образом [см.: Henderson, 1915].
Иной путь усложнения функции Гомперца состоит в использовании так называемых логистических уравнений. Наиболее известным из них является уравнение Перкса [Perks, 1932]:
Интересно отметить, что данная формула может быть теоретически выведена как один из частных случаев модели цепного лавинообразного разрушения организма при старении [Гаврилов. 1987; см. также раздел 6.4 данной книги]. Бирд [Beard, 1959] предложил более простой вариант формулы Перкса:
Принципиально иной тип распределения был предложен Вейбуллом для описания вариабельности по "срокам жизни" технических систем [Weibull, 1951]. Это распределение, известное сейчас как закон Вейбулла, широко используется в теории надежности. Интенсивность отказов (аналог интенсивности смертности) в данном случае является степенной функцией возраста
В последнее время распределение Вейбулла стало применяться и для описания вариабельности по срокам жизни организмов [Rosenberg et al., 1973; Slob, Janse, 1988].
В некоторых работах используется обобщенный закон Вейбулла [см.: Гаврилов, 1980]
Нам представляется целесообразным дополнить список приведенных выше формул еще одной, которую мы назвали обобщенным биномиальным законом смертности:
Эта формула при одних соотношениях параметров близка к формуле Гомперца-Мейкема, а при других - к обобщенному закону Вейбулла, объединяя, таким образом, два разных класса распределений. Действительно, если параметр b оказывается много меньше параметра c, то обобщенный биномиальный закон смертности совпадает с обобщенным законом Вейбулла. Если, наоборот, параметр b оказывается много больше параметра c, то обобщенный биномиальный закон смертности совпадает с законом Гомперца-Мейкема, причем а Мы обнаружили, что биномиальный закон смертности может быть теоретически выведен из моделей, приводящих обычно к закону Вейбулла, если только дополнительно учитывать неоднородность популяции организмов по числу исходно имеющихся дефектов в организме (см. разделы 6.7 и 6.8 данной книги).
Значительно более сложную формулу, обобщающую законы Гомперца и Вейбулла, предложил Бриллингер [Brillinger, 1961]:
Иногда за основу берется не интенсивность смертности, а другие показатели. Так, в исследованиях некоторых актуариев использовалась формула:
где - вероятность смерти, а F(x) - полином нужной степени [Keyfitz, 1982].
Джонсон и Павелец [см.: Economos, 1980a] предложили следующую формулу для числа доживающих:
Экономос предлагает аппроксимировать зависимость смертности от возраста двумя кривыми. Первая из них описывает увеличение доли умерших в ранних возрастах:
где - доля умерших. Вторая зависимость описывает уменьшение доли выживших в поздних возрастах:
где - доля выживших, а - соответственно число доживающих и возраст начала зависимости. Таким образом, в полулогарифмических координатах эти зависимости имеют вид двух прямых линий - вначале восходящей для доли умерших, а затем нисходящей для доли выживших.
Некоторые исследователи предпочитают использовать формулы, описывающие изменение ожидаемой продолжительности жизни с возрастом. Так, Харди предложил следующую формулу [см.: Keyfitz, 1982]:
Стеффенсен использовал другую зависимость [см.: Le Bras, 1976]:
Большинство приведенных выше формул пригодны для описания смертности лишь взрослых половозрелых особей. Существуют, однако, попытки описать смертность на всем возрастном интервале. Первой попыткой такого рода, по-видимому, следует считать формулу Виттстейна [см.: Henderson, 1915]:
Анализ этой формулы, приведенный в книге Хендерсона, показывает, что первый член описывает смертность взрослых людей, а второй - "аддитивную смертность в раннем детстве".
В настоящее время из формул, описывающих смертность во всем возрастном интервале, наиболее известна формула, предложенная Хелигманом и Поллардом [Heligman, Pollard, 1979]:
где - вероятность смерти в течение года. Первое слагаемое описывает детскую и младенческую смертность, а последнее - смертность стариков, второе же слагаемое аппроксимирует пик смертности, наблюдаемый в районе 20 лет и связанный в основном с несчастными случаями.
Перечень формул, предложенных для аппроксимации функции распределения продолжительности жизни, можно было бы продолжить [Henderson, 1915; Le Bras, 1976; Keyfitz, 1982; Hsieh, 1985]. Однако и так видно, что в настоящее время нет недостатка в формулах, описывающих это распределение. Проблема заключается в том, чтобы из всех возможных формул выбрать такую, которая бы действительно отражала суть изучаемого явления и способствовала бы пониманию механизмов вариабельности по срокам жизни. Вместе с тем искать формулу распределения продолжительности жизни путем простого перебора всех возможных вариантов - значит, выполнять неблагодарную работу в надежде на счастливый случай. С тем же успехом можно попытаться решать задачи, подставляя возможные ответы. Поэтому прежде всего необходимо сформулировать методологические принципы, позволяющие прийти к необходимой формуле кратчайшим путем.
Методологические принципы выбора закона распределения продолжительности жизни. Сформулируем общие принципы, которыми обычно руководствуются исследователи* при решении подобных задач.
* (Эти принципы, к сожалению, редко используются одновременно в одном и том же исследовании.)
Принцип теоретической обоснованности. Согласно этому принципу, следует использовать лишь уравнения, имеющие теоретические обоснования. Тогда запись информации с помощью такого уравнения является одновременно и первым шагом к ее расшифровке. Исходя из данного принципа, особого внимания заслуживают не эмпирические формулы, используемые при страховании жизни, а зависимости, выведенные из различных теоретических представлений.
Принцип универсальности. Стремление выявить общие закономерности, справедливые для возможно более широкого круга явлений природы, отражает самую суть научного мировоззрения. В соответствии с этим принципом особую ценность представляют именно общие законы распределения длительности жизни, справедливые для самых разных организмов, включая человека.
Принцип достаточной аппроксимации при наименьшем числе параметров. Формула, удовлетворяющая этому принципу, дает наиболее компактную запись информации, что позволяет восстанавливать распределение при минимальном числе наблюдений [Keyfitz, 1982]. Данный принцип является частным случаем идеи, известной под названием "бритва Оккама": "не следует умножать число сущностей сверх необходимости". Применительно к проблеме продолжительности жизни этот принцип ориентирует не на абсолютно точное описание наблюдаемых распределений по срокам жизни с помощью многопараметрических формул, а на использование моделей, отражающих наиболее яркие особенности таких распределений. В этой связи особенно перспективным является факторный анализ смертности, позволяющий определить минимальное число параметров, необходимое для ее описания.
Принцип локального описания. Поскольку в развитии многих систем бывают критические периоды, когда они качественно меняют свои свойства и поведение [Жирмунский, Кузьмин. 1980], не следует пытаться описывать процесс сразу во всем диапазоне. История науки показывает, что более эффективен путь локального описания процесса с последующей "стыковкой" научных подходов в рамках нового, более общего представления. Следовательно, если предполагаемый закон распределения продолжительности жизни справедлив лишь на ограниченном возрастном интервале, это еще не является основанием для критического к нему отношения. Ограниченная приложимость закона указывает не на его ошибочность, а только на то, что он является лишь частным случаем другого, более общего и неизвестного пока закона.
Если руководствоваться приведенными выше принципами и обработать достаточно большой массив фактических данных, то окажется, что закон Гомперца-Мейкема до сих пор во многих отношениях лучше большинства других известных формул. Поэтому следует более подробно остановиться на данном законе и аргументах в его пользу.