1 |
16 мая 2022 г.-31 декабря 2022 г. |
Смешанные вероятностные модели: аналитические и асимптотические свойства, методы статистического анализа и применения 2022 |
Результаты этапа: В данном пункте приведен перечень основных результатов, полученных в рамках выполнения проекта в 2022 году.
1. Предложено многомерное распределение, обобщающее «двойственное» к многомерному распределению Стьюдента. Это распределение возникает как предельное в предельных теоремах для многомерных геометрических случайных сумм. Показано, что это распределение имеет тяжелые хвосты и в то же время наследует многие свойства многомерного нормального распределения.
2. В задаче сравнения распределений предложен непрерывный аналог понятия дефекта, позволяющий строить количественные оценки точности нормальной аппроксимации, учитывающие «тяжесть хвостов» распределений слагаемых.
3. В терминах дзета-метрики Золотарева получены оценки скорости сходимости в законе больших чисел для смешанных пуассоновских случайных сумм. Получены оценки геометрической устойчивости распределений Миттаг-Леффлера и Линника. Поскольку распределения Миттаг-Леффлера и только они являются геометрически устойчивыми распределениями, сосредоточенными на неотрицательной полуоси, а распределения Линника и только они являются симметричными геометрически устойчивыми распределениями, тем самым получены очень существенные обобщения ранее известных оценок геометрической устойчивости показательного распределения (частного случая распределения Миттаг-Леффлера).
4. Найдено значение точной верхней грани отношения третьего нецентрального абсолютного момента к центральному при каждом значении нормированного (квадратным корнем из второго момента) математического ожидания и указано экстремальное (двухточечное) распределение. Построена более удобная оценка найденного экстремума в виде дробно-рациональной функции, уступающая в точности значению экстремума отношения нормированных третьих абсолютных моментов (ляпуновских дробей) не более 10% равномерно по всем возможным значениям нормированного первого момента. Построены уточненные оценки для разности характеристической функции центрированной и нормированной суммы независимых одинаково распределенных случайных величин с конечными вторыми моментами и стандартной нормальной характеристической функцией в терминах дроби Линдеберга и абсолютного значения усеченного третьего алгебраического момента, позволившие уточнить значения констант в неравенствах типа Эссеена-Розовского для одинаково распределенных случайных величин.
5. Дано описание предельных распределений для многомерных случайных сумм с общим многомерным индексом суммирования с многомерным геометрическим распределением. Эти распределения используются для построения многомерных семейств распределений с тяжелыми хвостами.
6. Предложено исследовать новый вид дигамма-распределения, представляющего собой масштабную (мультипликативную) смесь обобщенных гамма-распределений. Предложено расширить область применения байесовских моделей баланса за счет рассмотрения интегральных факторов, имеющих вид случайных сумм. Доказано обобщение классической теоремы Реньи для структурных распределений с параметром масштаба, представляющее собой теорему переноса с нулевым центрированием. Доказана асимптотическая теорема о сходимости распределений нормированных интегральных индексов баланса к дигамма-распределению, дающая возможность исследовать сбалансированность сложных систем на больших интервалах времени и предельное поведение функций специального вида от двумерных статистик, построенных по выборкам случайного объема.
7. Реализован метод скользящего разделения смесей для задачи оценивания распределений случайных коэффициентов уравнения Ланжевена, проведено его тестирование на реальных пространственно-временных данных. Исследована возможность применения метода эмпирических характеристических функций в задаче разделения смесей многомерных дисперсионных гамма-распределений. Реализованы методы разделения конечных смесей нормальных законов, основанные на минимизации невязки между теоретическим и эмпирическим распределениями. Предложены алгоритмы адаптивного выбора узлов сетки на последовательных итерациях сеточного ЕМ-алгоритма.
8. Впервые предложено использование моментных характеристик вероятностных моделей данных и «связанных» компонент метода скользящего разделения смесей в качестве нетривиальных признаков для эффективного расширения признакового пространства в задачах обучения рекуррентных нейронных сетей. |
2 |
1 января 2023 г.-31 декабря 2023 г. |
Смешанные вероятностные модели: аналитические и асимптотические свойства, методы статистического анализа и применения 2023 |
Результаты этапа: В рамках этапа 2023 года получены следующие ключевые научные результаты:
Доказаны общие двусторонние неравенства, связывающие вероятность больших уклонений масштабных смесей с аналогичными вероятностями для смешиваемого и смешивающего распределений. Из этих неравенств вытекает, что определяющее значение для степени тяжести хвостов смешанного распределения имеет не столько число атомов, сколько границы носителя смешивающего распределения. Поэтому асимптотическое поведение хвостов конечной смеси нормальных законов совпадает с аналогичным поведением смешиваемого нормального распределения. Упомянутые неравенства позволяют проследить возрастание тяжести хвостов смеси по мере стремления границ носителя смешивающего распределения к бесконечности.
Доказан аналог неравенства Берри-Эссеена для пуассоновских случайных сумм независимых одинаково распределенных случайных величин с конечными третьими моментами, устанавливающий верхнюю оценку точности нормальной аппроксимации последних в дзета-метриках порядка 1<=s<=3 в терминах нецентральных ляпуновских дробей третьего порядка.
Получены оценки равномерной и дзета-метрик порядка 1<=s<=3, включая метрику Канторовича (s=1) точности нормальной аппроксимации для распределений пуассоновских случайных сумм в терминах центральных ляпуновских дробей третьего порядка с мультипликативной константой, учитывающей возможную малость значений нормированного математического ожидания случайных слагаемых.
Для нового двойственного семейства распределений найдены числовые характеристики в явном виде. Все распределения, как для исходного, так и для двойственного семейства являются эллиптически контурированными. Для оценки их параметров найдена некоторая система уравнений. Исследованы свойства полученных оценок. В частности, доказана их состоятельность и асимптотическая нормальность.
Рассмотрено асимптотического поведения оценок параметров дигамма-распределения в условиях априори неизвестного объема выборки с помощью модифицированного метода моментов, основанного на логарифмических кумулянтах дигамма-распределения, получаемых при помощи преобразования Меллина. Доказаны аналоги центральной предельной теоремы для оценок характеристического показателя и параметров формы и масштаба дигамма-распределения. Показано, что при случайном объеме выборки, стремящемся по вероятности к бесконечности, предельные законы представляют собой масштабные смеси нормального распределения, в которых смешивающие распределения получаются как предельные для нормированного случайного объема выборки.
Получены явные выражения для моментов случайных величин с несимметричными квази-степеннЫми нормальными распределениями. Показано, что несимметричные квази-степеннЫе нормальные распределения могут использоваться в прикладных задачах в качестве асимптотических аппроксимаций наблюдаемых статистических закономерностей. С этой целью доказана теорема переноса для случайных сумм в схеме серий, в которой несимметричные квази-степеннЫе нормальные распределения выступают в качестве предельных. При этом полученные условия сходимости являются необходимыми и достаточными.
Показано, что обобщенное распределение Стьюдента допускает представление в виде масштабной смеси нормальных законов, что позволяет в довольно простой предельной схеме сформулировать и доказать предельные теоремы для статистик, построенных по выбркам случайного объема (в частности, для случайных сумм), в которых обобщенное распределение Стьюдента выступает в качестве предельного закона. Установлена его связь с распределениями типа Парето, в частности, с обобщенным распределением Ломакса, которое является распределением степени абсолютной величины с обобщенным распределением Стьюдента. Доказаны такие свойства обобщенного распределения Стьюдента и обобщенного распределения Ломакса как безграничная делимость и идентифицируемость. Доказаны предельные теоремы для случайных сумм и экстремальных порядковых статистик в выборках случайного объема, в которых обобщенное распределение Стьюдента, обобщенное распределение Ломакса, обобщенное распределение Бэрра и распределение Снедекора–Фишера являются предельными. Соответствующие условия сходимости являются необходимыми и достаточными. Построены асимптотические разложения для распределения экстремальных порядковых статистик в выборках из распределения Бэрра. Найдены асимптотические разложения для распределения экстремальных порядковых статистик в выборках из такого распределения, введены понятия гарантированного уровня и предложен способ сравнения гарантированных уровней, основанный на аналоге понятия дефекта, хорошо известного в статистике. Рассмотрены ситуации, в которых объем выборок может быть случайным. Доказаны общие неравенства, связывающие хвосты масштабных смесей с хвостами смешивающих распределений в предположении равенства нулю среднего значения смешиваемого закона. |
3 |
1 января 2024 г.-31 декабря 2024 г. |
Смешанные вероятностные модели: аналитические и асимптотические свойства, методы статистического анализа и применения 2024 |
Результаты этапа: 1. Исследованы различные подходы к определению многомерных аналогов логистического распределения. Предложен эллиптически контурированный многомерный аналог логистического распределения как распределение случайного вектора, имеющего многомерное нормальное распределение с некоторой (произвольной) ковариационной матрицей и нулевым вектором математических ожиданий, и стохастически независимой от него случайной величины, имеющей распределение Колмогорова (асимптотическое распределение равномерного расстояния между эмпирической и теоретической функцией распределения). Показано, что ковариационная матрица так определенного многомерного логистического распределения с точностью до скалярного множителя совпадает с ковариационной матрицей упомянутого выше случайного вектора с многомерным нормальным распределением. Доказаны свойства многомерного логистического распределения. Доказаны предельные теоремы, устанавливающие условия сходимости распределений многомерных статистик, построенных по выборкам случайного объема, в частности, сумм случайного числа случайных векторов, к эллиптически контурированному многомерному логистическому распределению. Найдены простые соотношения, связывающие моменты произвольных порядков случайной величины, имеющей распределение Колмгорова, с аналогичными моментами логистического распределения (следует заметить, что в существующей литературе не удалось найти формулы для вычисления моментов распределения Колмогорова за исключением первых двух). Предложены аналоги многомерного логистического распределения, основанные на свойстве одномерного логистического распределения быть степеннОй смесью распределений Гумбеля − одного из трех возможных асимптотических распределений экстремальных значений, − в которой смешивающим распределением является показательное
2. Доказаны двусторонние неравенства, связывающие хвосты масштабных смесей с хвостами смешиваемого и смешивающего распределений. В частности, показано, что если смешиваемое распределение не имеет атома в нуле и смешивающее распределение имеет тяжелый хвост (например, убывающий степенным образом), то и масштабная смесь с таким смешивающим распределением будет иметь тяжелый хвост, убывающий степенным образом, какими бы легкими ни были хвосты смешиваемого распределения. В некоторых случаях распределение суммы случайного числа случайных величин, в которых слагаемые и число слагаемых стохастически независимы, допускает представление в виде масштабной смеси.
3. Разработаны методы и алгоритмы, реализующих решение задачи численной реконструкции коэффициентов стохастических дифференциальных уравнений (коэффициентов процессов Ито) в условиях полного отсутствия априорной информации о структуре этих коэффициентов. В качестве базовых методов решения этой задачи использовались методы статистического оценивания параметров сдвиг-масштабных смесей нормальных распределений, аппроксимирующих распределения приращений указанных процессов. Отработан метод оценивания параметров смеси с помощью минимизации дискретного аналога расстояния L2 между теоретической и эмпирической функциями распределениями. Доказана теорема, устанавливающая оптимальный выбор точек, в которых вычисляется указанное расстояние. Показано, что подход, основанный на минимизации расстояния L2 между теоретической конечной нормальной смесью и эмпирической функцией распределения предпочтительнее по крайней мере при его использовании для статистической реконструкции коэффициентов процесса Ито, которая предполагает применение итерационных вычислительных процедур в режиме скользящего окна. Указана такая комбинация вычислительных алгоритмов, которая обеспечивает высокое быстродействие, причем получаемые оценки параметров имеют практически такое же правдоподобие, как получаемые методом максимального правдоподобия с помощью ЕМ-алгоритма, но при этом доставляют кратно меньшее значение расстояния L2 между теоретической конечной нормальной смесью и эмпирической функцией распределения по сравнению с оценками ЕМ-алгоритма. Более того, если в рамках этого подхода (логарифмическая) функция правдоподобия используется в качестве штрафа, то этот подход можно трактовать как регуляризацию некорректно поставленной задачи максимизации правдоподобия по крайней мере для случая конечных смесей нормальных законов.
4. Получены оценки скорости слабой сходимости к дигамма-распределению. Получены оценки близости в метрике Колмогорова дисперсионно-сдвиговых смесей нормальных законов в терминах минимальных интегральных L1-метрик смешивающих распределений. Построены оценки скорости сходимости смешанных пуассоновских случайных сумм к дисперсионно-сдвиговым смесям нормальных законов в предположении конечности моментов третьего порядка у случайных слагаемых. Получены оценки скорости сходимости к обобщенным гиперболическим распределениям, обобщенным дисперсионным гамма распределениям, несимметричным двусторонним распределениям Вейбулла, Линника и квази-степенным нормальным распределениям. |