Распределения

Распределения, одно из основных понятий теории вероятностей и математической статистики. Р. вероятностей какой-либо случайной величины, т. е. величины, принимающей в зависимости от случая то или иное численное значение, задаётся указанием возможных значений этой величины и соответствующих им вероятностей. Так, например, для числа m очков, выпадающих на верхней грани игральной кости, Р. вероятностей p_m задаётся табличкой: Возможные значения m 1 2 3 4 5 6 Соответствующие вероятности pm ¹/₆ ¹/₆ ¹/₆ ¹/₆ ¹/₆ ¹/₆

Подобным же образом Р. любой случайной величины X, возможные значения которой образуют конечную или бесконечную последовательность, задаётся указанием этих значений x₁, x₂, ..., x_n, ...

и соответствующих им вероятностей p₁, p₂, ..., p_n, ...

При этом вероятности p_m должны быть положительны и в сумме должны давать единицу. Р. указанного типа называются дискретными. Примером дискретного Р. может служить Пуассона распределение, определяемое вероятностями , r = 0, 1, 2, ?,
где l > 0- параметр.
Однако задание Р. указанием возможных значений x_n и соответствующих вероятностей p_n не всегда возможно. Например, если величина распределена "равномерно" на отрезке [-¹/₂, +¹/₂], подобно "ошибкам округления" при измерении непрерывных величин, то вероятность каждого отдельного значения равна нулю. Р. таких случайных величин задаётся указанием вероятности того, что случайная величина Х примет значение из любого наперёд заданного интервала. В том случае, когда существует функция p_X(x)такая, что вероятность попадания Х в любой интервал (а, b) равна
Р. величины Х называется непрерывным. Функция p_X(x) носит название плотности вероятности. Плотность вероятности неотрицательна и обладает тем свойством, что
В указанном выше случае равномерного Р. на отрезке [-¹/₂, +¹/₂]
Важнейшее Р. непрерывного типа - нормальное распределение с плотностью
(а и s > 0 - параметры).
Р. случайных величин не исчерпываются дискретным и непрерывным типами: они могут быть и более сложной природы. Поэтому желательно иметь такое описание Р., которое было бы пригодно во всех случаях. Это описание может быть достигнуто, например, при помощи т. н. функции распределения F_X(x). Значение этой функции при каждом фиксированном х равно вероятности Р {Х < х} того, что случайная величина х примет значение, меньшее x, т. е. F_X(x)=Р {Х < x}.
Функция Р. есть неубывающая функция x, изменяющаяся от 0 до 1 при изменении х от - ¥ до + ¥. Вероятность того, что Х примет значение из некоторого полуинтервала [a, b), равна вероятности того, что Х будет удовлетворять неравенству а £ Х < b, т. е. равна F (b)- F (a).
Примеры. 1) Пусть Е - некоторое событие, вероятность появления которого есть р, где 0 < р < 1. Тогда число m появлений события Е при n независимых наблюдениях есть случайная величина, принимающая значения m = 0, 1, 2, ..., n с вероятностями ?(q = 1 - p)
Это Р. носит название биномиального распределения. Биномиальное Р. (см. рис. 1, а и б) при больших n близко к нормальному в силу Лапласа теоремы.
2) Число наблюдений до первого появления события Е из примера 1 есть случайная величина, принимающая все целые значения m = 1, 2, 3, ... с вероятностями p_m = q^m^-¹p.
Это Р., носит название геометрического, т.к. последовательность {pm}есть геометрическая прогрессия (см. рис. 2, а и б).
3) Р., плотность которого р (х) равна ¹/₂h на некотором интервале (а - h, а + h)и равна нулю вне этого интервала, носит название равномерного распределения. Соответствующая функция Р. растет линейно от 0 до 1 при изменении х от а - h до а + h (см. рис. 3, а и б).
Дальнейшие примеры Р. вероятностей см. в статьях Коши распределение, Пирсона кривые, Полиномиальное распределение, Показательное распределение, ?"Хи-квадрат" распределение, Стьюдента распределение.
Пусть случайные величины Х и Y связаны соотношением Y = f (X), где f (x) - заданная функция. Тогда Р. Y может быть довольно просто выражено через Р. X. Например, если Х имеет нормальное Р. и Y = e^X, то Y имеет т. н. логарифмически-нормальное распределение с плотностью (см. рис. 4) .
Формулы, связывающие Р. величин X и Y, становятся особенно простыми, когда Y = aX + b, где а и b - постоянные. Так, при a > 0
Часто полное описание Р. (например, при помощи плотности или функции Р.) заменяют заданием небольшого числа характеристик, которые указывают или на наиболее типичные (в том или ином смысле) значения случайной величины, или на степень рассеяния значений случайной величины около некоторого типичного значения. Из этих характеристик наиболее употребительны математическое ожидание (среднее значение) и дисперсия. Математическое ожидание EX случайной величины X, имеющей дискретное Р., определяется как сумма ряда
при условии, что этот ряд сходится абсолютно. Для случайной величины X, имеющей Р. непрерывного типа с плотностью p_X(x), математическое ожидание определяется формулой EX =
при условии, что написанный интеграл сходится абсолютно. Если Y = f (X), то EY может быть вычислено двумя способами. Например, если Х и Y имеют непрерывное Р., то, с одной стороны, по определению EY =
с другой стороны, можно показать, что EY =
Дисперсия DX определяется как DX = Е (Х - EX)²,
т. е., например, для непрерывного Р. DX =
Р. вероятностей имеют много общего с Р. каких-либо масс на прямой. Так, случайной величине X, принимающей значения x₁ x₂ ..., x_nc вероятностями p₁, p₂, ..., p_n, можно поставить в соответствие Р. масс, при котором в точках x_k размещены массы, равные p_k. При этом формулы для EX и DX оказываются совпадающими с формулами, определяющими соответственно центр тяжести и момент инерции указанной системы материальных точек. Подробнее о числовых характеристиках Р. см. в статьях Квантиль, Медиана, Мода, Математическое ожидание, Вероятное отклонение, Дисперсия, Квадратичное отклонение.
Если складываются несколько независимых случайных величин, то их сумма будет случайной величиной, Р. которой зависит только от Р. слагаемых (чего не будет, как правило, при сложении зависимых случайных величин). При этом, например, для случая двух слагаемых, каждое из которых имеет Р. непрерывного типа, имеет место формула: ???? (*)
В весьма широких предположениях Р. суммы независимых случайных величин при увеличении числа слагаемых приближается к нормальному Р. или к др. предельным Р. (см. Предельные теоремы теории вероятностей). Однако для установления этого факта явные формулы типа (*) практически непригодны, поэтому доказательство ведётся обходным путём, обычно с использованием т. н. характеристических функций.
Статистические распределения и их связь с вероятностными. Пусть произведено n независимых наблюдений случайной величины X, имеющей функцию Р. F (x). Статистическое Р. результатов наблюдений задаётся указанием наблюдённых значений x₁, x₂, ..., x_r случайной величины Х и соответствующих им частот h₁, h₂, ..., h_r (т. е. отношений числа наблюдений, в которых появляется данное значение, к общему числу наблюдений). Например, если при 15 наблюдениях значение 0 наблюдалось 8 раз, значение 1 наблюдалось 5 раз, значение 2 наблюдалось 1 раз и значение 3 наблюдалось 1 раз, то соответствующее статистическое Р. задаётся табличкой:
Наблюдённые значения Xm 0 1 2 3 Соответствующие частоты hm ⁸/₁₅ ¹/₃ ¹/₁₅ ¹/₁₅
Частоты всегда положительны и в сумме дают единицу. С заменой слова "вероятность" на слово "частота" к статистическому Р. применимы многие определения, данные выше для Р. вероятностей. Так, если x₁, x₂, ..., x_r - наблюдённые значения X, a h₁, h₂, ..., h_r - частоты этих наблюдённых значений, то соответствующие статистическому Р. среднее и дисперсия (т. н. выборочное среднее и выборочная дисперсия) определяются равенствами ,
а соответствующая функция Р. (т. н. эмпирическая функция распределения) - равенством F*(x)= n_x/n,
где n_x - число наблюдений, результат которых меньше х. Статистическое Р. и его характеристики могут быть использованы для приближённого представления теоретического Р. и его характеристик. Так, например, если Х имеет конечные математическое ожидание и дисперсию, то, каково бы ни было e > 0, неравенства
выполняются при достаточно большом n с вероятностью, сколь угодно близкой к единице. Т. о., ?и s²суть состоятельные оценки для EX и DX соответственно (см. Статистические оценки). Советский математик В. И. Гливенко показал, что при любом e > 0 вероятность неравенства
при всех x стремится к единице при n, стремящемся к бесконечности. Более точный результат установлен сов. математиком А. Н. Колмогоровым; см. об этом Непараметрические методы в математической статистике.
? Многомерные распределения. Пусть Х и Y - две случайные величины. Каждой паре (X, Y) можно отнести точку Z на плоскости с координатами Х и Y, положение которой будет зависеть от случая. Совместное Р. величин Х и Y задаётся указанием возможных положений точки Z и соответствующих вероятностей. Здесь также можно выделить два основных типа Р.
1) Дискретные распределения. Возможные положения точки Z образуют конечную или бесконечную последовательность. Р. задаётся указанием возможных положений точки Z z₁, z₂, ..., z_n, ...
и соответствующих вероятностей p₁, p₂, ..., p_n, ...
2) Непрерывные распределения задаются плотностью вероятности р (x, у), обладающей тем свойством, что вероятность попадания точки Z в какую-либо область G равна
Пример: двумерное нормальное Р. с плотностью ,
где m_X = EX, m_Y = EY, ,
- математические ожидания и дисперсии величин Х и Y,
и R - коэффициент корреляции величин Х и Y:
Аналогично можно рассматривать Р. вероятностей в пространствах трёх и большего числа измерений. О многомерных Р. см. также Корреляция, Регрессия.
О возможности дальнейших обобщений и о связи между понятием меры множества и понятием Р. см. Вероятностей теория.? Лит.: Гнеденко Б. В., Курс теории вероятностей, д изд., М., 1969; Крамер Г., Математические методы статистики пер. с англ., М., 1948; Феллер В., Введение в теорию вероятностей и её приложения пер. с англ., 2 изд., т. 1-2, М., 1967; Большев Л. Н., Смирнов Н. В., Таблицы математической статистики, 2 изд., М., 1968
? Ю. В. Прохоров.