THE BELL

Есть те, кто прочитали эту новость раньше вас.
Подпишитесь, чтобы получать статьи свежими.
Email
Имя
Фамилия
Как вы хотите читать The Bell
Без спама

Даны определения Функции распределения случайной величины и Плотности вероятности непрерывной случайной величины. Эти понятия активно используются в статьях о статистике сайта . Рассмотрены примеры вычисления Функции распределения и Плотности вероятности с помощью функций MS EXCEL .

Введем базовые понятия статистики, без которых невозможно объяснить более сложные понятия.

Генеральная совокупность и случайная величина

Пусть у нас имеется генеральная совокупность (population) из N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики Х.

Примером генеральной совокупности (ГС) может служить совокупность весов однотипных деталей, которые производятся станком.

Поскольку в математической статистике, любой вывод делается только на основании характеристики Х (абстрагируясь от самих объектов), то с этой точки зрения генеральная совокупность представляет собой N чисел, среди которых, в общем случае, могут быть и одинаковые.

В нашем примере, ГС - это просто числовой массив значений весов деталей. Х – вес одной из деталей.

Если из заданной ГС мы выбираем случайным образом один объект, имеющей характеристику Х, то величина Х является случайной величиной . По определению, любая случайная величина имеет функцию распределения , которая обычно обозначается F(x).

Функция распределения

Функцией распределения вероятностей случайной величины Х называют функцию F(x), значение которой в точке х равно вероятности события X

F(x) = P(X

Поясним на примере нашего станка. Хотя предполагается, что наш станок производит только один тип деталей, но, очевидно, что вес изготовленных деталей будет слегка отличаться друг от друга. Это возможно из-за того, что при изготовлении мог быть использован разный материал, а условия обработки также могли слегка различаться и пр. Пусть самая тяжелая деталь, произведенная станком, весит 200 г, а самая легкая - 190 г. Вероятность того, что случайно выбранная деталь Х будет весить меньше 200 г равна 1. Вероятность того, что будет весить меньше 190 г равна 0. Промежуточные значения определяются формой Функции распределения. Например, если процесс настроен на изготовление деталей весом 195 г, то разумно предположить, что вероятность выбрать деталь легче 195 г равна 0,5.

Типичный график Функции распределения для непрерывной случайной величины приведен на картинке ниже (фиолетовая кривая, см. файл примера ):

В справке MS EXCEL Функцию распределения называют Интегральной функцией распределения (Cumulative Distribution Function , CDF ).

Приведем некоторые свойства Функции распределения:

  • Функция распределения F(x) изменяется в интервале , т.к. ее значения равны вероятностям соответствующих событий (по определению вероятность может быть в пределах от 0 до 1);
  • Функция распределения – неубывающая функция;
  • Вероятность того, что случайная величина приняла значение из некоторого диапазона плотность вероятности равна 1/(0,5-0)=2. А для с параметром лямбда =5, значение плотности вероятности в точке х=0,05 равно 3,894. Но, при этом можно убедиться, что вероятность на любом интервале будет, как обычно, от 0 до 1.

    Напомним, что плотность распределения является производной от функции распределения , т.е. «скоростью» ее изменения: p(x)=(F(x2)-F(x1))/Dx при Dx стремящемся к 0, где Dx=x2-x1. Т.е. тот факт, что плотность распределения >1 означает лишь, что функция распределения растет достаточно быстро (это очевидно на примере ).

    Примечание : Площадь, целиком заключенная под всей кривой, изображающей плотность распределения , равна 1.

    Примечание : Напомним, что функцию распределения F(x) называют в функциях MS EXCEL интегральной функцией распределения . Этот термин присутствует в параметрах функций, например в НОРМ.РАСП (x; среднее; стандартное_откл; интегральная ). Если функция MS EXCEL должна вернуть Функцию распределения, то параметр интегральная , д.б. установлен ИСТИНА. Если требуется вычислить плотность вероятности , то параметр интегральная , д.б. ЛОЖЬ.

    Примечание : Для дискретного распределения вероятность случайной величине принять некое значение также часто называется плотностью вероятности (англ. probability mass function (pmf)). В справке MS EXCEL плотность вероятности может называть даже "функция вероятностной меры" (см. функцию БИНОМ.РАСП() ).

    Вычисление плотности вероятности с использованием функций MS EXCEL

    Понятно, что чтобы вычислить плотность вероятности для определенного значения случайной величины, нужно знать ее распределение.

    Найдем плотность вероятности для N(0;1) при x=2. Для этого необходимо записать формулу =НОРМ.СТ.РАСП(2;ЛОЖЬ) =0,054 или =НОРМ.РАСП(2;0;1;ЛОЖЬ) .

    Напомним, что вероятность того, что непрерывная случайная величина примет конкретное значение x равна 0. Для непрерывной случайной величины Х можно вычислить только вероятность события, что Х примет значение, заключенное в интервале (а; b).

    Вычисление вероятностей с использованием функций MS EXCEL

    1) Найдем вероятность, что случайная величина, распределенная по (см. картинку выше), приняла положительное значение. Согласно свойству Функции распределения вероятность равна F(+∞)-F(0)=1-0,5=0,5.

    НОРМ.СТ.РАСП(9,999E+307;ИСТИНА) -НОРМ.СТ.РАСП(0;ИСТИНА) =1-0,5.
    Вместо +∞ в формулу введено значение 9,999E+307= 9,999*10^307, которое является максимальным числом, которое можно ввести в ячейку MS EXCEL (так сказать, наиболее близкое к +∞).

    2) Найдем вероятность, что случайная величина, распределенная по , приняла отрицательное значение. Согласно определения Функции распределения, вероятность равна F(0)=0,5.

    В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(0;ИСТИНА) =0,5.

    3) Найдем вероятность того, что случайная величина, распределенная по стандартному нормальному распределению , примет значение, заключенное в интервале (0; 1). Вероятность равна F(1)-F(0), т.е. из вероятности выбрать Х из интервала (-∞;1) нужно вычесть вероятность выбрать Х из интервала (-∞;0). В MS EXCEL используйте формулу =НОРМ.СТ.РАСП(1;ИСТИНА) - НОРМ.СТ.РАСП(0;ИСТИНА) .

    Все расчеты, приведенные выше, относятся к случайной величине, распределенной по стандартному нормальному закону N(0;1). Понятно, что значения вероятностей зависят от конкретного распределения. В статье функции распределения найти точку, для которой F(х)=0,5, а затем найти абсциссу этой точки. Абсцисса точки =0, т.е. вероятность, того что случайная величина Х примет значение <0, равна 0,5.

    В MS EXCEL используйте формулу =НОРМ.СТ.ОБР(0,5) =0.

    Однозначно вычислить значение случайной величины позволяет свойство монотонности функции распределения.

    Обратная функция распределения вычисляет , которые используются, например, при . Т.е. в нашем случае число 0 является 0,5-квантилем нормального распределения . В файле примера можно вычислить и другой квантиль этого распределения. Например, 0,8-квантиль равен 0,84.

    В англоязычной литературе обратная функция распределения часто называется как Percent Point Function (PPF).

    Примечание : При вычислении квантилей в MS EXCEL используются функции: НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР(), ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье .

    Свойства плотности распределения

    Для начала напомним, что такое плотность распределения:

    Рассмотрим свойства плотности распределения:

    Свойство 1: Функция $\varphi (x)$ плотности распределения неотрицательна:

    Доказательство.

    Мы знаем, что функция распределения $F(x)$ - неубывающая функция. Из определения следует, что $\varphi \left(x\right)=F"(x)$, а производная неубывающей функции -- есть функция неотрицательная.

    Геометрически это свойство означает, то график функции $\varphi \left(x\right)$ плотности распределения находится либо выше, либо на самой оси $Ox$ (рис. 1)

    Рисунок 1. Иллюстрация неравенства $\varphi (x)\ge 0$.

    Свойство 2: Несобственный интеграл от функции плотности распределения пределах от $-\infty $ до $+\infty $ равен 1:

    Доказательство.

    Вспомним формулу для нахождения вероятности того, что случайная величина попадет интервал $(\alpha ,\beta)$:

    Рисунок 2.

    Найдем вероятность того, что случайная величина попадет в интервал $(-\infty ,+\infty $):

    Рисунок 3.

    Очевидно, что случайная величина всегда попадет в интервал $(-\infty ,+\infty $), следовательно, вероятность такого попадания равна единице. Получаем:

    Геометрически, второе свойство означает, что площадь криволинейной трапеции, ограниченной графиком функции плотности распределения $\varphi (x)$ и осью абсцисс численно равна единице.

    Можно также сформулировать обратное свойство:

    Свойство 3: Любая неотрицательная функция $f(x)\ge 0$, удовлетворяющая равенству $\int\limits^{+\infty }_{-\infty }{f\left(x\right)dx}=1$ является функцией плотность распределения некоторой непрерывной случайной величины.

    Вероятностный смысл плотности распределения

    Придадим переменной $x$ приращение $\triangle x$.

    Вероятностный смысл плотности распределения: Вероятность того, что непрерывная случайная величина $X$ примет значения из интервала$(x,x+\triangle x)$, приближенно равна произведению плотности распределения вероятности в точке $x$ на приращение $\triangle x$:

    Рисунок 4. Геометрическая иллюстрация вероятностного смысла плотности распределения непрерывной случайной величины.

    Примеры решения задач с использованием свойств плотности распределения

    Пример 1

    Функция плотности распределения вероятности имеет вид:

    Рисунок 5.

    1. Найти коэффициент $\alpha $.
    2. Построить график плотности распределения.
    1. Рассмотрим несобственный интеграл $\int\limits^{+\infty }_{-\infty }{\varphi \left(x\right)dx}$, получаем:

    Рисунок 6.

    Используя свойство 2, получим:

    \[-2\alpha =1,\] \[\alpha =-\frac{1}{2}.\]

    То есть, функция плотности распределения имеет вид:

    Рисунок 7.

    1. Построим её график:

    Рисунок 8.

    Пример 2

    Функция плотности распределения имеет вид $\varphi \left(x\right)=\frac{\alpha }{chx}$

    (Напомним, что $chx$ -- гиперболический косинус).

    Найти значение коэффициента $\alpha $.

    Решение. Используем второе свойство:

    \[\int\limits^{+\infty }_{-\infty }{\frac{\alpha }{chx}dx}=1,\] \[\alpha \int\limits^{+\infty }_{-\infty }{\frac{dx}{chx}}=1,\] \[\int\limits^{+\infty }_{-\infty }{\frac{dx}{chx}}={\mathop{lim}_{a\to -\infty } \int\limits^0_a{\frac{dx}{chx}}\ }+{\mathop{lim}_{b\to +\infty } \int\limits^b_0{\frac{dx}{chx}}\ }\]

    Так как $chx=\frac{e^x+e^{-x}}{2}$, то

    \[\int{\frac{dx}{chx}}=2\int{\frac{dx}{e^x+e^{-x}}}=2\int{\frac{de^x}{{1+e}^{2x}}}=2arctge^x+C\]

    \[\int\limits^{+\infty }_{-\infty }{\frac{dx}{chx}}={\mathop{lim}_{a\to -\infty } \left(-2arctge^a\right)\ }+{\mathop{lim}_{b\to +\infty } \left(2arctge^b\right)\ }=\pi \]

    Следовательно:

    \[\pi \alpha =1,\] \[\alpha =\frac{1}{\pi }\]

    Непрерывная случайная величина может быть задана не только с помощью функции распределения. Введем понятие плотности вероятности непрерывной случайной величины.

    Рассмотрим вероятность попадания непрерывной случайной величины на интервал [х , х + Δх ]. Вероятность такого события

    P (х X х + Δх ) = F (х + Δх ) – F (х ),

    т.е. равна приращению функции распределения F (х ) на этом участке. Тогда вероятность, приходящаяся на единицу длины, т.е. средняя плотность вероятности на участке от х до х + Δх , равна

    Переходя к пределу Δх → 0, получим плотность вероятности в точке х :

    представляющую производную функции распределения F (х ). Напомним, что для непрерывной случайной величины F (х ) – дифференцируемая функция.

    Определение. Плотностью вероятности (плотностью распределения ) f (x ) непрерывной случайной величины Х называется производная ее функции распределения

    f (x ) = F ′(x ). (4.8)

    Про случайную величину Х говорят, что она имеет распределение с плотностью f (x ) на определенном участке оси абсцисс.

    Плотность вероятности f (x ), как и функция распределения F (x ) является одной из форм закона распределения. Но в отличие от функции распределения она существует только для непрерывных случайных величин.

    Плотность вероятности иногда называют дифференциальной функцией или дифференциальным законом распределения . График плотности вероятности называется кривой распределения .

    Пример 4.4. По данным примера 4.3 найти плотность вероятности случайной величины Х .

    Решение. Будем находить плотность вероятности случайной величины как производную от ее функции распределения f (x ) = F "(x ).

    Отметим свойства плотности вероятности непрерывной случайной величины.

    1. Плотность вероятности – неотрицательная функция , т.е.

    Геометрически вероятность попадания в интервал [α , β ,] равна площади фигуры, ограниченной сверху кривой распределения и опирающейся на отрезок [α , β ,] (рис.4.4).

    Рис. 4.4 Рис. 4.5

    3. Функция распределения непрерывной случайной величины может быть выражен через плотность вероятности по формуле :

    Геометрически свойства 1 и 4 плотности вероятности означают, что ее график – кривая распределения – лежит не ниже оси абсцисс, а полная площадь фигуры, ограниченной кривой распределения и осью абсцисс, равна единице.

    Пример 4.5. Функция f (x ) задана в виде:

    Найти: а) значение А ; б) выражение функции распределения F (х ); в) вероятность того, что случайная величина Х примет значение на отрезке .

    Решение. а) Для того, чтобы f (x ) была плотностью вероятности некоторой случайной величины Х , она должна быть неотрицательна, следовательно, неотрицательным должно быть и значение А . С учетом свойства 4 находим:

    , откуда А = .

    б) Функцию распределения находим, используя свойство 3 :

    Если x ≤ 0, то f (x ) = 0 и, следовательно, F (x ) = 0.

    Если 0 < x ≤ 2, то f (x ) = х /2 и, следовательно,

    Если х > 2, то f (x ) = 0 и, следовательно

    в) Вероятность того, что случайная величина Х примет значение на отрезке находим, используя свойство 2 .

    Выше непрерывная случайная величина задавалась с помощью функции распределения. Этот способ задания не является единственным. Непрерывную случайную величину можно также задать, используя функцию, которую называют плотностью распределения или плотностью вероятности (часто ее называют дифференциальной функцией ).

    Плотностью распределения вероятностей непрерывной случайной величины Х называют функцию f (x) - первую производную от функции распределения F (x) :

    f (x)= F" (x).

    Из этого определения следует, что функция распределения является первообразной для плотности распределения. Зная плотность распределения, можно вычислить вероятность того, что непрерывная случайная величина примет значение, принадлежащее заданному интервалу.

    Теорема . Вероятность того, что непрерывная случайная величина Х примет значение, принадлежащее интервалу (а, b ), равна определенному интегралу от плотности распределения, взятому в пределах от а до b :

    Зная плотность распределения f(x) , можно найти функцию распределения F (х) по формуле

    .

    Свойства плотности распределения:

    Свойство 1. Плотность распределения - неотрицательная функция:
    .

    Геометрически это свойство означает, что точки, принадлежащие графику плотности распределения, расположены либо над осью Ох , либо на этой оси. График плотности распределения называют кривой распределения .

    Свойство 2 . Несобственный интеграл от плотности распределения в пределах от
    до
    равен единице:

    .

    Геометрически это означает, что вся площадь криволинейной трапеции, ограниченной осью Ох и кривой распределения, равна единице.

    В частности, если все значения случайной величины принадлежат интервалу (а, b ), то

    .

    Математическое ожидание дискретной случайной величины

    Закон распределения полностью характеризует случайную величину. Однако он зачастую неизвестен заранее и приходится пользоваться косвенными сведениями. Во многих случаях этих косвенных характеристик вполне достаточно для решения практических задач и определять закон распределения не нужно. Такие характеристики называют числовыми характерис тиками случайной величины. И первой из них является математическое ожидание.

    Математическим ожиданиемдискретной случайной величины X называется сумма произведений всех ее возможных значений (x 1 , x 2 , …, x n ) на их вероятности (p 1 , p 2 , …, p n ):

    Следует заметить, что M (x ) есть неслучайная (постоянная) величина. Можно доказать, что M (x ) приближенно равно (и тем точнее, чем больше число испытаний n ) среднему арифметическому наблюдаемых значений случайной величины.

    Математическое ожидание имеет следующие свойства :

    · Математическое ожидание постоянной равно самой постоянной:

    .

    · Постоянный множитель можно выносить за знак математического ожидания:

    .

    · Математическое ожидание произведения двух независимых случайных величин X и Y (т.е. закон распределения одной из них не зависит от возможных значений другой) равно произведению их математических ожиданий:

    · Математическое ожидание суммы двух случайных величин равно сумме математических ожиданий слагаемых:

    Здесь под суммой X + Y случайных величин понимается новая случайная величина, значения которой равны суммам каждого значения X с каждым возможным значением Y ; вероятности возможных значений X + Y для независимых случайных величин X и Y равны произведениям вероятностей слагаемых, а для зависимых – произведениям вероятностей одного слагаемого на условную вероятность другого. Так, если X и Y – независимы и их законы распределения

    · Если производится n независимых испытаний, в

    каждом из которых вероятность события A постоянна и равна p , то математическое ожидание числа появлений события A в серии:

    .

    Отметим, что свойства третье и четвертое легко обобщаются для любого количества случайных величин.

    Дисперсия дискретной случайной величины

    Математическое ожидание – удобная характеристика, но часто ее недостаточно для суждения о возможных значениях случайной величины или о том, как они рассеяны вокруг среднего значения. Поэтому вводятся и другие числовые характеристики.

    Пусть X – случайная величина с математическим ожиданием M (X ). Отклонением X 0 назовем разность между случайной величиной и ее математическим ожиданием:

    .

    Математическое ожидание отклонения M (X 0) = 0.

    Пример. Пусть задан закон распределения величины X :

    Отклонение является промежуточной характеристикой, на основе которой введем более удобную характеристику. Дисперсией (рассеиванием ) дискретной случайной величиныназывается математическое ожидание квадрата отклонения случайной величины:

    Для примера найдем дисперсию величины X со следующим законом распределения:

    Здесь . Искомая дисперсия:

    Величина дисперсии определяется не только значениями случайной величины, но и их вероятностями. Поэтому в случае если две случайные величины имеют одинаковые или близкие математические ожидания (это достаточно часто встречается), то дисперсии, как правило, различны. Это позволяет дополнительно характеризовать изучаемую случайную величину.

    Перечислим свойства дисперсии:

    · Дисперсия постоянной величины равна нулю:

    .

    · Постоянный множитель можно выносить за знак дисперсии, возводя его в квадрат:

    .

    · Дисперсия суммы и разности двух независимых случайных величин равна сумме дисперсий этих величин:

    · Дисперсия числа появлений события A в n независимых испытаниях, в каждом из которых вероятность P появления события постоянна , определяется по формуле:

    ,

    где
    – вероятность непоявления события.

    Удобной вспомогательной характеристикой, используемой в расчетах даже чаще, чем D (X ), является среднеквадратическое отклонение (или стандарт ) случайной величины:

    .

    Дело в том, что D (X ) имеет размерность квадрата размерности случайной величины, а размерность стандарта X ) та же, что и у случайной величины X . Это очень удобно для оценки разброса случайной величины.

    Пример. Пусть случайная величина задается распределением:

    X 10м
    P 0,1 0,4 0,5

    Рассчитываем: м,

    а стандарт: м.

    Поэтому про случайную величину X можно сказать либо – ее математическое ожидание 6,4 м с дисперсией 13,04 м 2 , либо – ее математическое ожидание 6,4 м с разбросом
    м. Вторая формулировка, очевидно, нагляднее.

    Отметим, что для суммы n независимых случайных величин:

    Начальные и центральные теоретические моменты

    Для большинства практических расчетов введенных выше числовых характеристик M X ),D X )и X ) достаточно. Однако для исследования поведения случайных величин можно использовать и некоторые дополнительные числовые характеристики, позволяющие отследить нюансы поведения случайной величины и обобщить вышеизложенную теорию.

    Начальным моментомk-го порядка случайной величины X называется математическое ожидание величины X k :

    Математическое ожидание

    Дисперсия непрерывной случайной величины X , возможные значения которой принадлежат всей оси Ох, определяется равенством:

    Назначение сервиса . Онлайн калькулятор предназначен для решения задач, в которых заданы либо плотность распределения f(x) , либо функция распределения F(x) (см. пример). Обычно в таких заданиях требуется найти математическое ожидание, среднее квадратическое отклонение, построить графики функций f(x) и F(x) .

    Инструкция . Выберите вид исходных данных: плотность распределения f(x) или функция распределения F(x) .

    Задана плотность распределения f(x):

    Задана функция распределения F(x):

    Непрерывная случайна величина задана плотностью вероятностей
    (закон распределения Релея – применяется в радиотехнике). Найти M(x) , D(x) .

    Случайную величину X называют непрерывной , если ее функция распределения F(X)=P(X < x) непрерывна и имеет производную.
    Функция распределения непрерывной случайной величины применяется для вычисления вероятностей попадания случайной величины в заданный промежуток:
    P(α < X < β)=F(β) - F(α)
    причем для непрерывной случайной величины не имеет значения, включаются в этот промежуток его границы или нет:
    P(α < X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
    Плотностью распределения непрерывной случайной величины называется функция
    f(x)=F’(x) , производная от функции распределения.

    Свойства плотности распределения

    1. Плотность распределения случайной величины неотрицательна (f(x) ≥ 0) при всех значениях x.
    2. Условие нормировки:

    Геометрический смысл условия нормировки: площадь под кривой плотности распределения равна единице.
    3. Вероятность попадания случайной величины X в промежуток от α до β может быть вычислена по формуле

    Геометрически вероятность попадания непрерывной случайной величины X в промежуток (α, β) равна площади криволинейной трапеции под кривой плотности распределения, опирающейся на этот промежуток.
    4. Функция распределения выражается через плотность следующим образом:

    Значение плотности распределения в точке x не равно вероятности принять это значение, для непрерывной случайной величины речь может идти только о вероятности попадания в заданный интервал. Пусть }

THE BELL

Есть те, кто прочитали эту новость раньше вас.
Подпишитесь, чтобы получать статьи свежими.
Email
Имя
Фамилия
Как вы хотите читать The Bell
Без спама