Непрерывная случайная величина и её функция распределения.
Функция плотности распределения
О непрерывной случайной величине (НСВ) я неоднократно упоминал в предыдущих статьях, и поэтому, если вы зашли с поисковика и/или не совсем в теме, то начните с первого урока о случайных величинах. После чего продолжаем и сразу вспоминаем разницу:
– В отличие от дискретной случайной величины, НСВ может принять любоедействительное значение из некоторого промежутка ненулевой длины, что делает невозможным её представление в виде таблицы (т.к. действительных чиселнесчётно много). В этой связи непрерывную случайную величину задают функциями двух типов, названия которых вы видите в заголовке.
Функция распределениянепрерывной случайной величины определяется точно так же, как и функция распределения ДСВ:
– вероятность того, что случайная величина примет значение, МЕНЬШЕЕ, чем переменная , которая «пробегает» все значения от «минус» до «плюс» бесконечности. Таким образом, учитываются все значения, которые В ПРИНЦИПЕ может принять произвольная случайная величина. С увеличением функция распределения «накапливает» (суммирует) вероятности, а значит, является неубывающей и изменяется в пределах . По этой причине её иногда называют интегральной функцией распределения.
Важной особенностью является тот факт, что функция распределения ЛЮБОЙ непрерывной случайной величины всегда и всюдунепрерывна! Часто её можно встретить в кусочном виде, например:
однако в точках «стыка» всё хорошо:
и если там разрыв, то вы имеете дело с опечаткой или откровенной ошибкой!
! Но сама по себе непрерывность и ноль слева, единица справа – ещё не означают, что перед нами функция распределения.
При ручном построении чертежа целесообразно найти опорные точки; в нашем примере удобно взять: и плавно-плавно провести карандашом кусочек параболы:
Напоминаю, что левый нижний луч следует прочертить жирно (чтобы он не сливался с осью), а правый верхний луч продолжить за остриё оси (т.к. график бесконечен). Также не забываем, что не можетубывать, и если вдруг окажется, что какой-то кусок графика идёт «сверху вниз», то ищите ошибку или опять же – имеет место опечатка. А может просто дрогнула рука :)
Что касаемо масштаба, то смотрим по ситуации, чаще всего оптимальный масштаб составляет 1 ед. = 1 см (две клетки), но поскольку я строю графики не от руки, то особо не слежу за пропорциями – в данном случае по оси ординат вышло примерно в 2 раза больше, чем по оси абсцисс.
Теперь вернёмся к смыслу функции распределения и рассмотрим пару конкретных «икс»:
– вероятность того, что случайная величина примет значение, МЕНЬШЕЕ, чем –1;
– вероятность того, что случайная величина примет значение, МЕНЬШЕЕ, чем 4.
Ну, и очевидно, что рассматриваемая случайная величина принимает случайные, наперёд неизвестные значения из отрезка . Если вкладывать в задачу содержательный смысл, то это может быть случайная продолжительность некоего процесса (в секундах, например), или масса либо размер случайно выбранного объекта (например, крупинки песка). И тому подобное – примеров масса. Конкретные задачи непременно будут, но прежде остановимся на технической стороне вопроса.
Вероятность того, что случайная величина примет значение из некоторого промежутка рассчитывается ещё проще, чем для дискретной случайной величины. Здесь нет никакой Санта-Барбары: отрезок ли нам дан, полуинтервал или интервал , соответствующую вероятность можно вычислить по единой формуле:
Примечание: в следующем параграфе мы обоснуем это утверждение
Например:
– вероятность того, что случайная величина примет значение из отрезка . И точно такими же будут вероятности ;
– вероятность того, что случайная величина примет значение из отрезка ;
– вероятность того, что случайная величина примет значение из интервала ;
и так далее.
Наверное, вы подметили, что на участках одинаковой длины результаты получились разными: . И возникает вопрос: как оценить эту «концентрацию» вероятностей на различных промежутках? – ведь функция распределения характеризует накопление вероятностей по мере увеличения , и много раз вычислять что-то неохота.
Эффективный ответ на поставленный вопрос даёт
функция ПЛОТНОСТИ распределения вероятностей
или дифференциальная функция распределения. Она представляет собой производную функции распределения: .
Примечание: для дискретной случайной величины такой функции не существует
В нашем примере:
То есть, всё очень просто – берём производную от каждого куска, и порядок.
Но настоящий порядок состоит в том, что несобственный интегралот с пределами интегрирования от «минус» до «плюс» бесконечности:
– равен единице, и строго единице. В противном случае перед нами не функция плотности, и если эта функция найдена как производная, то – не является функцией распределения (несмотря на какие бы то ни было другие признаки).
Проверим «подлинность» наших функций. Если случайная величина принимает значения из конечного промежутка, то всё дело сводится к вычислению определённого интеграла. В силу свойства аддитивности:
Совершенно понятно, что левый и правый интегралы равны нулю и нам осталось вычислить:
, что и требовалось проверить. С вероятностной точки зрения это означает, что случайная величина достоверно примет одно из значений отрезка . Геометрически же это означает, что площадь между осью и графиком равна единице, в данном случае речь идёт о площади треугольника . Сторона является фрагментом прямой и для её построения достаточно найти точку :
Ну вот, стало всё наглядно – где бОльшая площадь, там и более вероятные значения. Так как функция плотности «собирает под собой» вероятности, то она тоже неотрицательна и её график не может располагаться ниже оси . Следует также отметить, что в общем случае эта функция разрывна (следим, где «жирные» точки!).
Теперь разберём весьма любопытный факт: поскольку действительных чисел несчётно много, то вероятность того, что случайная величина примет какое-то конкретное значение стремится к нулю. И поэтому вероятности рассчитывают не для отдельно взятых точек, а для целых промежутков (пусть даже очень малых). Как вы правильно догадались: (синяя площадь на чертеже) – вероятность того, что случайная величина примет значение из отрезка ;
(красная площадь) – вероятность того, что случайная величина примет значение из отрезка .
По той причине, что отдельно взятые значения можно не принимать во внимание, с помощью этих же интегралов рассчитываются и вероятности по интервалам / полуинтервалам, в частности:
Этим же объяснятся аналогичная «вольность» с функцией .
Возможно, кто-то спросит: а зачем считать интегралы, если есть функция ?
А дело в том, что во многих задачах непрерывная случайная величина ИЗНАЧАЛЬНО задана функцией плотности распределения, которая ТОЖЕ однозначно определяет случайную величину. Но, как вариант, можно сначала найти функцию (с помощью тех же интегралов), после чего использовать «лёгкий способ» бросить курить отыскания вероятностей. Впрочем, об этом чуть позже:
Пример 1
Непрерывная случайная величина задана своей функцией распределения:
Найти значения и функцию . Проверить, что действительно является функцией плотности распределения. Вычислить вероятности . Построить графики .
Тренируемся самостоятельно! Если возникнут затруднения, то внимательно перечитайте вышеизложенный материал. Краткое решение и ответ в конце урока.
Вообще, типовые задачи на непрерывную случайную величину можно разделить на 2 большие группы: 1) когда дана функция , 2) когда дана функция .
В первом случае не составляет никаких трудностей отыскать функцию плотности распределения – почти всегда производные не то что простЫ, а примитивны (в чём мы недавно убедились). Но вот когда НСВ задана функцией , то нахождение функции распределения – есть более кропотливый процесс:
Пример 2
Непрерывная случайная величина задана функцией плотности распределения:
Найти значение и составить функцию распределения вероятностей. Вычислить . Построить графики .
Решение: найдём константу . Это классика. В подавляющем большинстве задач вам не предложат готовую функцию плотности. Используем свойство . В данном случае:
На практике нулевые интегралы можно опускать, а константу сразу выносить за знак интеграла:
Выполним проверку, а именно, вычислим тот же самый интеграл, но уже с известной константой. Для разнообразия я не буду пользоваться чётностью:
, что и требовалось проверить.
Обратите внимание, что только при – и только при этом значении, предложенная в условии функция является функцией плотности распределения. Ну и тут не лишним будет проконтролировать, что на интервале , т.е. условие неотрицательности выполнено. Доверяй условию, да проверяй ;) Не раз и не два мне встречались функции, которые в принципе не могли быть плотностью, что говорило об опечатках или о невнимательности авторов задач.
Теперь начинается самое интересное. Функция распределения вероятностей – есть интеграл:
Так как наша состоит из трёх кусков, то решение разобьётся на 3 шага:
1) На промежутке , поэтому:
2) На интервале , и мы прицепляем следующий вагончик:
При подстановке верхнего предела интегрирования можно считать, что вместо «икс» мы подставляем «икс». Если же возник вопрос с пределом нижним, то вспоминаем график синусоиды или нечётность синуса с тригонометрической таблицей.
3) И, наконец, на , и детский паровозик отправляется в путь:
! А вот в этом задании нулевые интегралы пропускать НЕ НАДО. Чтобы показать своё понимание функции распределения ;) К тому же, они могут оказаться вовсе не нулевыми, и тогда придётся иметь дело с интегралами несобственными. Соответствующие примеры я обязательно разберу ниже.
Записываем наши достижения под единую скобку:
С высокой вероятностью всё правильно, но, тем не менее, устно возьмём производную , а также «прозвоним» точки «стыка»:
Правильность решения можно проконтролировать и в ходе построения графика, но, во-первых, он не всегда требуется, а во-вторых, до сего момента можно успеть «наломать дров». Ибо вероятности попадания в интервал чаще находят с помощью функции распределения:
– вероятность того, что случайная величина примет значение из промежутка
Но ценители интегрального исчисления, конечно же, не откажут себе в удовольствии:
, что, кстати, не труднее. И проверочка заодно получилась.
Тот редкий случай, когда функция плотности непрерывна.
Значение численно равно заштрихованной площади – это я специально сделал, чтобы напомнить вероятностный смысл функции плотности. И вся площадь под «дугой» равна единице, то есть, достоверным является тот факт, что случайная величина примет значение из интервала . Заметьте, что значения , согласно условию, невозможны.
Осталось изобразить функцию распределения. График представляет собой сжатуюв 2 раза вдоль оси ординат синусоиду, сдвинутую на вверх:
В принципе, тут можно не заморачиваться преобразованием графиков, а найти несколько опорных точек и догадаться, как выглядит кривая (тригонометрическая таблица в помощь). Но «любительский» подход чреват тем, что график получится принципиально не точным. Так, в нашем примере в точке существует перегиб графика, и велик риск неверно отобразить его выпуклость / вогнутость.
Чертежи желательно расположить так, чтобы оси ординат лежали ровненько одна под другой. Это будет хорошим тоном.
И я так чувствую, вам уже не терпится проверить свои силы. Как водится, пример попроще:
Пример 3
Задана плотность распределения вероятностей непрерывной случайной величины :
Требуется:
1) определить коэффициент ;
2) найти функцию распределения ;
3) построить графики ;
4) найти вероятность того, что примет значение из промежутка
и задачка поинтереснее:
Пример 4
Непрерывная случайная величина задана плотностью распределения вероятностей:
Найти значение и построить график плотности распределения. Найти функцию распределения вероятностей и построить её график. Вычислить вероятность .
Дерзайте! Свериться с решением можно внизу страницы.
Таким образом, наше уравнение превратилось в готовый результат:
и функция плотности:
Функция , как нетрудно понять, отыскивается в 2 шага:
1) На промежутке , следовательно:
– вот такая вот у нас замечательная экспонента. Как птица Феникс.
2) На интервале и:
, что и должно получиться.
В результате:
Для построения графиков найдём пару опорных точек: и аккуратно прочертим кусочки экспонент с причитающимися дополнениями:
Заметьте, что теоретически случайная величина может принять сколь угодно большоепо модулю отрицательное значение, и ось абсцисс является горизонтальной асимптотой для обоих графиков при .
Ещё более интересное задание для самостоятельного изучения:
Пример 6
Проверить, что является функцией плотности распределения вероятностей непрерывной случайной величины. Найти и выполнить чертежи.
Жду вас во 2-й части урока, посвящённой числовым характеристикам НСВ. Постарайтесь освоить её как можно скорее – по «горячим» знаниям и навыкам!
Решения и ответы:
Пример 1. Решение: в силу непрерывности функции распределения:
Таким образом:
Контроль:
Найдём функцию плотности распределения:
Покажем, что действительно является функцией плотности: 1) Для любого значения , в частности, на среднем промежутке: Внимание! Без 1-го пункта обойтись нельзя! 2) Таким образом, найденная функция действительно является функцией плотности распределения.
Требуемые вероятности выгоднее вычислить с помощью функции распределения: – вероятность того, что случайная величина примет значение из полуинтервала ;
– вероятность того, что случайная величина примет значение, больше, чем .
Построим графики :
Пример 3. Решение: 1) По свойству функции плотности распределения:
В данной задаче:
Таким образом, искомая плотность:
2) Функцию распределения найдём с помощью формулы : – если то и ; – если то и ; – если то и: . Таким образом:
3) Выполним чертежи:
4) Найдём вероятность того, что случайная величина примет значение из промежутка :
Пример 4. Решение: функция плотности распределения вероятности обладает свойством . В данном случае:
Таким образом, функция плотности распределения:
Выполним чертеж:
Составим функцию распределения вероятностей : 1) Если , то и 2) Если , то и 3) Если , то и:
4) Если , то и:
Таким образом: , Выполним чертеж:
Вычислим – вероятность того, что случайная величина примет значение из интервала .
Пример 6. Решение: проверим, что функция является функцией плотности: 1) Поскольку экспоненциальная функцияположительна, то для любого , значит, свойство неотрицательности функции плотности выполнено. 2) Проверим выполнение свойства . Сначала удобно найти первообразную: (константу добавлять не нужно). Используем чётность подынтегральной функции:
Вывод: является функцией плотности распределения вероятностей непрерывной случайной величины, что и требовалось проверить.
Найдём функцию распределения:
– для всех .
Выполним чертёжи:
! Обратите внимание, что у 1-го графика одна, а 2-го – две горизонтальные асимптоты, «залезать» за которые нельзя!