Зависимые и независимые случайные величины.
Условные законы распределения и ковариация дискретных СВ
На первом уроке по теме уже фигурировали задачи с независимыми случайными величинами, и давайте сразу вспомним, что это значит: случайные величины являются независимыми, если закон распределения вероятностей любой из них, не зависит от того, какие значения приняли (или примут) остальные случайные величины.
Например, система двух игральных кубиков – совершенно понятно, что результат броска одного кубика никак не влияет на вероятности выпадения граней другого кубика. Или одинаковые независимо работающие игровые автоматы. И, наверное, у некоторых сложилось впечатление, что независимы вообще любые СВ. Однако это далеко не всегда так.
Рассмотрим одновременное сбрасывание двух кубиков-магнитов, у которых северные полюса находятся на стороне 1-очковой грани и южные – на противоположной грани в 6 очков. Будут ли независимыми аналогичные случайные величины? Да, будут. Просто снизятся вероятности выпадения «1» и «6» и увеличатся шансы других граней, т. к. в результате испытания кубики могут притянуться противоположными полюсами.
Теперь рассмотрим систему
, в которой кубики сбрасываются последовательно:
– количество очков, выпавших на первом кубике;
– количество очков, выпавших на втором кубике, при условии, что он всё время сбрасывается по правую (например) сторону от 1-го кубика.
В этом случае закон распределения случайной величины
зависит от того, как расположился 1-й кубик. Вторая кость может либо притянуться, либо наоборот – отскочить (если «встретились» одноимённые полюса), либо частично или полностью проигнорировать 1-й кубик.
Второй пример: предположим, что
одинаковых игровых автоматов объединены в единую сеть, и
– есть система случайных величин - выигрышей на соответствующих автоматах. Не знаю, законна ли эта схема, но владелец игрового зала вполне может настроить сеть следующим образом: при выпадении крупного выигрыша на каком-либо автомате, автоматически меняются законы распределения выигрышей вообще на всех автоматах. В частности, целесообразно на некоторое время обнулить вероятности крупных выигрышей, чтобы заведение не столкнулось с нехваткой средств (в том случае, если вдруг кто-то выиграет по-крупному ещё раз). Таким образом, рассмотренная система будет зависима.
То были примеры с дискретными случайными величинами. Но, разумеется, существуют и дву- и большемерные непрерывные случайные величины. Пример третий, баян:
– рост наугад выбранного человека;
– его вес.
И для наглядности представим две группы людей: ростом 160 и 190 см. Совершенно понятно, что во 2-й группе окажутся преимущественно более тяжелые люди, нежели в 1-й. То есть распределение случайной величины
зависит от того, какое значение приняла случайная величина
, и поэтому система
зависима. В отличие от жёсткой функциональной зависимости (а-ля
) здесь имеет место вероятностная, или как говорят, стохастическая зависимость. Это проявляется в том, что, выбрав наугад человека невысокого (например) роста, более вероятно столкнуться со «стандартным» весом таких людей, но всё же существует вероятность, что у него окажется очень большой либо очень маленький вес для своей «ростовой категории».
Как составить закон распределения системы зависимых СВ? Для независимых дискретных систем мы использовали теорему умножения вероятностей независимых событий, и Капитан Очевидность подсказывает, что сейчас нужно применить аналогичную теорему для зависимых событий.
В качестве демонстрационного примера рассмотрим колоду из 8 карт, пусть это будут короли и дамы, и простую игру, в которой два игрока последовательно (не важно, в каком порядке) извлекают из колоды по одной карте. Рассмотрим случайную величину
, которая символизирует одного игрока и принимает следующие значения: 1, если он извлёк червовую карту, и 0 – если карту другой масти.
Аналогично, пусть случайная величина
символизирует другого игрока и тоже принимает значения 0 либо 1, если он извлёк не черву и черву соответственно.
По теореме умножения вероятностей зависимых событий:
– вероятность того, что оба игрока извлекут черву,
– вероятность того, что оба извлекут не черву, и:
– вероятность того, что один извлечёт черву, а другой – нет; ну или наоборот:
![]()
Таким образом, закон распределения вероятностей зависимой системы
:

Контроль:
, что и требовалось проверить. …Возможно, у вас возник вопрос, а почему я рассматриваю именно 8, а не 36 карт? Да просто для того, чтобы дроби получились не такими громоздкими.
Теперь немного проанализируем результаты. Если просуммировать вероятности по строкам:
, то получится в точности закон распределения случайной величины
:

Легко понять, что это распределение соответствует ситуации, когда «иксовый» игрок тянет карту один, без «игрекового» товарища, и его математическое ожидание:
– равно вероятности извлечения червы из нашей колоды.
Аналогично, если просуммировать вероятности по столбцам, то получим закон распределения одиночной игры второго игрока:

с тем же матожиданием ![]()
В силу «симметрии» правил игры, распределения получились одинаковыми, но, в общем случае, они, конечно, различны.
Помимо этого, полезно рассмотреть условные законы распределения вероятностей. Это ситуация, когда одна из случайных величин уже приняла какое-то конкретное значение, или же мы предполагаем это гипотетически.
Пусть «игрековый» игрок тянет карту первым и извлекает не черву
. Вероятность этого события составляет
(суммируем вероятности по первому столбцу таблицы
– см. вверху). Тогда, из той же теоремы умножения вероятностей зависимых событий получаем следующие условные вероятности:
– вероятность того, что «иксовый» игрок вытянет не черву при условии, что «игрековый» вытянул не черву;
– вероятность того, что «иксовый» игрок вытянет черву, при условии, что «игрековый» вытянул не черву.
…Все помнят, как избавляться от четырёхэтажных дробей? И да, формальное, но очень удобное техническое правило вычисления этих вероятностей: сначала следует просуммировать все вероятности по столбцу, и затем каждую вероятность разделить на полученную сумму.
Таким образом, при
условный закон распределения случайной величины
запишется так:

, ОК. Вычислим условное математическое ожидание:
![]()
Теперь составим закон распределения случайной величины
при условии, что случайная величина
приняла значение
, т. е. «игрековый» игрок извлёк карту червовой масти. Для этого суммируем вероятности 2-го столбца таблицы
(см. вверху):
и вычисляем условные вероятности:
– того, что «иксовый» игрок вытянет не черву,
– и черву.
Таким образом, искомый условный закон распределения:

Контроль:
, и условное математическое ожидание:
– разумеется, оно получилось меньше, чем в предыдущем случае, так как «игрековый» игрок убавил количество черв в колоде.
«Зеркальным» способом (работая со строками таблицы
) можно составить
– закон распределения случайной величины
, при условии, что случайная величина
приняла значение
, и условное распределение
, когда «иксовый» игрок извлёк черву. Легко понять, что в силу «симметрии» игры, получатся те же распределения и те же значения
.
Для непрерывных случайных величин вводятся такие же понятия условных распределений и матожиданий, но если в них нет горячей надобности, то лучше продолжить изучение этого урока.
На практике в большинстве случаев вам предложат готовый закон распределения системы случайных величин:
Пример 4
Двумерная случайная величина задана своим законом распределения вероятностей:

…Хотел рассмотреть таблицу побольше, но решил-таки не маньячить, ведь главное разобраться в самом принципе решения.
Требуется:
1) Составить законы распределения
и вычислить соответствующие математические ожидания. Сделать обоснованный вывод о зависимости или независимости случайных величин
.
Это задание для самостоятельного решения! Напоминаю, что в случае независимости СВ законы
должны получиться одинаковыми и совпасть с законом распределения случайной величины
, и законы
– совпасть с
. Десятичные дроби, кто не знает или позабыл, удобно делить так:
.
Свериться с образцом можно внизу страницы.
2) Вычислить коэффициент ковариации.
Сначала разберёмся в самом термине, и откуда он вообще произошёл: когда случайная величина принимает различные значения, то говорят, что она варьируется, и количественное измерение этой вариации, как вы знаете, выражается дисперсией. Используя формулу вычисления дисперсии, а также свойства матожидания и дисперсии, нетрудно установить, что:
![]()
то есть при сложении двух случайных величин суммируются их дисперсии и добавляется дополнительное слагаемое, характеризующее совместную вариацию или коротко – ковариацию случайных величин.
Ковариация или корреляционный момент – это мера совместной вариации случайных величин.
Обозначение:
или ![]()
Ковариация дискретных случайных величин определяется, сейчас буду «выражаться»:), как математическое ожидание произведения линейных отклонений этих случайных величин от соответствующих матожиданий:
![]()
Если
, то случайные величины зависимы. Образно говоря, ненулевое значение говорит нам о закономерных «откликах» одной СВ на изменение другой СВ.
Ковариацию можно вычислить двумя способами, я рассмотрю оба.
Способ первый. По определению математического ожидания:
![]()
«Страшная» формула и совсем не страшные вычисления. Сначала составим законы распределения случайных величин
и
– для этого суммируем вероятности по строкам («иксовая» величина) и по столбцам («игрековая» величина):

Взгляните на исходную верхнюю таблицу – всем понятно, как получились распределения? Вычислим матожидания:
и отклонения значений случайных величин от соответствующих математических ожиданий:

Полученные отклонения удобно поместить в двумерную таблицу, внутрь которой затем переписать вероятности
из исходной таблицы:

Теперь нужно вычислить все возможные произведения
, в качестве примера я выделил:
(красный цвет) и
(синий цвет). Вычисления удобно проводить в Экселе, а на чистовике расписать всё подробно. Я привык работать «по строкам» слева направо и поэтому сначала перечислю все возможные произведения с «иксовым» отклонением -1,6, затем – с отклонением 0,4:

Способ второй, более простой и распространённый. По формуле:
![]()
Матожидание произведения СВ определяется как
и технически всё очень просто: берём исходную таблицу задачи и находим все возможные произведения
на соответствующие вероятности
; на рисунке ниже я выделил красным цветом произведение
и синим произведение
:

Сначала перечислю все произведения со значением
, затем – со значением
, но вы, разумеется, можете использовать и другой порядок перебора – кому как удобнее:

Значения
уже вычислены (см. 1-й способ), и осталось применить формулу:
![]()
Как отмечалось выше, ненулевое значение ковариации говорит нам о зависимости случайных величин, причём, чем оно больше по модулю, тем эта зависимость ближе к функциональной линейной зависимости
. Ибо
определяется через линейные отклонения.
Таким образом, определение можно сформулировать точнее:
Ковариация – это мера линейной зависимости случайных величин.
С нулевым значением всё занятнее. Если установлено, что
, то случайные величины могут оказаться как независимыми, так и зависимыми (т. к. зависимость может носить не только линейный характер). Таким образом, этот факт в общем случае нельзя использовать для обоснования независимости СВ!
Однако, если известно, что
независимы, то
. В этом легко убедиться аналитически: так как для независимых случайных величин справедливо свойство
(см. предыдущий урок), то по формуле вычисления ковариации:
![]()
Какие значения может принимать этот коэффициент? Коэффициент ковариации принимает значения, не превосходящие по модулю
– и чем больше
, тем сильнее выражена линейная зависимость. И всё вроде бы хорошо, но есть существенное неудобство такой меры:
Предположим, мы исследуем двумерную непрерывную случайную величину
(готовимся морально :)), компоненты которой измеряются в сантиметрах, и получили значение
. Кстати, какая размерность у ковариации? Коль скоро
– сантиметры, и
– тоже сантиметры, то их произведение и матожидание этого произведения
– выражается в квадратных сантиметрах, т. е. ковариация, как и дисперсия – есть квадратичная величина.
Теперь предположим, что кто-то изучил ту же систему
, но использовал не сантиметры, а миллиметры. Так как 1 см = 10 мм, то ковариация увеличится в 100 раз и будет равна
!
Поэтому удобно рассмотреть нормированный коэффициент ковариации, который давал бы нам одинаковое и безразмерное значение. Такой коэффициент получил название, продолжаем нашу задачу:
3) Коэффициент корреляции. Или, точнее, коэффициент линейной корреляции:
, где
– стандартные отклонения случайных величин.
Коэффициент корреляции безразмерен и принимает значения из промежутка:
(если у вас на практике получилось другое – ищите ошибку).
Чем больше
по модулю к единице, тем теснее линейная взаимосвязь между величинами
, и чем ближе
к нулю – тем такая зависимость выражена меньше. Взаимосвязь считается существенной, начиная примерно с
. Крайним значениям
соответствует строгая функциональная зависимость
, но на практике, конечно, «идеальных» случаев не встретить.
Очень хочется привести много интересных примеров, но корреляция более актуальна в курсе математической статистики, и поэтому я приберегу их на будущее. Ну а сейчас найдём коэффициент корреляции в нашей задаче. Так. Законы распределения
уже известны, скопирую сверху:

Матожидания найдены:
, и осталось вычислить стандартные отклонения. Табличкой уж оформлять не буду, быстрее подсчитать строкой:

Ковариация найдена в предыдущем пункте
, и осталось рассчитать коэффициент корреляции:
, таким образом, между величинами
имеет место линейная зависимость средней тесноты.
Четвёртое задание опять же более характерно для задач математической статистики, но на всякий случай рассмотрим его и здесь:
4) Составить уравнение линейной регрессии
на
.
Уравнение линейной регрессии – это функция
, которая наилучшим образом приближает значения случайной величины
. Для наилучшего приближения, как правило, используют метод наименьших квадратов, и тогда коэффициенты регрессии можно вычислить по формулам:
, вот это чудеса, и 2-й коэффициент:
![]()
Таким образом, искомое уравнение регрессии:
![]()
ну и давайте ради исследовательского интереса я скопирую табличку сверху:

и вычислю значения функции:
– в результате получился результат, который близок к наиболее вероятному (см. 2-ю снизу строку) значению
;
– тоже неплохо, это приближение попало между наиболее вероятными (см. нижнюю строку) значениями ![]()
Вполне и вполне приличные результаты, несмотря на невысокий коэффициент корреляции. И, наверное, вы уже догадались, что чем ближе
по модулю к единице, тем точнее функция
приближает наиболее вероятные значения случайной величины
. Но уравнение линейной регрессии, конечно, больше применимо к двумерной непрерывной случайной величине, поскольку позволяет осуществлять реальное прогнозирование, например, наиболее вероятного веса человека по заданному росту.
Творческое задание для самостоятельного решения:
Пример 5
Вычислить коэффициенты ковариации и корреляции для демонстрационного примера данного урока (с картами червовой масти) и оценить тесноту линейной связи между СВ.
после чего с нетерпением переходим к системам непрерывных случайных величин.
Решения и ответы:
Пример 4, пункт 1. Решение:
1) Составим закон распределения
, для этого суммируем все вероятности соответствующего столбца:
и делим каждую вероятность на полученную сумму:
![]()
Так как вероятности изменились, то мы имеем дело с условными вероятностями, и из этого можно сразу сделать вывод, что случайные величины
зависимы.
! Примечание: в случае независимости СВ вероятности остались бы прежними! – желающие могут проверить данный факт на любом примере предыдущего урока.
Таким образом, условное распределение вероятностей:
![]()
и условное математическое ожидание: ![]()
2) Составим закон распределения
. Суммируем вероятности соответствующего столбца:
и делим каждую из них на полученную сумму:
![]()
Таким образом:

И здесь делаем вывод, что распределение случайной величины
зависит от того, какое значение приняла случайная величина
, что является ещё более убедительным обоснованием зависимости этих СВ.
Условное матожидание:
.
3) Аналогично находим закон распределения
:
![]()
Таким образом, при
случайная величина
достоверно примет значение ![]()
![]()
и, очевидно,
.
4) Чтобы составить закон распределения
, нужно просуммировать все вероятности соответствующей строки:
и разделить каждую из них на полученную сумму: ![]()
![]()
![]()
5) И, наконец, ![]()

Контроль:
, ч.т.п.
![]()
Пример 5. Решение: коэффициент ковариации вычислим по формуле:
![]()
уже найдены,
![]()
Таким образом:
![]()
Коэффициент корреляции вычислим по формуле:
![]()
Найдём стандартные отклонения случайных величин:

Закон распределения
точно такой же, поэтому
.
Таким образом:

Полученное значение достаточно близко к нулю, что говорит о слабой зависимости случайных величин. Тем не менее, знак «минус» показывает, что при увеличении значения одной из случайных величин (от 0 до 1) уменьшаются шансы извлечения червы другим игроком
Примечание: при достаточно малых значениях
(ниже 0,3-0,4 по модулю) построение уравнения линейной регрессии теряет смысл, т.к. оно недостоверно приблизит исходные данные.
Автор: Емелин Александр
Высшая математика для заочников и не только >>>
(Переход на главную страницу)
Высшая математика – просто и доступно!
Наш форум, библиотека и блог:


Повторяем школьный курс
Карта сайта



© Copyright