Зависимость и коэффициент ковариации непрерывных случайных величин
На предыдущем уроке мы рассмотрели функции распределения и плотности непрерывной двумерной случайной величины и в заключительной статье разбёрём: зависимость и независимость этой СВ, условные законы распределения, матожидания, коэффициент ковариации и корреляции. Коротко теория, подробно задачи.
И сразу быстренько вспоминаем: две случайные величины являются независимыми, если закон распределения одной из них не зависит от того, какое значение значения приняла другая случайная величина. Например, случайные погрешности измерений двух независимо работающих измерительных приборов.
Если же СВ зависимы, то закон распределения одной величины зависит от того, какое значение приняла другая величина. Классика жанра: – рост случайно выбранного человека, – его вес. Ну, или наоборот, сначала смотрим на вес, а затем анализируем закон распределения роста.
Условные законы распределения случайных величин обозначаются следующим образом:
– условный закон распределения СВ , при условии, что СВ примет (или уже приняла) какое-либо КОНКРЕТНОЕ значение :
– условный закон распределения , при условии, что примет или уже приняла некоторое КОНКРЕТНОЕ значение .
В случае независимости случайных величин все условные законы будут совпадать с законом распределения случайной величины (ибо «игрековая» величина никак не влияет на «иксовую»), и все условные законы – совпадать с законом .
Но вот с зависимыми величинами всё не так: встретился нам мальчик-с-пальчик , и мы сталкиваемся с – условным законом распределения веса именно этой «ростовой категории». А вот если попался дядя Стёпа, то условный закон распределения веса таких дядей стёп будет совсем другим.
С нахождением условных законов дискретных СВ мы уже разобрались (см. по ссылке), и сейчас научимся их строить для непрерывных случайных величин:
Пример 9
Двумерная непрерывная случайная величина задана своей плотностью распределения в квадрате и принимает значения только из этой области. Найти:
1) – плотности распределения компонент и их матожидания ;
2) Условные плотности и условные математические ожидания
Сделать вывод о зависимости или независимости случайных величин.
Решение: функцию плотности я взял из Примера 8и первый пункт решения уже частично готов:
Напомню смысл этих функций. Функция задаёт закон распределения случайной величины без учёта возможного влияния на него случайной величины (эта оговорка нужна на тот случай, если зависимы). И «зеркально»: функция определяет закон распределения СВ – без учёта возможного влияния СВ.
По этой причине функции иногда называют безусловными плотностями распределения компонент , и сейчас нам нужно вычислить их безусловные математические ожидания .
Так как плотности компонент совпадают, то работы у нас в два раза меньше:
2) Найдём плотность распределения случайной величины при условии, что случайная величина принимает различные КОНКРЕТНЫЕ значения . Эта функция принципиально отличатся от тем, что учитывает влияние (если оно есть), и поэтому её называют условной плотностью распределения случайной величины .
Данная функция определяется по формуле:
Легко видеть, что закон распределения случайной величины зависит от того, какое значение приняла переменная . Так, например, при получаем:
, если и при иных значениях .
А если, например, , то получается совсем другая плотность:
– на том же промежутке .
Задание: самостоятельно проверьте, что любая из полученных функций обладает общими свойствами функции плотности: и .
Таким образом, здесь можно сразу сделать вывод о том, что двумерная случайная величина состоит из зависимых компонент.
По «зеркальной» формуле получаем:
– условную плотность распределения случайной величины , при условии, что случайная величина принимает различные КОНКРЕТНЫЕ значения из промежутка .
Условные математические ожидания рассчитываются по формулам:
и для разнообразия я вычислю условное «игрековое» матожидание:
Снова интегрируем по частям, и тут главное не запутаться в буквах: «икс» считается константой, а «игрек» – «живая» переменная:
Найденное математическое ожидание:
– представляет собой функцию, зависящую от , и называется функцией регрессии на . И это естественно – если «икс» принимает различные значения, то мы получаем разные условные законы распределения с разными матожиданиями. Так, при получается следующий условный закон распределения:
и с помощью найденной функции легко рассчитать соответствующее математическое ожидание:
Желающие могут выполнить проверку непосредственным вычислением интеграла
И особо желающие (такие есть!) могут самостоятельно провести аналогичные вычисления, чтобы получить:
– условное математическое ожидание компоненты , которое называется функцией регрессии на .
Следует заметить, что в отличие от уравнения, которое мы получаем с помощью коэффициента корреляции(также см. ниже), регрессия здесь носит в общем случае нелинейный характер.
Вывод о зависимости случайных величин уже сделан, и решение этой задачи завершено.
Существуют ли другие способы определения зависимости / независимости? Существуют!
Здесь нужно использовать свойства матожидания и дисперсии (см. Пример 2 первого урока о системах случайных величин). И небольшая подсказка: для нахождения удобно использовать формулу вычисления дисперсии , и для – ту же формулу, запишу её в общем виде: .
Краткое решение в конце урока.
Следует отметить, что озвученная выше теорема с простенькими формулами , часто порождает одно практическое заблуждение. Так, в Примере 6 мы отыскали функцию распределения и видим, что в ней можно разделить «икс» и «игрек», т.е. всё вроде бы хорошо и функция представима в виде . Однако этот «критерий» ошибочен! Ведь мы НЕ ЗНАЕМ функций . В общем случае, они могут оказаться какими угодно и совершенно неожиданными – такими, что их произведение вовсе не равно !
Поэтому нужно обязательно найти , выполнить умножение и только после этого делать вывод о справедливости равенства и независимости случайных величин!
Иными словами, если у функций , можно разделить аргументы, то это ЕЩЁ НЕ ЗНАЧИТ, что справедливы равенства ,
Любопытно, что в «неразделимом» случае это рассуждение срабатывает. Так, у функции плотности (Пример 8-9) «икс» с «игреком» разделить нельзя, и из этого следует, что она никак не может получиться в результате перемножения функций , следовательно, компоненты зависимы.
Но такое обоснование всё же не убедительно – а вдруг, если «покрутить-повертеть» , использовать тригонометрические формулы, то переменные таки разделятся? Поэтому надежнее отыскать условные плотности, , их произведение:
и только после этого делать вывод, что
Эта тонкость встретится и в заключительном задании, где мы рассмотрим коэффициенты ковариации и корреляции. Их смысл я уже осветил на уроке о зависимых дискретных СВ, и сейчас мы изучим техническую сторону вопроса для непрерывных СВ:
Пример 11
Задана плотность распределения системы двух случайных величин
Найти значение и вычислить коэффициенты ковариации и корреляции . Построить уравнение линейной регрессии на .
И, во-первых, сразу заметим, что аргументы функции плотности здесь разделяются. Но из этого вовсе не следует справедливость равенства и независимость компонент . Этот момент у нас прояснится только в ходе решения:
Так как случайная величина принимает значения лишь из ограниченной области , то свойство упрощается до двойного интеграла по этой области: , в данном случае:
И нам предстоит решить шаблонную задачу. Представим уравнение прямой в «школьном» виде: , изобразим область интегрирования на чертеже:
Таким образом: . С двойным интегралом удобно разделаться поэтапно, у кого возникнут трудности с техникой вычислений, обратитесь по ссылке выше:
1)
2)
И из равенства получаем:
Итак:
Коэффициенты ковариации и корреляции определяются по тем же формулам:
– с той поправкой, что матожидания и стандартные отклонения рассчитываются с помощью интегралов.
Математическое ожидание произведения СВ вычислим по формуле:
1)
2)
Математические ожидания компонент тоже можно вычислить с помощью двойных интегралов:
, в данном случае это будут двойные интегралы по области , либо с помощью однократных интегралов от безусловных плотностей этих случайных величин:
То же самое касается дисперсий:
, либо:
В исследовательских целях выберем 2-й способ, который, кстати, не легче.
Сначала разделаемся с компонентой . Найдём её безусловную плотность:
и при иных значениях .
Для самоконтроля обязательно проверяем, что , я выполнил эту проверку на черновике.
Вычислим математическое ожидание:
Дисперсию вычислим по формуле:
В данном случае:
Таким образом:
и среднее квадратическое отклонение:
Теперь компонента . Чтобы составить её функцию плотности, нужно из уравнения прямой выразить и тогда «икс» у нас будет «заходить» в область через ось ординат и «выходить» через прямую :
, а давайте-ка самостоятельно. Формулы вверху, образец для сверки – внизу, ну а здесь я сразу запишу готовые результаты:
, если – и после нахождения этой функции, становится ясно, что при её умножении на у нас не получается ! Таким образом, , а значит, случайные величины – зависимы.
Остальные трофеи:
И долгожданный коэффициент совместной вариации:
– редкий, как солнечное затемнение, случай, когда вычисления было удобнее провести в десятичных дробях.
Впрочем, это ненадолго:)
Коэффициент корреляции отрицателен и по модулю достаточно близок к единице – это означает, что между случайными величинами существует довольно тесная вероятностная линейная зависимость.
Давно не встречал такой красоты:
, вот что бывает после затмения :)
Полученное уравнение означает, что если случайная величина приняла какое-нибудь значение (из промежутка ), например, , то мы можем быстро оценить наиболее вероятные значения, которые может принять случайная величина – эти значения находятся вблизи точки . И поскольку коэффициент корреляции близок по модулю к единице, то полученное приближение будет достаточно точным.
Готово.
Как и в случае с дискретными СВ, для рассмотренных коэффициентов справедливы следующие факты:
Если в результате решения мы выяснили, что , то из этого следует, что случайные величины являются зависимыми или коррелированными. Но если получен результат , то СВ могут оказаться как независимыми, так и зависимыми (т.к. зависимость может носить не только линейный характер); однако и в том и другом случае их называют некоррелированными.
Из последнего утверждения существуют исключения, в частности, из некоррелированности компонент двумерной нормальной СВ следует и их независимость.
Теперь вас ничем не испугаешь :), и поэтому я запишу напоследок общую формулу плотности двумерной нормальной случайной величины:
…а это уже какая-то вспышка на Солнце.
В случае некоррелированности компонент получаем:
и после финального преобразования чётко видно, что перед нами произведение нормальных плотностей случайных величин . Таким образом, равенство справедливо и они независимы.
Дополнительную информацию и примеры можно найти в учебном пособии (новые издания) и задачнике В.Е. Гмурмана, ну а мой практикум подошёл к концу, и я надеюсь, что он оказался не только полезным, но ещё и интересным.
Желаю успехов!
Решения и ответы:
Пример 10. Решение:
1) Способ первый: нормальное распределения вероятностей задаётся плотностью . В нашем случае , и поэтому: на интервале . И из функции легко усмотреть, что на отрезке и вне этого отрезка.
И здесь ОБЯЗАТЕЛЬНО нужно проконтролировать, что: – функция действительно задаёт плотность распределения.
Способ второй. Используем формулы: , если и при иных значениях .
Вывод: так как , то случайные величины независимы.