Математика для заочников и не только

Высшая математика – просто и доступно!

Если сайт упал, используйте ЗЕРКАЛО: mathprofi.net

Наш форум, библиотека и блог mathprofi>>>

Высшая математика:

Математика для заочников
Математические формулы,
таблицы и справочные
материалы

Книги по математике
Математические сайты
>>> Удобный калькулятор

Не нашлось нужной задачи?
Сборники готовых решений!

Не получается пример?
Задайте вопрос на форуме!
>>> mathprofi.com   

Учимся решать:

Лекции-уроки по высшей математике для первого курса

Высшая математика для чайников, или с чего начать?

Аналитическая геометрия:

Векторы для чайников
Скалярное произведение
векторов

Линейная (не) зависимость
векторов. Базис векторов

Переход к новому базису
Векторное и смешанное
произведение векторов

Формулы деления отрезка
в данном отношении

Прямая на плоскости
Простейшие задачи
с прямой на плоскости

Линейные неравенства
Как научиться решать задачи
по аналитической геометрии?

Линии второго порядка. Эллипс
Гипербола и парабола
Задачи с линиями 2-го порядка
Как привести уравнение л. 2 п.
к каноническому виду?

Полярные координаты
Как построить линию
в полярной системе координат?

Уравнение плоскости
Прямая в пространстве
Задачи с прямой в пространстве
Основные задачи
на прямую и плоскость

Треугольная пирамида

Элементы высшей алгебры:

Множества и действия над ними
Основы математической логики
Формулы и законы логики
Уравнения высшей математики
Комплексные числа
Выражения, уравнения и с-мы
с комплексными числами

Действия с матрицами
Как вычислить определитель?
Свойства определителя
и понижение его порядка

Как найти обратную матрицу?
Свойства матричных операций.
Матричные выражения

Матричные уравнения
Как решить систему линейных уравнений?
Правило Крамера. Матричный метод решения системы
Метод Гаусса для чайников
Несовместные системы
и системы с общим решением

Как найти ранг матрицы?
Однородные системы
линейных уравнений

Метод Гаусса-Жордана
Решение системы уравнений
в различных базисах

Линейные преобразования
Собственные значения
и собственные векторы

Квадратичные формы
Как привести квадратичную
форму к каноническому виду?

Ортогональное преобразование
квадратичной формы

Пределы:

Пределы. Примеры решений
Замечательные пределы
Методы решения пределов
Бесконечно малые функции.
Эквивалентности

Правила Лопиталя
Сложные пределы
Пределы последовательностей
Пределы по Коши. Теория

Производные функций:

Как найти производную?
Производная сложной функции. Примеры решений
Логарифмическая производная
Производные неявной, параметрической функций
Простейшие задачи
с производной

Производные высших порядков
Что такое производная?
Производная по определению
Как найти уравнение нормали?
Приближенные вычисления
с помощью дифференциала

Метод касательных

Функции и графики:

Графики и свойства
элементарных функций

Как построить график функции
с помощью преобразований?

Непрерывность, точки разрыва
Область определения функции
Асимптоты графика функции
Интервалы знакопостоянства
Возрастание, убывание
и экстремумы функции

Выпуклость, вогнутость
и точки перегиба графика

Полное исследование функции
и построение графика

Наибольшее и наименьшее
значения функции на отрезке

Экстремальные задачи

ФНП:

Область определения функции
двух переменных. Линии уровня

Основные поверхности
Предел функции 2 переменных
Повторные пределы
Непрерывность функции 2п
Частные производные
Частные производные
функции трёх переменных

Производные сложных функций
нескольких переменных

Как проверить, удовлетворяет
ли функция уравнению?

Частные производные
неявно заданной функции

Производная по направлению
и градиент функции

Касательная плоскость и
нормаль к поверхности в точке

Экстремумы функций
двух и трёх переменных

Условные экстремумы
Наибольшее и наименьшее
значения функции в области

Метод наименьших квадратов

Интегралы:

Неопределенный интеграл.
Примеры решений

Метод замены переменной
в неопределенном интеграле

Интегрирование по частям
Интегралы от тригонометрических функций
Интегрирование дробей
Интегралы от дробно-рациональных функций
Интегрирование иррациональных функций
Сложные интегралы
Определенный интеграл
Как вычислить площадь
с помощью определенного интеграла?

Что такое интеграл?
Теория для чайников

Объем тела вращения
Несобственные интегралы
Эффективные методы решения
определенных и несобственных
интегралов

Как исследовать несобственный
интеграл на сходимость?

Признаки сходимости несобств.
интегралов второго рода

Абсолютная и условная
сходимость несобств. интеграла

S в полярных координатах
S и V, если линия задана
в параметрическом виде

Длина дуги кривой
S поверхности вращения
Приближенные вычисления
определенных интегралов


Метод прямоугольников

  Карта сайта

Лекции-уроки по высшей математике для второго курса

Дифференциальные уравнения:

Дифференциальные уравнения первого порядка
Однородные ДУ 1-го порядка
ДУ, сводящиеся к однородным
Линейные неоднородные дифференциальные уравнения первого порядка
Дифференциальные уравнения в полных дифференциалах
Уравнение Бернулли
Дифференциальные уравнения
с понижением порядка

Однородные ДУ 2-го порядка
Неоднородные ДУ 2-го порядка
Линейные дифференциальные
уравнения высших порядков

Метод вариации
произвольных постоянных

Как решить систему
дифференциальных уравнений

Задачи с диффурами
Методы Эйлера и Рунге-Кутты

Числовые ряды:

Ряды для чайников
Как найти сумму ряда?
Признак Даламбера.
Признаки Коши

Знакочередующиеся ряды. Признак Лейбница
Ряды повышенной сложности

Функциональные ряды:

Степенные ряды
Разложение функций
в степенные ряды

Сумма степенного ряда
Равномерная сходимость
Другие функциональные ряды
Приближенные вычисления
с помощью рядов

Вычисление интеграла разложением функции в ряд
Как найти частное решение ДУ
приближённо с помощью ряда?

Вычисление пределов
Ряды Фурье. Примеры решений

Кратные интегралы:

Двойные интегралы
Как вычислить двойной
интеграл? Примеры решений

Двойные интегралы
в полярных координатах

Как найти центр тяжести
плоской фигуры?

Тройные интегралы
Как вычислить произвольный
тройной интеграл?


Криволинейные интегралы
Интеграл по замкнутому контуру
Формула Грина. Работа силы

Поверхностные интегралы

Элементы векторного анализа:

Основы теории поля
Поток векторного поля
Дивергенция векторного поля
Формула Гаусса-Остроградского

Циркуляция векторного поля
и формула Стокса

Комплексный анализ:

Примеры решений типовых
задач комплексного анализа

Как найти функцию
комплексной переменной?

Решение ДУ методом
операционного исчисления

Как решить систему ДУ
операционным методом?

Теория вероятностей:

Основы теории вероятностей
Задачи по комбинаторике
Задачи на классическое
определение вероятности

Геометрическая вероятность
Задачи на теоремы сложения
и умножения вероятностей

Зависимые события
Формула полной вероятности
и формулы Байеса

Независимые испытания
и формула Бернулли

Локальная и интегральная
теоремы Лапласа

Статистическая вероятность
Случайные величины.
Математическое ожидание

Дисперсия дискретной
случайной величины

Функция распределения
Геометрическое распределение
Биномиальное распределение
Распределение Пуассона
Гипергеометрическое
распределение вероятностей

Непрерывная случайная
величина, функции F(x) и f(x)

Как вычислить математическое
ожидание и дисперсию НСВ?

Равномерное распределение
Показательное распределение
Нормальное распределение
Система случайных величин
Зависимые и независимые
случайные величины

Двумерная непрерывная
случайная величина

Зависимость и коэффициент
ковариации непрерывных СВ

Математическая статистика:

Математическая статистика
Дискретный вариационный ряд
Интервальный ряд
Мода, медиана, средняя
Показатели вариации
Формула дисперсии, среднее
квадратическое отклонение,
коэффициент вариации

Асимметрия и эксцесс
эмпирического распределения

Статистические оценки
и доверительные интервалы

Оценка вероятности
биномиального распределения

Оценки по повторной
и бесповторной выборке

Статистические гипотезы
Проверка гипотез. Примеры
Гипотеза о виде распределения
Критерий согласия Пирсона

Отблагодарить автора >>>

Если Вы заметили опечатку, пожалуйста, сообщите мне об этом

Заказать контрольную
Часто задаваемые вопросы
Гостевая книга

Поставьте нашу кнопку:

Высшая математика – просто и доступно!

По школьным предметам.
Подготовка к ЕГЭ

По высшей математике
и физике

Онлайн курсы для всех!



  Карта сайта


13. Гипотеза о законе распределения генеральной совокупности.
Критерий согласия Пирсона


Итак, после разгрома двух десятков задач ставим вишенку на торт статистических гипотез, а именно разбираем важнейшую гипотезу о виде (законе) распределения и распространённые тематические примеры.

Рассмотрим генеральную совокупность, распределение которой неизвестно.  Однако есть основание полагать, что она распределена по некоторому закону  (чаще всего, нормально). Это предположение может появиться как до, так и в результате статистического исследования, когда мы извлекли и изучили выборку объёма .

И нам требуется на уровне значимости  проверить нулевую гипотезу   о том, что генеральная совокупность распределена по закону против  конкурирующей гипотезы  о том, что она по нему НЕ распределена.

Как проверить эту гипотезу? Постараюсь объяснить кратко. Как вы знаете, выборочные данные группируются в дискретный или интервальный вариационный ряд с вариантами   и соответствующими частотами

Поскольку эти данные взяты из практического опыта, то выборочный вариационный ряд называют эмпирическим рядом, а частоты  эмпирическими частотами.

Далее строятся графики, рассчитываются выборочные характеристики (выборочная средняя , выборочная дисперсия  и другие), словом, выполняются все те хорошие дела, которыми мы занимались на протяжении многих уроков.

На основе некоторых выборочных характеристик по специальным формулам, которые зависят от проверяемого закона , строится теоретическое распределение, где для тех же вариант  рассчитываются теоретические частоты .

И возникает вопрос: значимо или незначимо различие между эмпирическими  и соответствующими теоретическими  частотами?

Для ответа на это вопрос рассматривают различные статистические критерии, которые называют критериями согласия, и наиболее популярный из них разработал Карл Пирсон:

При достаточно большом  (объёме выборки) распределение этой случайной величины близкО к распределению хи-квадрат с количеством степеней свободы , где  – количество оцениваемых параметров закона .

…всем понятно, почему величина  случайная? – по той причине, что в разных выборках мы будем получать разные, заранее непредсказуемые эмпирические частоты.

Далее строится правосторонняя критическая область:

Критическое значение  можно отыскать с помощью соответствующей таблицы или Экселя (Пункт 11б).

Наблюдаемое значение критерия рассчитывается по эмпирическим и найденным теоретическим частотам:

Если , то на уровне значимости  нет оснований отвергать гипотезу  о том, что генеральная совокупность распределена по закону . То есть, различие между эмпирическими и теоретическими частотами незначимо и обусловлено случайными факторами (случайностью самой выборки, способом группировки данных и т.д.)

Если , то нулевую гипотезу отвергаем, иными словами эмпирические и теоретические частоты отличаются значимо, и это различие вряд ли случайно.

Обратите внимание на формулировку, которую я выделил жирным цветом – такая формулировка напоминает нам о том, что принятие статистической гипотезы ещё означает её истинность, поскольку существует -вероятность того, что мы приняли неправильную гипотезу (совершили ошибку второго рода).

И, наконец, бараны коровы, которые нас уже заждались. Реалистичность фактических данных оставлю на совести автора методички сельскохозяйственной академии:

Пример 53

По результатам выборочного исследования найдено распределение средних удоев молока в фермерском хозяйстве (литров) от одной коровы за день:

На уровне значимости 0,05 проверить гипотезу о том, что генеральная совокупность (средний удой коров всей фермы) распределена нормально. Построить гистограмму частот и теоретическую кривую.

…если не любите молоко, то пусть это будет чай, сок, пиво или какой-то другой напиток, который вам нравится :) Чтобы было интереснее исследовать эту волшебную ферму.

Решение: на уровне значимости  проверим гипотезу  о нормальном распределении генеральной совокупности против конкурирующей гипотезы  о том, что она так НЕ распределена. Используем критерий  согласия Пирсона .

Эмпирические частоты известны из предложенного интервального ряда, и осталось найти теоретические. Для этого нужно вычислить выборочную среднюю  и выборочное стандартное отклонение .

Выберем в качестве вариант  середины частичных интервалов (длина каждого интервала ) и заполним расчётную таблицу:

Внимание! Если вы не понимаете, как заполнять эту таблицу, или не знаете, как это сделать быстро, то обязательно обратитесь к Примеру 16, там есть все объяснения и видео!

Вычислим выборочную среднюю:
 литра

Выборочную дисперсию вычислим по формуле:

И выборочное стандартное отклонение:
 литра.
По причине большого объёма выборки его исправлением можно пренебречь.

Теоретические частоты рассчитываются по формуле:
, где  – знакомая функция Гаусса, а .

Входные данные известны:   и мы заполняем ещё одну расчётную таблицу:

Все вычисления удобно проводить в Экселе и на всякий случай я распишу одну строчку:

 – здесь выгодно использоваться встроенную экселевскую функцию =НОРМРАСП(0,0330; 0; 1; 0), первый аргумент которой равен текущему значению . За неимением Экселя и калькулятора пользуйтесь стандартной таблицей, которая есть практически в любой книге по терверу.

И, наконец, теоретическая частота:
, довольно часто её округляют до целого значения, но без округления результат всё же точнее.

Надеюсь, на данный момент уже все умеют протягивать (копировать) формулы по образцу, а если нет, то я всё равно научу :) Решил таки записать отдельный ролик, хотя особой технической новизны тут нет:

// видео ожидается

Построим гистограмму эмпирических частот и теоретическую кривую, которая проходит через точки :

О технике построения гистограммы в MS Excel я рассказывал на уроке об интервальном ряде распределения, вот нужный ролик на Ютубе, и далее через правый клик к ней добавляется нормальная кривая.

И перед тем, как сравнивать теоретические и эмпирические частоты, следует объединить интервалы с малыми (меньше пяти) частотами. В данном случае объединяем два первых и два последних интервала, для этого суммируем частоты, обведённые красным цветом, и получаем оранжевые результаты:

Это нужно для того, чтобы сгладить неоправданно большое расхождением между малыми частотами по краям выборки. Действие не обязательное, но крайне желательное, ибо студентов на моей памяти из-за этого заставляли переделывать задание.

Найдём критическое значение  критерия согласия Пирсона. Количество степеней свободы определяется по формуле , где  – количество интервалов, а  – количество оцениваемых параметров рассматриваемого закона распределения.

Так как мы объединяли интервалы, то теперь их не девять, а .
У нормального закона мы оцениваем  параметра.

Пояснение:  – это оценка неизвестного генерального матоожидания, а  – это оценка неизвестного генерального стандартного отклонения, итого два оцениваемых параметра.

Таким образом,  и для уровня значимости :

Это значение можно найти по таблице критических значений распределения хи-квадрат или с помощью Калькулятора (Пункт 11б).

При  нулевая гипотеза отвергается, а при  таких оснований нет:

Вычислим наблюдаемое значение критерия , и для этого удобно заполнить ещё одну расчётную табличку:

На всякий пожарный пример расчёта: .

В нижней строке таблицы у нас получилось готовое значение , поэтому на уровне значимости 0,05 гипотезу  о нормальном распределении генеральной совокупности отвергаем.

Иными словами различие между эмпирическими и теоретическими частотами статистически значимо и вряд ли объяснимо случайными факторами.

Ответ: на уровне значимости 0,05 гипотезу о нормальном распределении отвергаем

В чём может быть причина? Ведь по теореме Ляпунова большинство коров не оказывают практически никакого влияния на удой других коров, и поэтому распределение ген. совокупности должно быть близкО к нормальному.

Причины могут быть разными. Например, неоднородный состав совокупности (коровы разной породы), или на ферме есть VIP-хлев, где коровы получают улучшенное питание :) А может быть, некоторые коровы больны и как раз оказывают существенное влияние на остальных, в связи с чем нарушается условие теоремы Ляпунова.

Интересно отметить, что при уменьшении уровня значимости до 0,01 критическое значение , и гипотеза о нормальном распределении уже принимается. Однако не нужно забывать, что здесь выросла -вероятность того, что мы приняли неправильную гипотезу. С оценкой этой вероятности можно ознакомиться в специализированной литературе по статистике.

И, конечно, в случае сомнений имеет смысл увеличить объём выборки, чтобы провести повторное исследование.

Рассмотренная задача может встретиться в более простой или более сложной формулировке. В версии-«лайт» вам предложат готовые теоретические частоты, где остаётся только проверить гипотезу. Продвинутое же условие звучит примерно так:

На основании исследования выборки выдвинуть гипотезу о законе распределения генеральной совокупности

То есть, здесь не говорится о том, что предполагаемый закон нормальный (или какой-то другой) – этот вопрос вам предлагается проанализировать самостоятельно.

Каким образом это можно сделать?

Во-первых, гипотезу можно выдвинуть априорно, даже не исследуя выборку, и зависеть она будет от содержания задачи. Так, для коров используем упомянутую выше теорему Ляпунова: если каждый объект совокупности оказывается несущественное влияние на всю совокупность, то её распределение близкО к нормальному. Если речь идёт о погрешностях округления, то распределены они обычно равномерно. Если распадаются радиоактивные изотопы, то, скорее всего, по экспоненциальному закону. И так далее.

Но по условию, требуют опираться на выборочные данные, и здесь есть сразу несколько признаков, чтобы «вычислить» этот закон. Самый простой и наглядный способ – графический. Грубо говоря, чертим и смотрим. Интервальный вариационный ряд чаще всего изображают гистограммой, возвращаемся к нашим коровам:

Построенная гистограмма по форме напоминает колоколообразный график плотности нормального распределения, и это является веской причиной предположить, что генеральная совокупность распределена нормально. Да, здесь есть слишком высокий средний столбик, но, возможно, это просто случайность выборки.

Если столбики примерно одинаковы по высоте, то предполагаем, что генеральная совокупность распределена равномерно. Для показательного распределения тоже будет своя, характерная гистограмма.

Следующие признаки аналитические, приведу их для нормального распределения:

1) У нормального распределения математическое ожидание совпадает с модой и медианой. В нашем случае соответствующие выборочные показатели весьма близкИ друг к другу (матожидание оценивается выборочной средней):

  (литры)

Желающие могут рассчитать моду и медиану самостоятельно. Впрочем, желающими часто становятся поневоле, поскольку задача, которую мы рассматриваем, нередко идёт в комплексе со всеми этими заданиями.

2) Выполнение правила «трёх» сигм. Практически все значения нормальной случайной величины находятся в интервале . Найдём этот интервал для нашей выборки. Матожидание «а» оценивается выборочной средней , а стандартное отклонение «сигма» – выборочным стандартным отклонением .Таким образом, наш эмпирический интервал:


 – и в него действительно попадают все коровы!

3) Коэффициенты асимметрии и эксцесса нормального распределения равны нулю. В нашем случае эти характеристики не сказать  что сильно, но довольно близкИ к нулю:

На практике в исследование желательно включить все пункты за исключением, возможно, третьего (т.к. асимметрию и эксцесс рассчитывают далеко не всегда).

Следует отметить, что перечисленные выше предпосылки ещё не означают, что распределение нормально или то, что соответствующая гипотеза будет принята. В чём мы недавно и убедились.

И теперь настал момент продолжить решение нашего «экзаменационного» задания:

Пример 20, продолжение:

Если вы не прорешали предыдущие пункты, то настоятельно рекомендую это сделать, ну или просто взять готовые числа из образца:

6) По найденным характеристикам сделать вывод о законе эмпирического ряда распределения.

7) Построить нормальную кривую по опытным данным на графике гистограммы.

8) Произвести оценку степени близости теоретического распределения эмпирическому ряду с помощью критерия согласия Пирсона на уровне значимости 0,05.

Как видите, Пункт 6 как раз на обоснование предполагаемого закона распределения. Краткое решение в конце этого урока.

И, конечно же, ещё одна задача, передаю привет студентам Университета путей сообщения:

Пример 54

В результате проверки 500 контейнеров со стеклянными изделиями установлено, что число повреждённых изделий  имеет следующее эмпирическое распределение:

( – количество повреждённых изделий в контейнере,  – количество контейнеров)

С помощью критерия согласия Пирсона на уровне значимости 0,05 проверить гипотезу о том, что случайная величина  – число повреждённых изделий распределена по закону Пуассона.

…здесь тоже представьте изделия по своему интересу :)

Все числа уже забиты в макет, придерживайтесь следующего алгоритма:

1) Находим выборочную среднюю . Это значение будет оценкой параметра «лямбда» теоретического распределения .

2) Находим значения  для . Вычисления можно проводить на обычном калькуляторе, но удобнее использовать экселевскую функцию =ПУАССОН, Калькулятор (Пункт 7) в помощь.

3) Находим теоретические частоты

4) Находим критическое значение  критерия согласия Пирсона, где . В данной задаче мы объединяем две последние варианты ввиду их малых частот, следовательно, . Оценивается один параметр («лямбда»), поэтому .

5) Рассчитываем наблюдаемое значение критерия  и делаем вывод.

Примерный образец чистового оформления задачи в конце урока.

Помимо разобранных примеров, в задачнике В. Е. Гмурмана можно найти аналогичные задачи для биномиального, равномерного и показательного распределения, но лично в моей практике они почти не встречались.

Ну а этот урок и тема подошли к концу, и я надеюсь, вам было хорошо. Но математическая статистика ни в коем случае не закончилась! – есть ещё порох, есть зажигательные разделы, о которых нужно непременно рассказать.

Желаю успехов и до скорых встреч!

Решения и ответы:

Пример 20. Решение (продолжение):

6) Проанализируем полученные результаты:

Форма гистограммы похожа на нормальную кривую.

Выборочная средняя, мода и медиана достаточно близкИ друг другу:

Построим интервал :

 – в данный интервал попали все выборочные значения.

Асимметрия практически равна нулю , однако, эксцесс отличается значительно .

Перечисленные признаки позволяют предположить, что генеральная совокупность распределена нормально.

7) Найдём теоретические частоты:
, где , ,
 в данной задаче :

Построим гистограмму частот и теоретическую кривую:

8) Проверим гипотезу  о том, что генеральная совокупность распределена нормально. Используем критерий согласия Пирсона. Для уровня значимости  и количества степеней свободы  по соответствующей таблице находим критическое значение:

При  выдвинутую гипотезу отвергаем, а при  нет оснований отвергать гипотезу.

Вычислим наблюдаемое значение критерия . Заполним расчётную таблицу:

В результате: , поэтому на уровне значимости 0,05 нет оснований отвергать гипотезу о нормальном распределении генеральной совокупности.

Пример 54. Решение: проверим гипотезу  о том, что генеральная совокупность распределена по закону Пуассона. Используем критерий согласия Пирсона. Вычислим произведения , выборочную среднюю  и теоретические частоты по формуле , где .
Вычисления сведём в таблицу:

Объединяем две последние варианты ввиду их малых частот и находим критическое значение для уровня значимости  и количества степеней свободы :


Вычислим наблюдаемое значение критерия :

Таким образом, , поэтому на уровне значимости нет оснований отвергать гипотезу  о том, что генеральная совокупность распределена по закону Пуассона.

Автор: Емелин Александр


 Блог Емелина Александра

Высшая математика для заочников и не только >>>

(Переход на главную страницу)

Как можно отблагодарить автора?

Профессиональная помощь по любому предмету – Zaochnik.com


© Copyright mathprofi.ru, Александр Емелин, 2010-2020. Копирование материалов сайта запрещено