Двумерное нормальное распределение. Нормальное распределение системы случайных величин

Рассмотрим систему двух случайных непрерывных величин . Законом распределения этой системы является нормальный закон распределения, если функция плотности вероятности этой системы имеет вид

. (1.18.35)

Можно показать, что здесь – математические ожидания случайных величин, – их среднеквадратические отклонения, – коэффициент корреляции величин . Вычисления по формулам (1.18.31) и (1.18.35) дают

. (1.18.36)

Легко видеть, что если случайные величины , распределенные по нормальному закону не коррелированны , то они являются также и независимыми

.

Таким образом, для нормального закона распределения не коррелированность и независимость – эквивалентные понятия.

Если , то случайные величины зависимы. Условные законы распределения вычисляются по формулам (1.18.20)

. (1.18.37)

Оба закона (1.18.37) представляют собой нормальные распределения. В самом деле, преобразуем, например, второе из соотношений (1.18.37) к виду

.

Это действительно нормальный закон распределения, у которого условное математическое ожидание равно

, (1.18.38)

а условное среднеквадратичное отклонение выражается формулой

. (1.18.39)

Отметим, что в условном законе распределения величины при фиксированном значении от этого значения зависит только условное математическое ожидание, но не условная дисперсия – .

На координатной плоскости зависимость (1.18.38) представляет собой прямую линию

, (1.18.40)

которая называется линией регрессии на .

Совершенно аналогично устанавливается, что условное распределение величины при фиксированном значении

, (1.18.41)

есть нормальное распределение с условным математическим ожиданием

, (1.18.42)

условным среднеквадратичным отклонением

. (1.18.43)

В этом случае линия регрессии имеет вид

. (1.18.44)

Линии регрессии (1.18.40) и (1.18.44) совпадают только тогда, когда зависимость между величинами и является линейной. Если величины и независимы, линии регрессии параллельны координатным осям.

Конец работы -

Эта тема принадлежит разделу:

Конспект лекций по математике теория вероятностей математическая статистика

Кафедра высшей математики и информатики.. конспект лекций.. по математике..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Теория вероятностей
Теория вероятностей – раздел математики, в котором изучаются закономерности случайных массовых явлений. Случайным называется явление, которо

Статистическое определение вероятности
Событием называется случайное явление, которое в результате опыта может появится или не появится (двузначное явление). Обозначают события большими латинскими буквами

Пространство элементарных событий
Пусть с некоторым опытом связано множество событий, причем: 1) в результате опыта появляется одно и только одно

Действия на событиями
Суммой двух событий и

Перестановки
Число различных перестановок из элементов обозначается

Размещения
Размещением из элементов по

Сочетания
Сочетанием из элементов по

Формула сложения вероятностей для несовместных событий
Теорема. Вероятность суммы двух несовместных событий равна сумме вероятностей этих событий. (1

Формула сложения вероятностей для произвольных событий
Теорема. Вероятность суммы двух событий равна сумме вероятностей этих событий без вероятности их произведения.

Формула умножения вероятностей
Пусть даны два события и. Рассмотрим событие

Формула полной вероятности
Пусть – полная группа несовместных событий, их называют гипотезами. Рассмотрим некоторое событие

Формула вероятностей гипотез (Байеса)
Рассмотрим снова – полную группу несовместных гипотез и событие

Асимптотическая формула Пуассона
В тех случаях, когда число испытаний велико, а вероятность появления события

Случайные дискретные величины
Случайной называется величина, которая при повторении опыта может принимать неодинаковые числовые значения. Случайная величина называется дискретной,

Случайные непрерывные величины
Если в результате опыта случайная величина может принимать любое значение из некоторого отрезка или всей действительной оси, то она называется непрерывной. Законо

Функция плотности вероятности случайной непрерывной величины
Пусть. Рассмотрим точку и дадим ей приращени

Числовые характеристики случайных величин
Случайная дискретная или непрерывная величины считаются полностью заданными, если известны их законы распределения. В самом деле, зная законы распределения можно всегда вычислить вероятность попада

Квантили случайных величин
Квантилем порядка случайной непрерывной величины

Математическое ожидание случайных величин
Математическое ожидание случайной величины характеризует ее среднее значение. Все значения случайной величины группируются вокруг этого значения. Рассмотрим сначала случайную дискретную величину

Среднеквадратичное отклонение и дисперсия случайных величин
Рассмотрим сначала случайную дискретную величину. Числовые характеристики мода, медиана, квантили и математическое ожида

Моменты случайных величин
Кроме математического ожидания и дисперсии в теории вероятностей используются числовые характеристики более высоких порядков, которые называются моментами случайных величин.

Теоремы о числовых характеристиках случайных величин
Теорема 1. Математическое ожидание неслучайной величины равно самой этой величине. Доказательство:Пусть

Биномиальный закон распределения

Закон распределения Пуассона
Пусть случайная дискретная величина, принимающая значения

Равномерный закон распределения
Равномерным законом распределения случайной непрерывной величины называется закон функция плотности вероятности, которого

Нормальный закон распределения
Нормальным законом распределения случайной непрерывной величины называется закон функция плотност

Экспоненциальный закон распределения
Экспоненциальное или показательное распределение случайной величины применяется в таких приложениях теории вероятностей, как теория массового обслуживания, теория надежности

Системы случайных величин
На практике в приложениях теории вероятностей часто приходиться сталкиваться с задачами, в которых результаты эксперимента описываются не одной случайной величиной, а сразу несколькими случайными в

Система двух случайных дискретных величин
Пусть две случайные дискретные величины образуют систему. Случайная величина

Система двух случайных непрерывных величин
Пусть теперь систему образуют две случайные непрерывные величины. Законом распределения этой системы называется вероятно

Условные законы распределения
Пусть и зависимые случайные непрерывные велич

Числовые характеристики системы двух случайных величин
Начальным моментом порядка системы случайных величин

Система нескольких случайных величин
Полученные результаты для системы их двух случайных величии могут быть обобщены на случай систем, состоящих из произвольного числа случайных величин. Пусть система образована совокупностью

Предельные теоремы теории вероятностей
Основной целью дисциплины теория вероятностей является изучение закономерностей случайных массовых явлений. Практика показывает, что наблюдение массы однородных случайных явлений обнаружив

Неравенство Чебышева
Рассмотрим случайную величину с математическим ожиданием

Теорема Чебышева
Если случайные величины попарно независимы и имеют конечные ограниченные в совокупности дисперсии

Теорема Бернулли
При неограниченном увеличении числа опытов частота появления события сходится по вероятности к вероятности события

Центральная предельная теорема
При сложении случайных величин с любыми законами распределения, но с ограниченными в совокупности дисперсиями, закон расп

Основные задачи математической статистики
Рассмотренные выше законы теории вероятностей представляют собой математическое выражение реальных закономерностей, фактически существующих в различных случайных массовых явлениях. Изучая

Простая статистическая совокупность. Статистическая функция распределения
Рассмотрим некоторую случайную величину, закон распределения которой неизвестен. Требуется на основании опытных данных о

Статистический ряд. Гистограмма
При большом числе наблюдений (порядка сотен) генеральная совокупность становится неудобной и громоздкой для записи статистического материала. Для наглядности и компактности статистический материал

Числовые характеристики статистического распределения
В теории вероятностей рассматривались различные числовые характеристики случайных величин: математическое ожидание, дисперсию, начальные и центральные моменты различных порядков. Аналогичные числов

Выбор теоретического распределения по методу моментов
Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с ограниченностью числа наблюдений. При большом числе наблюдений эти элементы случайности сглаживаются,

Проверка правдоподобия гипотезы о виде закона распределения
Пусть заданное статистическое распределение аппроксимировано некоторой теоретической кривой или

Критерии согласия
Рассмотрим один из наиболее часто применяемых критериев согласия – так называемый критерий Пирсона. Предположи

Точечные оценки для неизвестных параметров распределения
В п.п. 2.1. – 2.7 мы подробно рассмотрели способы решения первой и второй основных задач математической статистики. Это задачи определения законов распределения случайных величин по опытным данным

Оценки для математического ожидания и дисперсии
Пусть над случайной величиной с неизвестными математическим ожиданием

Доверительный интервал. Доверительная вероятность
На практике при малом числе опытов над случайной величиной приближенная замена неизвестного параметра

Нормальный закон распределения вероятностей

Без преувеличения его можно назвать философским законом. Наблюдая за различными объектами и процессами окружающего мира, мы часто сталкиваемся с тем, что чего-то бывает мало, и что бывает норма:


Перед вами принципиальный вид функции плотности нормального распределения вероятностей, и я приветствую вас на этом интереснейшем уроке.

Какие можно привести примеры? Их просто тьма. Это, например, рост, вес людей (и не только), их физическая сила, умственные способности и т.д. Существует «основная масса» (по тому или иному признаку) и существуют отклонения в обе стороны.

Это различные характеристики неодушевленных объектов (те же размеры, вес). Это случайная продолжительность процессов…, снова пришёл на ум грустный пример, и поэтому скажу время «жизни» лампочек:) Из физики вспомнились молекулы воздуха: среди них есть медленные, есть быстрые, но большинство двигаются со «стандартными» скоростями.

Далее отклоняемся от центра ещё на одно стандартное отклонение и рассчитываем высоту:

Отмечаем точки на чертеже (зелёный цвет) и видим, что этого вполне достаточно.

На завершающем этапе аккуратно чертим график, и особо аккуратно отражаем его выпуклость / вогнутость ! Ну и, наверное, вы давно поняли, что ось абсцисс – это горизонтальная асимптота , и «залезать» за неё категорически нельзя!

При электронном оформлении решения график легко построить в Экселе, и неожиданно для самого себя я даже записал короткий видеоролик на эту тему. Но сначала поговорим о том, как меняется форма нормальной кривой в зависимости от значений и .

При увеличении или уменьшении «а» (при неизменном «сигма») график сохраняет свою форму и перемещается вправо / влево соответственно. Так, например, при функция принимает вид и наш график «переезжает» на 3 единицы влево – ровнехонько в начало координат:


Нормально распределённая величина с нулевым математическим ожиданием получила вполне естественное название – центрированная ; её функция плотности чётная , и график симметричен относительно оси ординат.

В случае изменения «сигмы» (при постоянном «а») , график «остаётся на месте», но меняет форму. При увеличении он становится более низким и вытянутым, словно осьминог, растягивающий щупальца. И, наоборот, при уменьшении график становится более узким и высоким – получается «удивлённый осьминог». Так, при уменьшении «сигмы» в два раза: предыдущий график сужается и вытягивается вверх в два раза:

Всё в полном соответствии с геометрическими преобразованиями графиков .

Нормальное распределёние с единичным значением «сигма» называется нормированным , а если оно ещё и центрировано (наш случай), то такое распределение называют стандартным . Оно имеет ещё более простую функцию плотности, которая уже встречалась в локальной теореме Лапласа : . Стандартное распределение нашло широкое применение на практике, и очень скоро мы окончательно поймём его предназначение.

Ну а теперь смотрим кино:

Да, совершенно верно – как-то незаслуженно у нас осталась в тени функция распределения вероятностей . Вспоминаем её определение :
– вероятность того, что случайная величина примет значение, МЕНЬШЕЕ, чем переменная , которая «пробегает» все действительные значения до «плюс» бесконечности.

Внутри интеграла обычно используют другую букву, чтобы не возникало «накладок» с обозначениями, ибо здесь каждому значению ставится в соответствие несобственный интеграл , который равен некоторому числу из интервала .

Почти все значения не поддаются точному расчету, но как мы только что видели, с современными вычислительными мощностями с этим нет никаких трудностей. Так, для функции стандартного распределения соответствующая экселевская функция вообще содержит один аргумент:

=НОРМСТРАСП(z)

Раз, два – и готово:

На чертеже хорошо видно выполнение всех свойств функции распределения , и из технических нюансов здесь следует обратить внимание на горизонтальные асимптоты и точку перегиба .

Теперь вспомним одну из ключевых задач темы, а именно выясним, как найти –вероятность того, что нормальная случайная величина примет значение из интервала . Геометрически эта вероятность равна площади между нормальной кривой и осью абсцисс на соответствующем участке:

но каждый раз вымучивать приближенное значение неразумно, и поэтому здесь рациональнее использовать «лёгкую» формулу :
.

! Вспоминает также , что

Тут можно снова задействовать Эксель, но есть пара весомых «но»: во-первых, он не всегда под рукой, а во-вторых, «готовые» значения , скорее всего, вызовут вопросы у преподавателя. Почему?

Об этом я неоднократно рассказывал ранее: в своё время (и ещё не очень давно) роскошью был обычный калькулятор, и в учебной литературе до сих пор сохранился «ручной» способ решения рассматриваемой задачи. Его суть состоит в том, чтобы стандартизировать значения «альфа» и «бета», то есть свести решение к стандартному распределению:

Примечание : функцию легко получить из общего случая с помощью линейной замены . Тогда и:

и из проведённой замены как раз следует формула перехода от значений произвольного распределения – к соответствующим значениям стандартного распределения.

Зачем это нужно? Дело в том, что значения скрупулезно подсчитаны нашими предками и сведены в специальную таблицу, которая есть во многих книгах по терверу. Но ещё чаще встречается таблица значений , с которой мы уже имели дело в интегральной теореме Лапласа :

Если же в нашем распоряжении есть таблица значений функции Лапласа , то решаем через неё:

Дробные значения традиционно округляем до 4 знаков после запятой, как это сделано в типовой таблице. И для контроля есть Пункт 5 макета .

Напоминаю, что , и во избежание путаницы всегда контролируйте , таблица КАКОЙ функции перед вашими глазами.

Ответ требуется дать в процентах, поэтому рассчитанную вероятность нужно умножить на 100 и снабдить результат содержательным комментарием:

– с перелётом от 5 до 70 м упадёт примерно 15,87% снарядов

Тренируемся самостоятельно:

Пример 3

Диаметр подшипников, изготовленных на заводе, представляет собой случайную величину, распределенную нормально с математическим ожиданием 1,5 см и средним квадратическим отклонением 0,04 см. Найти вероятность того, что размер наугад взятого подшипника колеблется от 1,4 до 1,6 см.

В образце решения и далее я буду использовать функцию Лапласа, как самый распространённый вариант. Кстати, обратите внимание, что согласно формулировке, здесь можно включить концы интервала в рассмотрение. Впрочем, это не критично.

И уже в этом примере нам встретился особый случай – когда интервал симметричен относительно математического ожидания. В такой ситуации его можно записать в виде и, пользуясь нечётностью функции Лапласа, упростить рабочую формулу:


Параметр «дельта» называют отклонением от математического ожидания, и двойное неравенство можно «упаковывать» с помощью модуля :

– вероятность того, что значение случайной величины отклонится от математического ожидания менее чем на .

Хорошо то решение, которое умещается в одну строчку:)
– вероятность того, что диаметр наугад взятого подшипника отличается от 1,5 см не более чем на 0,1 см.

Результат этой задачи получился близким к единице, но хотелось бы ещё бОльшей надежности – а именно, узнать границы, в которых находится диаметр почти всех подшипников. Существует ли какой-нибудь критерий на этот счёт? Существует! На поставленный вопрос отвечает так называемое

правило «трех сигм»

Его суть состоит в том, что практически достоверным является тот факт, что нормально распределённая случайная величина примет значение из промежутка .

И в самом деле, вероятность отклонения от матожидания менее чем на составляет:
или 99,73%

В «пересчёте на подшипники» – это 9973 штуки с диаметром от 1,38 до 1,62 см и всего лишь 27 «некондиционных» экземпляров.

В практических исследованиях правило «трёх сигм» обычно применяют в обратном направлении: если статистически установлено, что почти все значения исследуемой случайной величины укладываются в интервал длиной 6 стандартных отклонений, то появляются веские основания полагать, что эта величина распределена по нормальному закону. Проверка осуществляется с помощью теории статистических гипотез , до которых я надеюсь рано или поздно добраться:)

Ну а пока продолжаем решать суровые советские задачи:

Пример 4

Случайная величина ошибки взвешивания распределена по нормальному закону с нулевым математическим ожиданием и стандартным отклонением 3 грамма. Найти вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей по модулю 5 грамм.

Решение очень простое. По условию, и сразу заметим, что при очередном взвешивании (чего-то или кого-то) мы почти 100% получим результат с точностью до 9 грамм. Но в задаче фигурирует более узкое отклонение и по формуле :

– вероятность того, что очередное взвешивание будет проведено с ошибкой, не превышающей 5 грамм.

Ответ :

Прорешанная задача принципиально отличается от вроде бы похожего Примера 3 урока о равномерном распределении . Там была погрешность округления результатов измерений, здесь же речь идёт о случайной погрешности самих измерений. Такие погрешности возникают в связи с техническими характеристиками самого прибора (диапазон допустимых ошибок, как правило, указывают в его паспорте) , а также по вине экспериментатора – когда мы, например, «на глазок» снимаем показания со стрелки тех же весов.

Помимо прочих, существуют ещё так называемые систематические ошибки измерения. Это уже неслучайные ошибки, которые возникают по причине некорректной настройки или эксплуатации прибора. Так, например, неотрегулированные напольные весы могут стабильно «прибавлять» килограмм, а продавец систематически обвешивать покупателей. Или не систематически ведь можно обсчитать. Однако, в любом случае, случайной такая ошибка не будет, и её матожидание отлично от нуля.

…срочно разрабатываю курс по подготовке продавцов =)

Самостоятельно решаем обратную задачу:

Пример 5

Диаметр валика – случайная нормально распределенная случайная величина, среднее квадратическое отклонение ее равно мм. Найти длину интервала, симметричного относительно математического ожидания, в который с вероятностью попадет длина диаметра валика.

Пункт 5* расчётного макета в помощь. Обратите внимание, что здесь не известно математическое ожидание, но это нисколько не мешает решить поставленную задачу.

И экзаменационное задание, которое я настоятельно рекомендую для закрепления материала:

Пример 6

Нормально распределенная случайная величина задана своими параметрами (математическое ожидание) и (среднее квадратическое отклонение). Требуется:

а) записать плотность вероятности и схематически изобразить ее график;
б) найти вероятность того, что примет значение из интервала ;
в) найти вероятность того, что отклонится по модулю от не более чем на ;
г) применяя правило «трех сигм», найти значения случайной величины .

Такие задачи предлагаются повсеместно, и за годы практики мне их довелось решить сотни и сотни штук. Обязательно попрактикуйтесь в ручном построении чертежа и использовании бумажных таблиц;)

Ну а я разберу пример повышенной сложности:

Пример 7

Плотность распределения вероятностей случайной величины имеет вид . Найти , математическое ожидание , дисперсию , функцию распределения , построить графики плотности и функции распределения, найти .

Решение : прежде всего, обратим внимание, что в условии ничего не сказано о характере случайной величины. Само по себе присутствие экспоненты ещё ничего не значит: это может оказаться, например, показательное или вообще произвольное непрерывное распределение . И поэтому «нормальность» распределения ещё нужно обосновать:

Так как функция определена при любом действительном значении , и её можно привести к виду , то случайная величина распределена по нормальному закону.

Приводим. Для этого выделяем полный квадрат и организуем трёхэтажную дробь :


Обязательно выполняем проверку, возвращая показатель в исходный вид:

, что мы и хотели увидеть.

Таким образом:
– по правилу действий со степенями «отщипываем» . И здесь можно сразу записать очевидные числовые характеристики:

Теперь найдём значение параметра . Поскольку множитель нормального распределения имеет вид и , то:
, откуда выражаем и подставляем в нашу функцию:
, после чего ещё раз пробежимся по записи глазами и убедимся, что полученная функция имеет вид .

Построим график плотности:

и график функции распределения :

Если под рукой нет Экселя и даже обычного калькулятора, то последний график легко строится вручную! В точке функция распределения принимает значение и здесь находится

6 страниц (Word-файл)

Посмотреть все страницы

Необходимость. Дано: X и Y – независимы, т.е. закон распределения одной из них, скажем X, не зависит от значения Y , но закон распределения определяется плотностью, следовательно, плотность X не зависит от значения Y

- f 1 (x / y )= f 1 (x ) , но тогда в соответствии с формулой (4.6)

или f (x , y )= f 1 (x ) f 2 (y ).

Достаточность. Дано f (x , y )= f 1 (x ) f 2 (y ). В соответствии с формулой (4.6)

f 1 (x / y )= f 1 (x ), т.е. закон распределения X, определяемый плотностью, не зависит от значения величины Y, следовательно, X и Y независимы.

Упражнение1. Доказать, что составляющие системы случайных величин, распределенных равномерно в круге (см. пример 2) некоррелированы, но зависимы.

2. Двухмерный нормальный закон распределения.

Система случайных величин (X,Y) подчиняется двухмерному нормальному закону распределения, если она определена на всей координатной плоскости xOy и плотность системы определяется формулой

где a X , a Y - математические ожидания случайных величин X, Y ;

- дисперсии этих величин;

r – их коэффициент корреляции, причем -1< r <1.

Отметим, что здесь, как и в случае одной случайной величины, плотность нормального закона обозначается не буквой f, а буквой .

3-е свойство коэффициента корреляции или условие независимости нормальных случайных величин. Если случайные величины X и Y подчиняются нормальному закону и коэффициент корреляции равен нулю, то случайные величины независимы.

Действительно, пусть r=0 , тогда плотность (7.1) будет иметь вид

= где и – плотности величин X и Y соответственно.

Таким образом, выполняется условие независимости непрерывных случайных величин и, следовательно, X и Y независимы. Как мы видим, для случайных величин, имеющих нормальный закон распределения, необходимое условие независимости становится достаточным.

3. Условные плотности системы нормальных случайных величин.

Прямые регрессии.

Для удобства преобразований введем обозначения

(8.1)

Тогда плотность системы (7.1) можно записать так

а плотность нормальной случайной величины X

Условная плотность(4.5) будет равна

(u 2 -2 ru

Отметим, что функция y=exp(x) – это показательная функция y=e x , поэтому при делении аргумента этой функции (показатели степени) вычитаются. Преобразуем отдельно показатель степени

(u 2 -2 ru=

(u 2 -2 ru (

Учитывая формулы (87.1) и (8.2) , получим, что показатель степени равен


Таким образом, условная плотность равна

= -. (8.3)

Это плотность нормальной случайной величины

= -,

где a y / x – условное математическое ожидание, а - условная дисперсия случайной величины Y при условии, что X=x. Поэтому уравнение регрессии (4.9) для случайных величин, подчиненных нормальному закону, имеет вид

M(Y/x) = a Y + r ). (8.4)

Аналогично, в силу симметричности плотности получим и уравнение регрессии X и Y

M(X / y ) = a x + r . (8.5)

Условные дисперсии соответственно равны

D (Y / x )= ) ,

D (X / y )= ).

Функции (8.4) и (8.5) – линейные, следовательно, линии регрессии – прямые, причем обе они проходят через центр распределения системы, т.е. через точку с координатами (a x , a Y )

Известная формула нахождения «нормального веса» человека по его росту V=L-100, где V – вес, кг; а L – рост, см, есть не что иное, как уравнение регрессии и V – это средний вес для роста L.

Условные коэффициенты прямых регрессии равны

k x / Y = r k Y / x = r (8.6)

и знаки угловых коэффициентов совпадают со знаком коэффициента корреляции, поэтому, если r >0, то прямые регрессии (8.4) и (8.5) обе возрастающие, а если r <0, то обе прямые – убывающие. Это позволяет сформулировать еще два свойства коэффициента корреляции:

Если система случайных величин подчиняется нормальному закону и коэффициент корреляции удовлетворяет неравенству -1

4-е свойство коэффициента корреляции. Если система случайных величин подчиняется нормальному закону и коэффициент корреляции удовлетворяет неравенству 0

На рис. 2 приведены условные плотности X для некоторых значений Y и прямая регрессии для r>0.

9. Средняя квадратическая регрессия.

Рассмотрим систему случайных величин (X,Y). Подберем такую функцию f(x), чтобы средний квадрат отклонения случайной величины Y от этой функции случайной величины X был минимальным, т.е. чтобы эта функция обеспечивала минимум математического ожидания квадрата отклонения Y от f(X). Иными словами, стоит задача из всех возможных функций выбрать такую, которая обеспечивает

(9.1)

Доказано, что этот минимум достигается, если f (x ) , определяемой уравнением регрессии Y на X (4.9). Однако, если уравнение регрессии неизвестно, то найти такую функцию из (9.1) невозможно. Поэтому решают задачу отыскания минимума выражения (9.1) для функций данного вида f(A,x), где A= (a 1 ,…. a ) – вектор коэффициента этой функции, т.е. ищется не сама функция обеспечивающая минимум среднего квадрата отклонения Y от f (X ) , а определяются коэффициенты заранее выбранной функции (например, линейной определяются коэффициенты заранее выбранной функции (например, линейной y= x + b , или квадратичной y = ax 2 + bx + c , или функции какого-нибудь другого вида) так, чтобы из всех функций выбранного вида, функция с этими коэффициентами обеспечивала минимум среднего квадрата отклонения Y от f (A , X ). Иными словами, нужно найти такой вектор коэффициента А, чтобы функция переменных

S=(A)=S() = M((Y-f(A,X)) 2) (9.2)

д остигала минимума .

Пусть A * =(a ,……, a ) обеспечивает этот минимум, т.е. является точкой минимума функции S(A). Тогда уравнение y= f (A * , x ) называется уравнением средней квадратической регрессии, а случайная величина Y * = f (A * , X ) приближением случайной величины Y функций данного вида случайной величины X , найденной по методу наименьших квадратов (МНК). Коэффициенты этой функции А * =(a ,……, a ) называется коэффициентами регрессии.

В теории вероятностей и её приложениях большую роль играет двумерное нормальное распределение. Плотность двумерной нормальной случайной величины (X,Y) имеет вид

Здесь - математические ожидания величин X и Y; - средние квадратичные отклонения величин X и Y; r – коэффициент корреляции величин X и Y.

Предположим, что случайные величины X и Y не коррелированы, то есть r=0. Тогда имеем:

(53)

Получили, что плотность распределения системы двух случайных величин (X,Y) равна произведению плотностей распределения компонент X и Y, а это значит, что X и Y – независимые случайные величины.

Таким образом, доказана следующая теорема : из некоррелированности нормально распределенных случайных величин следует их независимость . Поскольку из независимости любых случайных величин следует их некоррелированность, то можно сделать вывод, что термины «некоррелированные» и «независимые» величины для случая нормального распределения эквивалентны.

Приведём формулы для вероятности попадания нормально распределённой двумерной случайной величины в различные области на плоскости.

Пусть случайный вектор (X,Y), компоненты которого независимы, распределён по нормальному закону (53). Тогда вероятность попадания случайной точки (X,Y) в прямоугольник R, стороны которого параллельны координатным осям, равна

y R d c х a b (54)

где - функция Лапласа. Эта функция табулирована.

Пусть плотность распределения нормального закона системы случайных величин (X,Y) задана в виде (52). Ясно, что данная плотность сохраняет постоянное значение на эллипсах:

где С – постоянная; на этом основании такие эллипсы носят название эллипсов равных вероятностей . Можно показать, что вероятность попадания точки (X,Y) внутрь эллипса равной вероятности равна

(56)

Пример 10 . Случайные величины X и Y независимы и нормально распределены с Найти вероятность того, что случайная точка (X,Y) попадет в кольцо



Решение: Так как случайные величины X и Y независимы, то они не коррелированы и, следовательно, r = 0. Подставляя в (С), получаем

то есть эллипс равной вероятности выродился в круг равной вероятности. Тогда

Ответ: 0,1242.

3.2. Общий случай n-мерного нормального распределения

Плотность нормального распределения системы n случайных величин имеет вид:

где - определитель матрицы С - обратной к ковариационной матрице; - математическое ожидание случайной величины Х i - i-той компоненты n -мерного нормального случайного вектора.

Из общего выражения вытекают все формы нормального закона для любого числа измерений и для любых видов зависимости между случайными величинами. В частности, при n = 2 ковариационная матрица имеет вид:

(58)

её определитель ; матрица С, обратная к ковариационной матрице, имеет вид

. (59)

Подставляя и элементы матрицы С в общую формулу (57), получаем формулу для нормального распределения на плоскости (52).

Если случайные величины независимы, то плотность распределения системы равна

При n = 2 эта формула принимает вид (53).

3.2. Функции от нормально распределенных случайных величин. Распределения хи-квадрат, Стьюдента, Фишера- Снедекора

Рассмотрим общий случай: линейную функцию от нормально распределенных аргументов. Пусть дан n-мерный нормально распределенный случайный вектор , случайная величина Y представляет собой линейную функцию от этих величин:

(61)

Можно показать, что случайная величина Y также распределена нормально с параметрами

(62)

(63)

где – математическое ожидание случайной величины - дисперсия случайной величины - коэффициент корреляции между и .

Пример 11. Записать плотность распределения случайной величины , если случайные величины и имеют нормальное распределение с параметрами , , , их коэффициент корреляции .

Решение . По условию задачи имеем: n=2; . Используя формулу (62), получаем: . Используя формулу (63), получаем: .

Тогда искомая функция распределения случайной величины Y имеет вид:

Пусть - независимые случайные величины, подчиняющиеся нормальному распределению с нулевым математическим ожиданием и единичной дисперсией, то есть стандартному нормальному распределению. Распределение случайной величины, являющейся суммой квадратов этих величин

. (64)

называется “распределением ХИ - квадрат с n степенями свободы ”.

Плотность распределения ХИ – квадрат с n=2 степенями свободы равна

(65)

Плотность ХИ – квадрат распределения с n степенями свободы имеет вид:

(66)

где - гамма-функция Эйлера. С возрастанием числа степеней свободы распределение приближается к нормальному закону распределения (при n >30 распределение практически не отличается от нормального). Математическое ожидание - распределения c n степенями свободы равно n , а дисперсия равна 2n .

Распределение Стьюдента с n степенями свободы St(n) определяется как распределение случайной величины

где Z – стандартная нормальная величина, независимая от распределения.

Плотность распределения Стьюдента с n степенями свободы имеет вид:

(68)

Математическое ожидание при равно 0, дисперсия при равна При распределение Стьюдента приближается к нормальному (уже при n >30 почти совпадает с нормальным распределением).

Распределением Фишера-Снедекора (или F-распределением) с и степенями свободы называется распределение случайной величины

(69)

где и - случайные величины, имеющие - распределение с и степенями свободы, соответственно.

4. Письменный Д.Т. Конспект лекций по теории вероятностей и математической статистике. – М.: Айрис-пресс, 2004.

1. Основные сведения о системах случайных величин и о способах их задания. . 3

1.1. Понятие о системе случайных величин. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2. Функция распределения вероятностей двумерной случайной величины и её

свойства. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3. Закон распределения вероятностей дискретной двумерной случайной величины. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4. Плотность распределения вероятностей непрерывной двумерной случайной величины и её свойства. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.5. Система n случайных величин. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2. Зависимость и независимость случайных величин. . . . . . . . . . . . . . . . . . . . . . . 14

2.1. Независимые случайные величины. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2. Условные законы распределения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.3. Числовые характеристики зависимости. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3. Нормальное распределение системы случайных величин. . . . . . . . . . . . . . . . 22

3.1. Двумерное нормальное распределение. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.2. Общий случай n-мерного нормального распределения. . . . . . . . . . . . . . . . 24

3.3. Функции от нормально распределенных случайных величин. Распределения ХИ - квадрат, Стьюдента, Фишера - Снедекора. . . . . . . . . . . . . . . . . . . 25

Список литературы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

Составитель Бобкова Вера Александровна

Системы случайных величин

Методические указания для самостоятельной работы студентов

Редактор Г.В.Куликова

Подписано в печать 02.03.2010. Формат 60х84 . Бумага писчая. Усл.печ.л.1,63.

Уч.-изд.л.1,81. Тираж 50 экз.

ГОУ ВПО Ивановский государственный химико-технологический университет

Отпечатано на полиграфическом оборудовании кафедры экономики и финансов ГОУ ВПО «ИГХТУ»

153000, г.Иваново, пр. Ф.Энгельса, 7

В теории вероятностей и её приложениях большую роль играет двумерное нормальное распределение. Плотность двумерной нормальной случайной величины (X,Y) имеет вид

Здесь
- математические ожидания величинX и Y;
- средние квадратичные отклонения величинX и Y; r – коэффициент корреляции величин X и Y.

Предположим, что случайные величины X и Y не коррелированы, то есть r=0. Тогда имеем:

(53)

Получили, что плотность распределения системы двух случайных величин (X,Y) равна произведению плотностей распределения компонент X и Y, а это значит, что X и Y – независимые случайные величины.

Таким образом, доказана следующая теорема : из некоррелированности нормально распределенных случайных величин следует их независимость . Поскольку из независимости любых случайных величин следует их некоррелированность, то можно сделать вывод, что термины «некоррелированные» и «независимые» величины для случая нормального распределения эквивалентны.

Приведём формулы для вероятности попадания нормально распределённой двумерной случайной величины в различные области на плоскости.

Пусть случайный вектор (X,Y), компоненты которого независимы, распределён по нормальному закону (53). Тогда вероятность попадания случайной точки (X,Y) в прямоугольник R , стороны которого параллельны координатным осям, равна

(54)

где
- функция Лапласа. Эта функция табулирована.

Пусть плотность распределения нормального закона системы случайных величин (X,Y) задана в виде (52). Ясно, что данная плотность сохраняет постоянное значение на эллипсах:

где С – постоянная; на этом основании такие эллипсы носят название эллипсов равных вероятностей . Можно показать, что вероятность попадания точки (X,Y) внутрь эллипса равной вероятности равна

(56)

Пример 10 . Случайные величины X и Y независимы и нормально распределены с Найти вероятность того, что случайная точка (X,Y) попадет в кольцо

Решение: Так как случайные величины X и Y независимы, то они не коррелированы и, следовательно, r = 0. Подставляя в (С), получаем

,

то есть эллипс равной вероятности выродился в круг равной вероятности. Тогда

Ответ: 0,1242.

3.2. Общий случай n-мерного нормального распределения

Плотность нормального распределения системы n случайных величин имеет вид:

где - определитель матрицы С - обратной к ковариационной матрице;
- математическое ожидание случайной величины Х i - i-той компоненты n -мерного нормального случайного вектора.

Из общего выражения вытекают все формы нормального закона для любого числа измерений и для любых видов зависимости между случайными величинами. В частности, при n = 2 ковариационная матрица имеет вид:

(58)

её определитель
; матрица С, обратная к ковариационной матрице,имеет вид

. (59)

Подставляя и элементы матрицы С в общую формулу (57), получаем формулу для нормального распределения на плоскости (52).

Если случайные величины
независимы, то плотность распределения системы
равна

При n = 2 эта формула принимает вид (53).

kinderglad.ru - Я мама. Учимся готовить. Уход за ребенком. Развитие детей