Меню
Бесплатно
Главная  /  Болезни  /  Дисперсия и математическое ожидание. Математическое ожидание и дисперсия случайной величины

Дисперсия и математическое ожидание. Математическое ожидание и дисперсия случайной величины

Математическим ожиданием случайной величины X называется среднее значение .

1. M(C) = C

2. M(CX) = CM(X) , где C = const

3. M(X ± Y) = M(X) ± M(Y)

4. Если случайные величины X и Y независимы, то M(XY) = M(X)·M(Y)

Дисперсия

Дисперсией случайной величины X называется

D(X) = S(x – M(X)) 2 p = M(X 2 ) – M 2 (X) .

Дисперсия представляет собой мерой отклонения значений случайной величины от своего среднего значения.

1. D(C) = 0

2. D(X + C) = D(X)

3. D(СX) = C 2 D(X) , где C = const

4. Для независимых случайных величин

D(X ± Y) = D(X) + D(Y)

5. D(X ± Y) = D(X) + D(Y) ± 2Cov(x, y)

Квадратный корень из дисперсии случайной величины X называется средним квадратичным отклонением .

@ Задача 3 : Пусть случайная величина X принимает всего два значения (0 или 1) с вероятностями q, p , где p + q = 1 . Найти математическое ожидание и дисперсию.

Решение:

M(X) = 1·p + 0·q = p; D(X) = (1 – p) 2 p + (0 – p) 2 q = pq.

@ Задача 4 : Математическое ожидание и дисперсия случайной величины X равны 8. Найти математическое ожидание и дисперсия случайных величин: а) X – 4 ; б) 3X – 4 .

Решение: M(X – 4) = M(X) – 4 = 8 – 4 = 4; D(X – 4) = D(X) = 8; M(3X – 4) = 3M(X) – 4 = 20; D(3X – 4) = 9D(X) = 72.

@ Задача 5 : Совокупность семей имеет следующее распределение по числу детей:

x i x 1 x 2
p i 0,1 p 2 0,4 0,35

Определить x 1 , x 2 и p 2 , если известно, что M(X) = 2; D(X) = 0,9 .

Решение: Вероятность p 2 равна p 2 = 1 – 0,1 – 0,4 – 0,35 = 0,15. Неизвестные x находятся из уравнений: M(X) = x 1 ·0,1 + x 2 ·0,15 + 2·0,4 + 3·0,35 = 2; D(X) = ·0,1 + ·0,15 + 4·0,4 + 9·0,35 – 4 = 0,9. x 1 = 0; x 2 = 1.

Генеральная совокупность и выборка. Оценки параметров

Выборочное наблюдение

Статистическое наблюдение можно организовать сплошное и не сплошное. Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности (генеральной совокупности). Генеральная совокупность это множество физических или юридических лиц, которую исследователь изучает согласно своей задачи. Это часто экономически невыгодно, а иногда и невозможно. В связи с этим изучается только часть генеральной совокупности – выборочная совокупность .

Результаты, полученные на основе выборочной совокупности, можно распространить на генеральную совокупность, если следовать следующим принципам:



1. Выборочная совокупность должна определяться случайным образом.

2. Число единиц выборочной совокупности должно быть достаточным.

3. Должна обеспечиваться репрезентативность ( представительность) выборки. Репрезентативная выборка представляет собой меньшую по размеру, но точную модель той генеральной совокупности, которую она должна отражать.

Типы выборок

В практике применяются следующие типы выборок:

а) собственно-случайная, б) механическая, в) типическая, г) серийная, д) комбинированная.

Собственно-случайная выборка

При собственно-случайной выборке отбор единиц выборочной совокупности производится случайным образом, например, посредством жеребьевки или генератора случайных чисел.

Выборки бывают повторные и бесповторные. При повторной выборке единица, попавшая в выборку, возвращается и сохраняет равную возможность снова попасть в выборку. При бесповторной выборке единица совокупности, попавшая в выборку, в дальнейшем в выборке не участвует.

Ошибкиприсущие выборочному наблюдению, возникающие в силу того, что выборочная совокупность не полностью воспроизводит генеральную совокупность, называются стандартными ошибками . Они представляют собой среднее квадратичное расхождение между значениями показателей, полученных по выборке, и соответствующими значениями показателей генеральной совокупности.

Расчетные формулы стандартной ошибки при случайном повторном отборе следующая: , а при случайном бесповторном отборе следующая: , где S 2 – дисперсия выборочной совокупности, n/N – доля выборки, n, N - количества единиц в выборочной и генеральной совокупности. При n = N стандартная ошибка m = 0.

Механическая выборка

При механической выборке генеральная совокупность разбивается на равные интервалы и из каждого интервала случайным образом отбирается по одной единице.

Например, при 2%-ной доли выборки из списка генеральной совокупности отбирается каждая 50-я единица.

Стандартная ошибка механической выборки определяется как ошибка собственно-случайной бесповторной выборки.

Типическая выборка

При типической выборке генеральная совокупность разбивается на однородные типические группы, затем из каждой группы случайным образом производится отбор единиц.

Типической выборкой пользуются в случае неоднородной генеральной совокупности. Типическая выборка дает более точные результаты, потому что обеспечивается репрезентативность.

Например, учителя, как генеральная совокупность, разбиваются на группы по следующим признакам: пол, стаж, квалификация, образование, городские и сельские школы и т.д.

Стандартные ошибки типической выборки определяются как ошибки собственно-случайной выборки, с той лишь разницей, что S 2 заменяется средней величиной от внутригрупповых дисперсий.

Серийная выборка

При серийной выборке генеральная совокупность разбивается на отдельные группы (серии), затем случайным образом выбранные группы подвергаются сплошному наблюдению.

Стандартные ошибки серийной выборки определяются как ошибки собственно-случайной выборки, с той лишь разницей, что S 2 заменяется средней величиной от межгрупповых дисперсий.

Комбинированная выборка

Комбинированная выборка является комбинацией двух или более типов выборок.

Точечная оценка

Конечной целью выборочного наблюдения является нахождение характеристик генеральной совокупности. Так как этого невозможно сделать непосредственно, то на генеральную совокупность распространяют характеристики выборочной совокупности.

Принципиальная возможность определения средней арифметической генеральной совокупности по данным средней выборки доказывается теоремой Чебышева . При неограниченном увеличении n вероятность того, что отличие выборочной средней от генеральной средней будет сколь угодно мало, стремится к 1.

Это означает, что характеристика генеральной совокупности с точностью . Такая оценка называется точечной .

Интервальная оценка

Базисом интервальной оценки является центральная предельная теорема .

Интервальная оценка позволяет ответить на вопрос: внутри какого интервала и с какой вероятностью находится неизвестное, искомое значение параметра генеральной совокупности?

Обычно говорят о доверительной вероятности p = 1 a, с которой будет находиться в интервале D < < + D, где D = t кр m > 0 предельная ошибка выборки, a - уровень значимости (вероятность того, что неравенство будет неверным), t кр - критическое значение, которое зависит от значений n и a. При малой выборке n < 30 t кр задается с помощью критического значения t-распределения Стъюдента для двустороннего критиерия с n – 1 степенями свободы с уровнем значимости a (t кр (n – 1, a) находится из таблицы «Критические значения t–распределения Стъюдента», приложение 2). При n > 30, t кр - это квантиль нормального закона распределения (t кр находится из таблицы значений функции Лапласа F(t) = (1 a)/2 как аргумент). При p = 0,954 критическое значение t кр = 2 при p = 0,997 критическое значение t кр = 3. Это означает, что предельная ошибка обычно больше стандартной ошибки в 2-3 раза.

Таким образом, суть метода выборки заключается в том, что на основании статистических данных некоторой малой части генеральной совокупности удается найти интервал, в котором с доверительной вероятностью p находится искомая характеристика генеральной совокупности (средняя численность рабочих, средний балл, средняя урожайность, среднее квадратичное отклонение и т.д.).

@ Задача 1. Для определения скорости расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов, по которым средний срок перечисления и получения денег оказался равным 22 дням ( = 22) со стандартным отклонением 6 дней (S = 6). С вероятностью p = 0,954 определить предельнуюошибку выборочной средней и доверительный интервал средней продолжительности расчетов предприятий данной корпорации.

Решение: Предельнаяошибка выборочной средней согласно (1) равна D = 2· 0,6 = 1,2, а доверительный интервал определяется как (22 – 1,2; 22 + 1,2), т.е. (20,8; 23,2).

§6.5 Корреляция и регрессия

– количество мальчиков среди 10 новорождённых.

Совершенно понятно, что это количество заранее не известно, и в очередном десятке родившихся детей может оказаться:

Либо мальчиков – один и только один из перечисленных вариантов.

И, дабы соблюсти форму, немного физкультуры:

– дальность прыжка в длину (в некоторых единицах) .

Её не в состоянии предугадать даже мастер спорта:)

Тем не менее, ваши гипотезы?

2) Непрерывная случайная величина – принимает все числовые значения из некоторого конечного или бесконечного промежутка.

Примечание : в учебной литературе популярны аббревиатуры ДСВ и НСВ

Сначала разберём дискретную случайную величину, затем – непрерывную .

Закон распределения дискретной случайной величины

– этосоответствие между возможными значениями этой величины и их вероятностями. Чаще всего закон записывают таблицей:

Довольно часто встречается термин ряд распределения , но в некоторых ситуациях он звучит двусмысленно, и поэтому я буду придерживаться «закона».

А теперь очень важный момент : поскольку случайная величина обязательно примет одно из значений , то соответствующие события образуют полную группу и сумма вероятностей их наступления равна единице:

или, если записать свёрнуто:

Так, например, закон распределения вероятностей выпавших на кубике очков имеет следующий вид:

Без комментариев.

Возможно, у вас сложилось впечатление, что дискретная случайная величина может принимать только «хорошие» целые значения. Развеем иллюзию – они могут быть любыми:

Пример 1

Некоторая игра имеет следующий закон распределения выигрыша:

…наверное, вы давно мечтали о таких задачах:) Открою секрет – я тоже. В особенности после того, как завершил работу над теорией поля .

Решение : так как случайная величина может принять только одно из трёх значений, то соответствующие события образуют полную группу , а значит, сумма их вероятностей равна единице:

Разоблачаем «партизана»:

– таким образом, вероятность выигрыша условных единиц составляет 0,4.

Контроль: , в чём и требовалось убедиться.

Ответ :

Не редкость, когда закон распределения требуется составить самостоятельно. Для этого используют классическое определение вероятности , теоремы умножения / сложения вероятностей событий и другие фишки тервера :

Пример 2

В коробке находятся 50 лотерейных билетов, среди которых 12 выигрышных, причём 2 из них выигрывают по 1000 рублей, а остальные – по 100 рублей. Составить закон распределения случайной величины – размера выигрыша, если из коробки наугад извлекается один билет.

Решение : как вы заметили, значения случайной величины принято располагать в порядке их возрастания . Поэтому мы начинаем с самого маленького выигрыша, и именно рублей.

Всего таковых билетов 50 – 12 = 38, и по классическому определению :
– вероятность того, что наудачу извлечённый билет окажется безвыигрышным.

С остальными случаями всё просто. Вероятность выигрыша рублей составляет:

Проверка: – и это особенно приятный момент таких заданий!

Ответ : искомый закон распределения выигрыша:

Следующее задание для самостоятельного решения:

Пример 3

Вероятность того, что стрелок поразит мишень, равна . Составить закон распределения случайной величины – количества попаданий после 2 выстрелов.

…я знал, что вы по нему соскучились:) Вспоминаем теоремы умножения и сложения . Решение и ответ в конце урока.

Закон распределения полностью описывает случайную величину, однако на практике бывает полезно (а иногда и полезнее) знать лишь некоторые её числовые характеристики .

Математическое ожидание дискретной случайной величины

Говоря простым языком, это среднеожидаемое значение при многократном повторении испытаний. Пусть случайная величина принимает значения с вероятностями соответственно. Тогда математическое ожидание данной случайной величины равно сумме произведений всех её значений на соответствующие вероятности:

или в свёрнутом виде:

Вычислим, например, математическое ожидание случайной величины – количества выпавших на игральном кубике очков:

Теперь вспомним нашу гипотетическую игру:

Возникает вопрос: а выгодно ли вообще играть в эту игру? …у кого какие впечатления? Так ведь «навскидку» и не скажешь! Но на этот вопрос можно легко ответить, вычислив математическое ожидание, по сути – средневзвешенный по вероятностям выигрыш:

Таким образом, математическое ожидание данной игры проигрышно .

Не верь впечатлениям – верь цифрам!

Да, здесь можно выиграть 10 и даже 20-30 раз подряд, но на длинной дистанции нас ждёт неминуемое разорение. И я бы не советовал вам играть в такие игры:) Ну, может, только ради развлечения .

Из всего вышесказанного следует, что математическое ожидание – это уже НЕ СЛУЧАЙНАЯ величина.

Творческое задание для самостоятельного исследования:

Пример 4

Мистер Х играет в европейскую рулетку по следующей системе: постоянно ставит 100 рублей на «красное». Составить закон распределения случайной величины – его выигрыша. Вычислить математическое ожидание выигрыша и округлить его до копеек. Сколько в среднем проигрывает игрок с каждой поставленной сотни?

Справка : европейская рулетка содержит 18 красных, 18 чёрных и 1 зелёный сектор («зеро»). В случае выпадения «красного» игроку выплачивается удвоенная ставка, в противном случае она уходит в доход казино

Существует много других систем игры в рулетку, для которых можно составить свои таблицы вероятностей. Но это тот случай, когда нам не нужны никакие законы распределения и таблицы, ибо доподлинно установлено, что математическое ожидание игрока будет точно таким же. От системы к системе меняется лишь

Задача 1. Вероятность всхожести семян пшеницы равна 0,9. Какова вероятность того, что из четырех посеянных семян взойдут не менее трех?

Решение. Пусть событие А – из 4 семян взойдут не менее 3 семян; событие В – из 4 семян взойдут 3 семени; событие С – из 4 семян взойдут 4 семени. По теореме сложения вероятностей

Вероятности
и
определим по формуле Бернулли, применяемой в следующем случае. Пусть проводится серия п независимых испытаний, при каждом из которых вероятность наступления события постоянна и равна р , а вероятность ненаступления этого события равна
. Тогда вероятность того, что событие А в п испытаниях появится ровно раз, вычисляется по формуле Бернулли

,

где
– число сочетаний из п элементов по . Тогда

Искомая вероятность

Задача 2. Вероятность всхожести семян пшеницы равна 0,9. Найти вероятность того, что из 400 посеянных семян взойдут 350 семян.

Решение. Вычислить искомую вероятность
по формуле Бернулли затруднительно из-за громоздкости вычислений. Поэтому применим приближенную формулу, выражающую локальную теорему Лапласа:

,

где
и
.

Из условия задачи . Тогда

.

Из таблицы 1 приложений находим . Искомая вероятность равна

Задача 3. Среди семян пшеницы 0,02% сорняков. Какова вероятность того, что при случайном отборе 10000 семян будет обнаружено 6 семян сорняков?

Решение. Применение локальной теоремы Лапласа из-за малой вероятности
приводит к значительному отклонению вероятности от точного значения
. Поэтому при малых значениях р для вычисления
применяют асимптотическую формулу Пуассона

, где .

Эта формула используется при
, причем чем меньше р и больше п , тем результат точнее.

По условию задачи
;
. Тогда

Задача 4. Процент всхожести семян пшеницы равен 90%. Найти вероятность того, что из 500 посеянных семян взойдут от 400 до 440 семян.

Решение. Если вероятность наступления события А в каждом из п испытаний постоянна и равна р , то вероятность
того, что событие А в таких испытаниях наступит не менее раз и не более раз определяется по интегральной теореме Лапласа следующей формулой:

, где

,
.

Функция
называется функцией Лапласа. В приложениях (табл. 2) даны значения этой функции для
. При
функция
. При отрицательных значениях х в силу нечетности функции Лапласа
. Используя функцию Лапласа, имеем:

По условию задачи . По приведенным выше формулам находим
и :

Задача 5. Задан закон распределения дискретной случайной величины Х :

    1. Найти: 1) математическое ожидание; 2) дисперсию; 3) среднее квадратическое отклонение.

Решение. 1) Если закон распределения дискретной случайной величины задан таблицей

    1. Где в первой строке даны значения случайной величины х, а во второй – вероятности этих значений, то математическое ожидание вычисляется по формуле

2) Дисперсия
дискретной случайной величины Х называется математическое ожидание квадрата отклонения случайной величины от ее математического ожидания, т.е.

Эта величина характеризует среднее ожидаемое значение квадрата отклонения Х от
. Из последней формулы имеем

Дисперсию
можно найти другим способом, исходя из следующего ее свойства: дисперсия
равна разности между математическим ожиданием квадрата случайной величины Х и квадратом ее математического ожидания
, то есть

Для вычисления
составим следующий закон распределения величины
:

3) Для характеристики рассеяния возможных значений случайной величины вокруг ее среднего значения вводится среднее квадратическое отклонение
случайной величины Х , равное квадратному корню из дисперсии
, то есть

.

Из этой формулы имеем:

Задача 6. Непрерывная случайная величина Х задана интегральной функцией распределения

Найти: 1) дифференциальную функцию распределения
; 2) математическое ожидание
; 3) дисперсию
.

Решение. 1) Дифференциальной функцией распределения
непрерывной случайной величины Х называется производная от интегральной функции распределения
, то есть

.

Искомая дифференциальная функция имеет следующий вид:

2) Если непрерывная случайная величина Х задана функцией
, то ее математическое ожидание определяется формулой

Так как функция
при
и при
равна нулю, то из последней формулы имеем

.

3) Дисперсию
определим по формуле

Задача 7. Длина детали представляет собой нормально распределенную случайную величину с математическим ожиданием 40 мм и средним квадратическим отклонением 3 мм. Найти: 1) вероятность того, что длина произвольно взятой детали будет больше 34 мм и меньше 43 мм; 2) вероятность того, что длина детали отклонится от ее математического ожидания не более чем на 1,5 мм.

Решение. 1) Пусть Х – длина детали. Если случайная величина Х задана дифференциальной функцией
, то вероятность того, что Х примет значения, принадлежащие отрезку
, определяется по формуле

.

Вероятность выполнения строгих неравенств
определяется той же формулой. Если случайная величина Х распределена по нормальному закону, то

, (1)

где
– функция Лапласа,
.

В задаче . Тогда

2) По условию задачи , где
. Подставив в (1) , имеем

. (2)

Из формулы (2) имеем.

Математическое ожидание

Дисперсия непрерывной случайной величины X , возможные значения которой принадлежат всей оси Ох, определяется равенством:

Назначение сервиса . Онлайн калькулятор предназначен для решения задач, в которых заданы либо плотность распределения f(x) , либо функция распределения F(x) (см. пример). Обычно в таких заданиях требуется найти математическое ожидание, среднее квадратическое отклонение, построить графики функций f(x) и F(x) .

Инструкция . Выберите вид исходных данных: плотность распределения f(x) или функция распределения F(x) .

Задана плотность распределения f(x) Задана функция распределения F(x)

Задана плотность распределения f(x):

Задана функция распределения F(x):

Непрерывная случайна величина задана плотностью вероятностей
(закон распределения Релея – применяется в радиотехнике). Найти M(x) , D(x) .

Случайную величину X называют непрерывной , если ее функция распределения F(X)=P(X < x) непрерывна и имеет производную.
Функция распределения непрерывной случайной величины применяется для вычисления вероятностей попадания случайной величины в заданный промежуток:
P(α < X < β)=F(β) - F(α)
причем для непрерывной случайной величины не имеет значения, включаются в этот промежуток его границы или нет:
P(α < X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
Плотностью распределения непрерывной случайной величины называется функция
f(x)=F’(x) , производная от функции распределения.

Свойства плотности распределения

1. Плотность распределения случайной величины неотрицательна (f(x) ≥ 0) при всех значениях x.
2. Условие нормировки:

Геометрический смысл условия нормировки: площадь под кривой плотности распределения равна единице.
3. Вероятность попадания случайной величины X в промежуток от α до β может быть вычислена по формуле

Геометрически вероятность попадания непрерывной случайной величины X в промежуток (α, β) равна площади криволинейной трапеции под кривой плотности распределения, опирающейся на этот промежуток.
4. Функция распределения выражается через плотность следующим образом:

Значение плотности распределения в точке x не равно вероятности принять это значение, для непрерывной случайной величины речь может идти только о вероятности попадания в заданный интервал. Пусть }