Вероятность и статистика – основные факты. Нормированные случайные величины Центрированные и нормированные случайные величины

Разность между случайной величиной и ее математическим ожиданием называется отклонением или центрированной случайной величиной :

Ряд распределения центрированной случайной величины имеет вид:

X М(Х)

х 1 М(Х)

х 2 М(Х)

х n М(Х)

р 1

p 2

р n

Свойства центрированной случайной величины:

1. Математическое ожидание отклонения равно 0:

2. Дисперсия отклонения случайной величины Х от ее математического ожидания равна дисперсии самой случайной величины Х:

Другими словами, дисперсия случайной величины и дисперсия ее отклонения равны между собой.

4.2. Если отклонение Х М(Х) разделить на среднее квадратическое отклонение (Х) , то получим безразмерную центрированную случайную величину, которая называется стандартной (нормированной) случайной величиной :

Свойства стандартной случайной величины:

    Математическое ожидание стандартной случайной величины равно нулю: M (Z ) =0.

    Дисперсия стандартной случайной величины равна 1: D (Z ) =1.

    ЗАДАЧИ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ

    В лотерее на 100 билетов разыгрываются две вещи, стоимости которых 210 и 60 у.е. Составьте закон распределения суммы выигрыша для лица, имеющего: а) 1 билет, б) 2 билета. Найдите числовые характеристики.

    Два стрелка стреляют по мишени один раз. Случайная величина Х – число очков, выбиваемых при одном выстреле первым стрелком, – имеет закон распределения:

Z – суммы очков, выбиваемых обоими стрелками. Определить числовые характеристики.

    Два стрелка стреляют по своей мишени, делая независимо друг от друга по одному выстрелу. Вероятность попадания в мишень для первого стрелка равна 0,7, для второго – 0,8. Случайная величина Х 1 – число попаданий первого стрелка, Х 2  число попаданий второго стрелка. Найти закон распределения: а) общего числа попаданий; б) случайной величины Z =3Х 1  2Х 2 . Определить числовые характеристики общего числа попаданий. Проверить выполнение свойств математического ожидания и дисперсии: M (3 X 2 Y )=3 M (X ) 2 M (Y ), D (3 X 2 Y )=9 D (X )+4 D (Y ).

    Случайная величина Х – выручка фирмы – имеет закон распределения:

Найти закон распределения для случайной величины Z – прибыли фирмы. Определить ее числовые характеристики.

    Случайные величины Х и У независимы и имеют один и тот же закон распределения:

Значение

Одинаковые ли законы распределения имеют случайные величины 2 Х и Х + У ?

    Доказать, что математическое ожидание стандартной случайной величины равно нулю, а дисперсия равна 1.

Преобразования случайных величин

По каждой случайной величине Х определяют еще три величины – центрированную Y , нормированную V и приведенную U . Центрированная случайная величина Y – это разность между данной случайной величиной Х и ее математическим ожиданием М(Х), т.е. Y = Х – М(Х). Математическое ожидание центрированной случайной величины Y равно 0, а дисперсия – дисперсии данной случайной величины: М(Y ) = 0, D (Y ) = D (X ). Функция распределения F Y (x ) центрированной случайной величины Y связана с функцией распределения F (x ) исходной случайной величины X соотношением:

F Y (x ) = F (x + M (X )).

Для плотностей этих случайных величин справедливо равенство

f Y (x ) = f (x + M (X )).

Нормированная случайная величина V – это отношение данной случайной величины Х к ее среднему квадратическому отклонению , т.е. . Математическое ожидание и дисперсия нормированной случайной величины V выражаются через характеристики Х так:

,

где v – коэффициент вариации исходной случайной величины Х . Для функции распределения F V (x ) и плотности f V (x ) нормированной случайной величины V имеем:

где F (x ) – функция распределения исходной случайной величины Х , а f (x ) – ее плотность вероятности.

Приведенная случайная величина U – это центрированная и нормированная случайная величина:

.

Для приведенной случайной величины

Нормированные, центрированные и приведенные случайные величины постоянно используются как в теоретических исследованиях, так и в алгоритмах, программных продуктах, нормативно-технической и инструктивно-методической документации. В частности, потому, что равенства позволяют упростить обоснования методов, формулировки теорем и расчетные формулы.

Используются преобразования случайных величин и более общего плана. Так, если Y = aX + b , где a и b – некоторые числа, то

Пример 7. Если то Y – приведенная случайная величина, и формулы (8) переходят в формулы (7).

С каждой случайной величиной Х можно связать множество случайных величин Y , заданных формулой Y = aX + b при различных a > 0 и b . Это множество называют масштабно-сдвиговым семейством , порожденным случайной величиной Х . Функции распределения F Y (x ) составляют масштабно сдвиговое семейство распределений, порожденное функцией распределения F (x ). Вместо Y = aX + b часто используют запись

Число с называют параметром сдвига, а число d - параметром масштаба. Формула (9) показывает, что Х – результат измерения некоторой величины – переходит в У – результат измерения той же величины, если начало измерения перенести в точку с , а затем использовать новую единицу измерения, в d раз большую старой.

Для масштабно-сдвигового семейства (9) распределение Х называют стандартным. В вероятностно-статистических методах принятия решений и других прикладных исследованиях используют стандартное нормальное распределение, стандартное распределение Вейбулла-Гнеденко, стандартное гамма-распределение и др. (см. ниже).

Применяют и другие преобразования случайных величин. Например, для положительной случайной величины Х рассматривают Y = lg X , где lg X десятичный логарифм числа Х . Цепочка равенств

F Y (x) = P(lg X < x) = P(X < 10 x) = F(10 x)

связывает функции распределения Х и Y .

В качестве числовых характеристик системы случайного двумерного вектора (X,Y) обычно рассматриваются начальные и центральные моменты различных порядков.

Начальным моментом порядка k+s системы двух случайных величин (X,Y) или двумерного случайного вектора называется математическое ожидание произведения X k на Y s

a k , s =M (1)

Центральным моментом порядка k+s системы двух случайных величин (X,Y) называется математическое ожидание произведения на

где , - центрированные случайные величины.

Центрированной случайной величиной называется отклонение случайной величины от ее математического ожидания.

Для системы дискретных случайных величин (X,Y) получим

P{X=x i ,Y=y j }=p ij

Для системы непрерывных случайных величин (X,Y)

Порядком начального (или центрального момента) называется сумма его индексов k+s.

Начальные моменты первого порядка:

a 1,0 = M = M[X] = m x , a 1,0 = m x

a 0,1 = M = m y , a 0,1 = m y (7)

представляют собой математические ожидания случайных величин X и Y.

Центральные моменты первого порядка естественно равны нулю.

Начальные моменты второго порядка:

Центральные моменты второго порядка:

Первые два момента представляют дисперсию, а третий называется ковариацией (или корреляционным моментом ) случайных величин (X,Y), обозначается K xy:

По определению ковариации

K xy = K yx (11)

т.е. при перемене индексов местами ковариация не меняется.

Дисперсию случайных величин можно рассматривать как частный случай ковариации:

т.е. дисперсия случайных величин есть не что иное, как "ковариация ее с самой собой". (Для независимых случайных величин ковариация равна 0. Доказать самостоятельно).

Ковариацию K xy удобно выражать через начальные моменты низших порядков:

K xy =a 1,1 -a 1,0 ×a 0,1 или К xy =M-M[X]×M[Y] (13)

Полезно запомнить эту формулу: ковариация двух случайных величин равна математическому ожиданию их произведения минус произведение математических ожиданий.

Ковариация характеризует не только степень зависимости случайных величин, но также их рассеивание вокруг точки (m x ,m y) .

Размерность ковариации равна произведению размерностей случайных величин X и Y. Чтобы получить безразмерную величину, характеризующую только зависимость, ковариацию делят на произведение с.к.о. s x s y .

r xy =K xy /s x s y (14)

Величина r xy называется коэффициентом корреляции случайных величин X и Y. Этот коэффициент характеризует степень только линейной зависимости этих величин. Зависимость проявляется в том, что при возрастании одной случайной величины другая проявляет тенденцию также возрастать (или убывать). В первом случае r xy >0 и говорят, что случайные величины X и Y связаны положительной корреляцией, во втором r xy <0, и корреляция отрицательна.


Для любых случайных величин X и Y

Если ковариация двух случайных величин равна нулю: K xy =0, то случайные величины X и Y называются некоррелированными , если K xy ¹0, то коррелированными .

Из независимости случайных величин следует их некоррелированность; но из некоррелированности случайных величин (r xy =0) еще не вытекает их независимость. Если r xy =0, это означает только отсутствие линейной связи между случайными величинами; любой другой вид связи может при этом присутствовать.

Полной характеристикой случайной величины является закон распределения. На практике такая характеристика не всегда может быть получена из-за ограниченности экспериментальных результатов. В этих случаях вместо законов распределения используют приближенное описание случайных величин, которая получается с помощью минимального числа неслучайных характеристик. Количество этих характеристик должно быть небольшим, но должно отражать наиболее существенные особенности распределении:

· математическое ожидание случайной величины;

· дисперсия (момент нулевого порядка, 1-го).

Простейшей числовой характеристикой дискретной случайной величины Х – среднее значение: , где - среднее значение случайной величины; N – число испытаний; - значение случайной величины, которое оно принимает при N испытаний.

Для характеристики разброса значений дискретной случайной величины в данной серии опытов используется квадрат разности между значениями случайно величины и её средним значением: , где - статистическая дисперсия случайно величины Х. При практических расчетах вместо дисперсии применяется среднеквадратическое отклонение: , чем меньше , тем теснее группируются значения случайной величины около её среднего значения .

Если результаты экспериментов характеризуются не одной случайной величиной, а несколькими, то кроме рассмотренных характеристик вводятся величины, характеризующие степень зависимости между этими случайными величинами. В качестве такой характеристики, например для 2-х случайных величин х и у в данной серии опытов принята величина: . Равенство (4) статическим корреляционным моментом. При увеличении опытов значение частоты появления данного события будет приближаться к вероятности . А среднее арифметическое значение будет стремится к её математическому ожиданию : , где вероятность появления значения . Таким образом, математическим ожиданием дискретной случайной величины Х называется сумма произведений всех её возможных значений х на вероятность появления этих значений . , дисперсией случайной величины называется её математическое ожидание квадрата отклонения от этой величины от её математического ожидания. , где центрированная случайная величина, , . Корреляционный момент: , где - это вероятность того, что случайная величина х, у примут значения x i , y i , .

Для непрерывных случайных величин математическое ожидание, дисперсия и корреляционный момент определяются через плотность: .

Для независимых случайных величин: тогда , . Согласно (9) для независимых случайных величин потому, если двух случайных величин отличен от 0, то это указывает на наличие зависимости между этими случайными. Случайные величины для которых называются некорреляционными случайными величинами. характеризует не только зависимость величин, но и их рассеивание. Если, например, одна из величин Х или У мало отклоняется от своего математического ожидания, то корреляционный момент будет мал какой бы зависимостью эти величины мужду собой не обладали.



Для устранения этого недостатка вводится безразмерная характеристика, которая называется коэффициентом корреляции: . Если пользоваться механической интерпретацией, то абсциссу можно представить как центр тяжести фигуры, а дисперсию как момент инерции плоской фигуры.