Нормальное распределение: понятие, свойства, применение

Понятие нормального распределения

Нормальное распределение (синоним - гауссово распределение) - распределение непрерывной случайной величины с плотностью

Здесь "мю" - математическое ожидание, "сигма" - среднеквадратическое отклонение (корень квадратный из дисперсии). Такой вариант задания плотности распределения позволяет легко отыскивать математическое ожидание и дисперсию в случае нормального распределения. Строго говоря, сейчас было задано множество различных распределений, элементы которого отличаются значениями двух параметров. При конкретных значениях этих параметров получаем вполне конкретное распределение.

График плотности распределения для нормально распределённой случайной величины имеет вид, отдалённо напоминающий колокол:

Точка наивысшего подъёма данного графика - математическое ожидание случайной величины. Как нетрудно догадаться, при реальных испытаниях в большом количестве или крупных экспериментальных выборках очень высокий процент полученных случайных значений будет приходиться на узкий диапазон, включающий в себя математическое ожидание и некую "округу". Значения, находящиеся далеко от "высшей" точки, встречаются редко, являясь "аномалией". Дальше мы об этом ещё поговорим.

Функция распределения не может быть записана через элементарные функции, поскольку интеграл от плотности распределения "неберущийся". Поэтому её записывают вот так:

Вероятность того, что непрерывная случайная величина окажется каким-либо действительным числом, равна единице, поскольку полагается, что величина может принимать значение только на множестве действительных чисел. Поэтому

Стандартное нормальное распределение

Нормальное распределение с нулевым математическим ожиданием и единичной дисперсией называется стандартным нормальным распределением. Вот так в данном случае выглядят плотность и функция распределения.

Правило трёх сигм

Выше значения, далёкие от математического ожидания, были обозваны "аномальными". Обратите внимание, как распределение сильно "концентрируется" около одной точки.

Вероятность того, что случайное значение окажется отдалено от точки максимума более, чем на три "сигмы", очень близка к нулю, составляя примерно 0,003. Этот факт известен как правило трёх сигм.

Нормальное распределение в реальном мире

Нормальное распределение или нечто близкое к нему часто имеет место в самых разных практических сферах. Из-за того оно и названо нормальным.

Применительно к социальной сфере, скажем, нормальное распределение неплохо описывает интеллект и знания населения. 80-90% народу по уровню находятся в положении "средненько", "так себе". Полные идиоты (или почти полные) находятся в суровом меньшинстве, как и очень умные люди. Это можно изобразить примерно так:

В результате прогрессивных преобразований в обществе (если такие действительно имеют место) "колокол" смещается вправо:

То, что когда-то считалось почти нереальным и достигалось немногими, может стать нормой. И наоборот, того, чего раньше было достаточно и на чём и останавливались почти все, теперь уже не хватает. Что получается при "откате" и губительных для общества изменениях, догадаетесь сами)

Нормальное распределение и центральная предельная теорема

Пусть ведётся суммирование большого количества независимых случайных величин (или зависимых несильно) с близкими масштабами (никакое слагаемое не вносит в сумму большой вклад, отдельное слагаемое как бы не является "решающей силой"). Тогда согласно ЦПТ сумма - случайная величина, имеющая распределение, близкое к нормальному распределению.

Только что сказанное позволяет ответить на вопрос, как можно смоделировать нормальное распределение. Берём n случайных (точнее, псевдослучайных чисел), полученных программно по обычному датчику случайных чисел, который есть в любой среде разработки. Такие датчики моделируют равномерное распределение. Каждое из n чисел должно находиться в одном диапазоне (скажем, [0; 1]). Тогда сумма из n случайных чисел и будет случайной величиной, распределение которой можно считать нормальным при достаточно большом n. Если выбирался диапазон [0; 1], то математическое ожидание составит n /2.

copyright © Исканцев Н.В. 2012