Л 27

Лекция 27.
Распределение Пуассона

Наиболее общим случаем различного рода вероятностных распределений является биномиальное распределение. Воспользуемся его универсальностью для определения наиболее часто встречающихся на практике частных видов распределений.

Биномиальное распределение

Пусть имеется некое событие A. Вероятность появления события A равна p, вероятность непоявления события A равна 1 – p, иногда ее обозначают как q. Пусть n — число испытаний, m — частота появления события A в этих n испытаниях.

Известно, что суммарная вероятность всех возможных комбинаций исходов равна единице, то есть:

1 = pⁿ + n · p^n – 1 · (1 – p) + C_n^n – 2 · p^n – 2 · (1 – p)² + … + C_n^m · p^m · (1 – p)^n – m + … + (1 – p)ⁿ.

pⁿ — вероятность того, что в n испытаниях событие A произойдет n раз;

n · p^n – 1 · (1 – p) — вероятность того, что в n испытаниях событие A произойдет (n – 1) раз и не произойдет 1 раз;

C_n^n – 2 · p^n – 2 · (1 – p)² — вероятность того, что в n испытаниях событие A произойдет (n – 2) раза и не произойдет 2 раза;

P_m = C_n^m · p^m · (1 – p)^n – m — вероятность того, что в n испытаниях событие A произойдет m раз и не произойдет (n – m) раз;

(1 – p)ⁿ — вероятность того, что в n испытаниях событие A не произойдет ни разу;

— число сочетаний из n по m.

Математическое ожидание M биномиального распределения равно:

M = n · p,

где n — число испытаний, p — вероятность появления события A.

Среднеквадратичное отклонение σ:

σ = sqrt(n · p · (1 – p)).

Пример 1. Вычислить вероятность того, что событие, имеющее вероятность p = 0.5, в n = 10 испытаниях произойдет m = 1 раз. Имеем: C₁₀¹ = 10, и далее: P₁ = 10 · 0.5¹ · (1 – 0.5)^10 – 1 = 10 · 0.5¹⁰ = 0.0098. Как видим, вероятность наступления этого события достаточно мала. Объясняется это, во-первых, тем, что абсолютно не ясно, произойдет ли событие или нет, поскольку вероятность равна 0.5 и шансы здесь «50 на 50»; а во-вторых, требуется исчислить то, что событие произойдет именно один раз (не больше и не меньше) из десяти.

Пример 2. Вычислить вероятность того, что событие, имеющее вероятность p = 0.5, в n = 10 испытаниях произойдет m = 2 раза. Имеем: C₁₀² = 45, и далее: P₂ = 45 · 0.5² · (1 – 0.5)^10 – 2 = 45 · 0.5¹⁰ = 0.044. Вероятность наступления этого события стала больше!

Пример 3. Увеличим вероятность наступления самого события. Сделаем его более вероятным. Вычислить вероятность того, что событие, имеющее вероятность p = 0.8, в n = 10 испытаниях произойдет m = 1 раз. Имеем: C₁₀¹ = 10, и далее: P₁ = 10 · 0.8¹ · (1 – 0.8)^10 – 1 = 10 · 0.8¹ · 0.2⁹ = 0.000004. Вероятность стала меньше, чем в первом примере! Ответ, на первый взгляд, кажется странным, но поскольку событие имеет достаточно большую вероятность, вряд ли оно произойдет только один раз. Более вероятно, что оно произойдет большее, чем один, количество раз. Действительно, подсчитывая P₀, P₁, P₂, P₃, …, P₁₀ (вероятность того, что событие в n = 10 испытаниях произойдет 0, 1, 2, 3, …, 10 раз), мы увидим:

C₁₀⁰ = 1, C₁₀¹ = 10, C₁₀² = 45, C₁₀³ = 120, C₁₀⁴ = 210, C₁₀⁵ = 252,
C₁₀⁶ = 210, C₁₀⁷ = 120, C₁₀⁸ = 45, C₁₀⁹ = 10, C₁₀¹⁰ = 1;

P₀ = 1 · 0.8⁰ · (1 – 0.8)^10 – 0 = 1 · 1 · 0.2¹⁰ = 0.0000…;
P₁ = 10 · 0.8¹ · (1 – 0.8)^10 – 1 = 10 · 0.8¹ · 0.2⁹ = 0.0000…;
P₂ = 45 · 0.8² · (1 – 0.8)^10 – 2 = 45 · 0.8² · 0.2⁸ = 0.0000…;
P₃ = 120 · 0.8³ · (1 – 0.8)^10 – 3 = 120 · 0.8³ · 0.2⁷ = 0.0008…;
P₄ = 210 · 0.8⁴ · (1 – 0.8)^10 – 4 = 210 · 0.8⁴ · 0.2⁶ = 0.0055…;
P₅ = 252 · 0.8⁵ · (1 – 0.8)^10 – 5 = 252 · 0.8⁵ · 0.2⁵ = 0.0264…;
P₆ = 210 · 0.8⁶ · (1 – 0.8)^10 – 6 = 210 · 0.8⁶ · 0.2⁴ = 0.0881…;
P₇ = 120 · 0.8⁷ · (1 – 0.8)^10 – 7 = 120 · 0.8⁷ · 0.2³ = 0.2013…;
P₈ = 45 · 0.8⁸ · (1 – 0.8)^10 – 8 = 45 · 0.8⁸ · 0.2² = 0.3020… (самая большая вероятность!);
P₉ = 10 · 0.8⁹ · (1 – 0.8)^10 – 9 = 10 · 0.8⁹ · 0.2¹ = 0.2684…;
P₁₀ = 1 · 0.8¹⁰ · (1 – 0.8)^10 – 10 = 1 · 0.8¹⁰ · 0.2⁰ = 0.1074…

Разумеется, P₀ + P₁ + P₂ + P₃ + P₄ + P₅ + P₆ + P₇ + P₈ + P₉ + P₁₀ = 1.

Нормальное распределение

Если изобразить величины P₀, P₁, P₂, P₃, …, P₁₀, которые мы подсчитали в примере 3, на графике, то окажется, что их распределение имеет вид, близкий к нормальному закону распределения (см. рис. 27.1) (см. лекцию 25. Моделирование нормально распределенных случайных величин).

Рис. 27.1. Вид биномиального распределения
вероятностей для различных m при p = 0.8, n = 10

Биномиальный закон переходит в нормальный, если вероятности появления и непоявления события A примерно одинаковы, то есть, условно можно записать: p ≈ (1 – p). Для примера возьмем n = 10 и p = 0.5 (то есть p = 1 – p = 0.5).

Содержательно к такой задаче мы придем, если, например, захотим теоретически посчитать, сколько будет мальчиков и сколько девочек из 10 родившихся в роддоме в один день детей. Точнее, считать будем не мальчиков и девочек, а вероятность, что родятся только мальчики, что родится 1 мальчик и 9 девочек, что родится 2 мальчика и 8 девочек и так далее. Примем для простоты, что вероятность рождения мальчика и девочки одинакова и равна 0.5 (но на самом деле, если честно, это не так, см. курс «Моделирование систем искусственного интеллекта»).

Ясно, что распределение будет симметричное, так как вероятность рождения 3 мальчиков и 7 девочек равна вероятности рождения 7 мальчиков и 3 девочек. Наибольшая вероятность рождения будет у 5 мальчиков и 5 девочек. Эта вероятность равна 0.25, кстати, не такая уж она и большая по абсолютной величине. Далее, вероятность того, что родится сразу 10 или 9 мальчиков намного меньше, чем вероятность того, что родится 5 ± 1 мальчик из 10 детей. Как раз биномиальное распределение нам поможет сделать этот расчет. Итак.

C₁₀⁰ = 1, C₁₀¹ = 10, C₁₀² = 45, C₁₀³ = 120, C₁₀⁴ = 210, C₁₀⁵ = 252,
C₁₀⁶ = 210, C₁₀⁷ = 120, C₁₀⁸ = 45, C₁₀⁹ = 10, C₁₀¹⁰ = 1;

P₀ = 1 · 0.5⁰ · (1 – 0.5)^10 – 0 = 1 · 1 · 0.5¹⁰ = 0.000977…;
P₁ = 10 · 0.5¹ · (1 – 0.5)^10 – 1 = 10 · 0.5¹⁰ = 0.009766…;
P₂ = 45 · 0.5² · (1 – 0.5)^10 – 2 = 45 · 0.5¹⁰ = 0.043945…;
P₃ = 120 · 0.5³ · (1 – 0.5)^10 – 3 = 120 · 0.5¹⁰ = 0.117188…;
P₄ = 210 · 0.5⁴ · (1 – 0.5)^10 – 4 = 210 · 0.5¹⁰ = 0.205078…;
P₅ = 252 · 0.5⁵ · (1 – 0.5)^10 – 5 = 252 · 0.5¹⁰ = 0.246094…;
P₆ = 210 · 0.5⁶ · (1 – 0.5)^10 – 6 = 210 · 0.5¹⁰ = 0.205078…;
P₇ = 120 · 0.5⁷ · (1 – 0.5)^10 – 7 = 120 · 0.5¹⁰ = 0.117188…;
P₈ = 45 · 0.5⁸ · (1 – 0.5)^10 – 8 = 45 · 0.5¹⁰ = 0.043945…;
P₉ = 10 · 0.5⁹ · (1 – 0.5)^10 – 9 = 10 · 0.5¹⁰ = 0.009766…;
P₁₀ = 1 · 0.5¹⁰ · (1 – 0.5)^10 – 10 = 1 · 0.5¹⁰ = 0.000977…

Разумеется, P₀ + P₁ + P₂ + P₃ + P₄ + P₅ + P₆ + P₇ + P₈ + P₉ + P₁₀ = 1.

Отразим на графике величины P₀, P₁, P₂, P₃, …, P₁₀ (см. рис. 27.2).

Рис. 27.2. График биномиального распределения при параметрах
p = 0.5 и n = 10, приближающих его к нормальному закону

Итак, при условиях m ≈ n/2 и p ≈ 1 – p или p ≈ 0.5 вместо биномиального распределения можно использовать нормальное. При больших значениях n график сдвигается вправо и становится все более пологим, так как математическое ожидание и дисперсия возрастают с увеличением n: M = n · p, D = n · p · (1 – p).

Кстати, биномиальный закон стремится к нормальному и при увеличении n, что вполне естественно, согласно центральной предельной теореме (см. лекцию 34. Фиксация и обработка статистических результатов).

Теперь рассмотрим, как изменится биномиальный закон в случае, когда p ≠ q, то есть p –> 0. В этом случае применить гипотезу о нормальности распределения нельзя, и биномиальное распределение переходит в распределение Пуассона.

Распределение Пуассона

Распределение Пуассона — это частный случай биномиального распределения (при n >> 0 и при p –> 0 (редкие события)).

Из математики известна формула, позволяющая примерно подсчитать значение любого члена биномиального распределения:

где a = n · p — параметр Пуассона (математическое ожидание), а дисперсия равна математическому ожиданию. Приведем математические выкладки, поясняющие этот переход. Биномиальный закон распределения

P_m = C_n^m · p^m · (1 – p)^n – m

может быть написан, если положить p = a/n, в виде

или

Так как p очень мало, то следует принимать во внимание только числа m, малые по сравнению с n. Произведение

весьма близко к единице. Это же относится к величине

Величина

очень близка к e^–a. Отсюда получаем формулу:

Пример. В ящике находится n = 100 деталей, как качественных, так и бракованных. Вероятность достать бракованное изделие составляет p = 0.01. Допустим, что мы вынимаем изделие, определяем, бракованное оно или нет, и кладем его обратно. Поступая таким образом, получилось, что из 100 изделий, которые мы перебрали, два оказались бракованными. Какова вероятность этого?

По биномиальному распределению получаем:

[ Формула 09 ]

По распределению Пуассона получаем:

Как видно, величины получились близкими, поэтому в случае редких событий вполне допустимо применять закон Пуассона, тем более что он требует меньших вычислительных затрат.

Покажем графически вид закона Пуассона. Возьмем для примера параметры p = 0.05, n = 10. Тогда:

C₁₀⁰ = 1, C₁₀¹ = 10, C₁₀² = 45, C₁₀³ = 120, C₁₀⁴ = 210, C₁₀⁵ = 252,
C₁₀⁶ = 210, C₁₀⁷ = 120, C₁₀⁸ = 45, C₁₀⁹ = 10, C₁₀¹⁰ = 1;

P₀ = 1 · 0.05⁰ · (1 – 0.05)^10 – 0 = 1 · 1 · 0.95¹⁰ = 0.5987…;
P₁ = 10 · 0.05¹ · (1 – 0.05)^10 – 1 = 10 · 0.05¹ · 0.95⁹ = 0.3151…;
P₂ = 45 · 0.05² · (1 – 0.05)^10 – 2 = 45 · 0.05² · 0.95⁸ = 0.0746…;
P₃ = 120 · 0.05³ · (1 – 0.05)^10 – 3 = 120 · 0.05³ · 0.95⁷ = 0.0105…;
P₄ = 210 · 0.05⁴ · (1 – 0.05)^10 – 4 = 210 · 0.05⁴ · 0.95⁶ = 0.00096…;
P₅ = 252 · 0.05⁵ · (1 – 0.05)^10 – 5 = 252 · 0.05⁵ · 0.95⁵ = 0.00006…;
P₆ = 210 · 0.05⁶ · (1 – 0.05)^10 – 6 = 210 · 0.05⁶ · 0.95⁴ = 0.0000…;
P₇ = 120 · 0.05⁷ · (1 – 0.05)^10 – 7 = 120 · 0.05⁷ · 0.95³ = 0.0000…;
P₈ = 45 · 0.05⁸ · (1 – 0.05)^10 – 8 = 45 · 0.05⁸ · 0.95² = 0.0000…;
P₉ = 10 · 0.05⁹ · (1 – 0.05)^10 – 9 = 10 · 0.05⁹ · 0.95¹ = 0.0000…;
P₁₀ = 1 · 0.05¹⁰ · (1 – 0.05)^10 – 10 = 1 · 0.05¹⁰ · 0.95⁰ = 0.0000…

Разумеется, P₀ + P₁ + P₂ + P₃ + P₄ + P₅ + P₆ + P₇ + P₈ + P₉ + P₁₀ = 1.

Рис. 27.3. График распределения Пуассона при p = 0.05 и n = 10

При n –> ∞ распределение Пуассона переходит в нормальный закон, согласно центральной предельной теореме (см. лекцию 34. Фиксация и обработка статистических результатов).

Лекция 26. Моделирование системы случайных…

Лекция 28. Поток случайных событий

Л 27

Лекция 27. Распределение Пуассона

Биномиальное распределение

Нормальное распределение

Распределение Пуассона

Лекция 27.
Распределение Пуассона