Правило 68-95-99 - Нормальний розподіл Пояснено простою англійською мовою

Зустріньте Мейсона. Він середній американець 40-річного віку: зріст 5 футів 10 дюймів і заробляє 47 000 доларів на рік до оподаткування.

Як часто ви очікуєте зустріти когось, хто заробляє в 10 разів більше, ніж Мейсон?

А тепер, як часто ви очікували б зустріти когось, хто в 10 разів вищий за Мейсона?

Ваші відповіді на два вищезазначені запитання різні, оскільки розподіл даних різний. У деяких випадках поширене явище в 10 разів вище середнього. Хоча в інших випадках це взагалі не часто.

То що таке звичайні розподіли?

Сьогодні ми зацікавлені в нормальному розподілі. Вони представлені кривою дзвона: вони мають пік посередині, який звужується до кожного краю. Багато речей дотримуються цього розподілу, наприклад, ваш зріст, вага та IQ.

Цей розподіл захоплює тим, що він симетричний - що полегшує роботу з ним. Ви можете звести багато складної математики до кількох основних правил, тому що вам не потрібно турбуватися про дивні крайні випадки.

Наприклад, пік завжди ділить розподіл навпіл. Є рівна маса до і після піку.

Ще однією важливою властивістю є те, що нам не потрібно багато інформації для опису нормального розподілу.

Справді, нам потрібні лише дві речі:

  1. Значення. Більшість людей просто називають це "середнім показником". Це те, що ви отримаєте, якщо складете значення всіх своїх спостережень, а потім поділите це число на кількість спостережень. Наприклад, середнє з цих трьох чисел:1, 2, 3 = (1 + 2 + 3) / 3 = 2
  2. І стандартне відхилення. Це говорить про те, наскільки рідкісним буде спостереження. Більшість спостережень підпадають під одне стандартне відхилення середнього значення. Менше спостережень - це два стандартних відхилення від середнього значення. І ще менше - три стандартних відхилення (або далі).

Разом середнє та середнє відхилення складають усе, що вам потрібно знати про розподіл.

Правило 68-95-99

Правило 68-95-99 базується на середньому та стандартному відхиленні. Він говорить:

68% населення знаходиться в межах 1 стандартного відхилення середнього значення.

95% населення знаходиться в межах 2 стандартних відхилень середнього значення.

99,7% населення знаходиться в межах 3 стандартних відхилень середнього значення.

Як обчислити нормальні розподіли

Продовжуючи наш приклад, середній американський зріст чоловіка становить 5 футів 10 дюймів зі стандартним відхиленням 4 дюйма. Це означає:

Тепер про найцікавішу частину: давайте застосуємо те, що ми щойно дізналися.

Який шанс побачити когось із зростом від 5 футів 10 дюймів до 6 футів 2 дюйми? (Тобто від 70 до 74 дюймів.)

Це 34%! Ми використовуємо обидві властивості: розподіл симетричний, що означає, що шанси для (66-70) дюймів та (70-74) дюймів становлять 68/2 = 34%.

Давайте спробуємо більш жорсткий. Який шанс побачити когось із зростом від 62 до 66 дюймів?

Це (95-68) / 2 = 13,5%. Обидва зовнішні краї мають однакові%.

А тепер ваш остаточний (і найскладніший тест): який шанс побачити когось із зростом більше 82 дюймів?

Тут ми використовуємо також остаточну властивість: усе має складати 100%. Тож зовнішні краї (тобто висоти нижче 58 і висоти вище 82) разом складають (100% - 99,7%) = 0,3%.

Пам'ятайте, ви можете застосувати це на будь-якому звичайному розподілі. Спробуйте зробити те саме для жіночого зросту: середнє значення становить 65 дюймів, а стандартне відхилення - 3,5 дюйма.

Отже, шанс побачити когось із зростом від 65 до 68,5 дюймів буде таким: ___.

...

...

34%! Це точно так само, як і наш перший приклад. Це +1 стандартне відхилення.

Висновок

Знаючи це правило, дуже легко калібрувати свої почуття. Оскільки все, що нам потрібно для опису будь-якого нормального розподілу, це середнє та стандартне відхилення, це правило справедливо для кожного нормального розподілу у світі!

Складною частиною справді є з’ясування того, чи є розподіл нормальним чи ні.

Хочете дізнатися більше про калібрування своїх почуттів та критичне мислення? Ознайомтеся з теоремою Байєса: рамки для критичного мислення.