Якщо ви навчаєтесь на іспит із статистики та вам потрібно переглянути типи даних, ця стаття дасть вам короткий огляд із кількома простими прикладами.
Тому що погодьмося: не багато людей вивчають типи даних задля розваги чи у своєму реальному повсякденному житті.
Тож давайте зануримось.
Кількісні та якісні дані - в чому різниця?
Коротше кажучи: кількісний означає, що ви можете його порахувати, і це числове (подумайте, кількість - те, що ви можете порахувати). Якісний означає, що ви не можете, і це не числово (подумайте якість - натомість категоричні дані).
Бум! Просто, правда?
Існує ще одне розрізнення, яке слід отримати прямо перед тим, як переходити до реальних типів даних, і це пов’язано з кількісними (числовими) даними: дискретні чи безперервні дані.
Дискретні дані включають цілі числа (цілі числа - наприклад, 1, 356 або 9), які не можна розділити залежно від природи того, що вони є.
Як кількість людей у класі, кількість пальців на руках або кількість дітей, які хтось має. Ви не можете мати 1,9 дитини в сім'ї (незважаючи на те, що може сказати перепис населення).
Безперервні дані , навпаки, навпаки. Його можна розділити скільки завгодно і виміряти з великою кількістю знаків після коми.
Як і вага автомобіля (можна розрахувати з великою кількістю знаків після коми), температура (32,543 градуси тощо) або швидкість літака.
Тепер про цікаві речі.
Якісні типи даних
Номінальні дані
Номінальні дані використовуються для позначення змінних без будь-якого кількісного значення. Поширені приклади включають чоловіків / жінок (хоча і дещо застарілих), колір волосся, національності, імена людей тощо.
Простою англійською мовою: в основному це ярлики (а номінальне походить від "name", щоб допомогти вам запам’ятати). У вас каштанове волосся (або карі очі) . Ви американець . Вас звати Джейн .
Приклади:
Який колір волосся у вас?
- Коричневий
- Блондинка
- Чорний
- Веселковий єдиноріг
Що ти за національністю?
- Американський
- Німецька
- Кенійський
- Японський
Зверніть увагу, що ці змінні не перекриваються. Для цілей статистики, так чи інакше, ви не можете мати волосся як каштанового, так і райдужного кольору єдинорога. І вони насправді пов’язані лише основною категорією, частиною якої вони є.

Звичайні дані
Ключ із порядковими даними полягає в тому, щоб пам’ятати, що порядковий звучить як порядок - і важливий порядок змінних. Не стільки різниці між цими значеннями.
Порядкові ваги часто використовують для вимірювання задоволення, щастя тощо. Ви коли-небудь брали одне з таких опитувань, подібне до цього?
"Наскільки ймовірно ви рекомендуєте наші послуги своїм друзям?"
- Ймовірно
- Ймовірно
- Нейтральний
- Навряд чи
- Дуже малоймовірно
Дивіться, ми насправді не знаємо, яка різниця між дуже малоймовірною та малоймовірною - або якщо це така ж величина ймовірності (або, малоймовірності), як між ймовірною та дуже ймовірною. Але це нормально Ми просто знаємо, що ймовірність більш ніж нейтральна, а малоймовірна - більш ніж дуже малоймовірна. Все в порядку.
Кількісні типи даних
Дані інтервалу
Дані інтервалу є цікавими (і корисними), оскільки вони стосуються як порядку, так і різниці між вашими змінними. Це дозволяє виміряти середнє відхилення та центральну тенденцію.
Улюблений усім приклад даних інтервалу - температури в градусах Цельсія. 20 градусів тепла тепліше 10, а різниця між 20 градусами і 10 градусами становить 10 градусів. Різниця між 10 і 0 також становить 10 градусів.
Якщо вам потрібна допомога в запам’ятовуванні, що таке шкали інтервалів, просто подумайте про значення інтервалу: простір між ними . Тож ви не тільки дбаєте про порядок змінних, а й про значення між ними.
Однак є невелика проблема з інтервалами: немає "справжнього нуля". Справжній нуль не має значення - цього немає, - але 0 градусів С однозначно має значення: досить холодно. Ви також можете мати від’ємні числа.
Якщо у вас немає справжнього нуля, ви не можете розрахувати коефіцієнти. Це означає роботу додавання та віднімання, а ділення та множення - ні.
Дані коефіцієнта
Слава богу, є дані про співвідношення. Це вирішує всі наші проблеми.
Дані коефіцієнта говорять нам про порядок змінних, відмінності між ними, і вони мають абсолютний нуль. Що дозволяє проводити та робити всілякі обчислення та умовиводи.
Дані коефіцієнта - це дуже схожі дані інтервалу, окрім нуля, це означає відсутність. Для даних коефіцієнтів неможливо мати від’ємні значення.
Наприклад, висота - це дані співвідношення. Не можна мати негативний зріст. Якщо висота об’єкта дорівнює нулю, тоді об’єкта немає. Це відрізняється від чогось типу температури. І 0 градусів, і -5 градусів є цілком дійсними і значущими температурами.
Тепер, коли у вас є основна обробка цих типів даних, ви повинні бути трохи готовішими до вирішення цього іспиту статистики.