Статистична інформація: збір, обробка, аналіз

Що таке тип даних

Тип даних є фундаментальним компонентом семантичного вмісту змінної і контролює, які види імовірнісних розподілів можуть логічно використовуватися для опису змінної, допустимих операцій над нею, типу регресійного аналізу, використовуваного для її прогнозування, і т. д. Концепція типу даних схожа на концепцію рівня виміру, але більш конкретна – наприклад, для підрахунку даних потрібно інший розподіл Пуассона або біноміальний), ніж для невід’ємних реальних значень, але обидва підпадають під той же рівень вимірювання (шкала коефіцієнтів).

Шкали

Були зроблені різні спроби створити таксономію рівнів вимірювання для обробки статистичної інформації. Психофизик Стенлі-Сміт Стівенс визначив номінальні, порядкові, інтервальні та пропорційні шкали. Номінальні виміри не мають значущого порядку рангів серед значень і допускають будь-яке однозначне перетворення. Звичайні виміри мають неточні відмінності між послідовними значеннями, але відрізняються значущим порядком цих значень і допускають будь зберігає порядок перетворення. Інтервальні виміри мають значущі відстані між вимірами, але нульове значення є довільним (як у випадку вимірів довготи і температури в градусах Цельсія або Фаренгейта) і допускає будь-яке лінійне перетворення. Вимірювання відносини мають як значуще нульове значення, так і відстані між різними певними вимірами і допускають будь-яке перетворення масштабування.

Дані, які не можуть бути описані з використанням одного числа, часто включаються в випадкові вектори речових випадкових величин, хоча існує зростаюча тенденція обробляти їх самостійно. Такі приклади будуть розглянуті нижче.