Математична статистика – це методологія, яка дозволяє приймати зважені рішення серед невизначених умов. Дослідження способів збору і систематизації даних, обробки підсумкових результатів дослідів і експериментів з масовими випадками і виявлення будь-яких закономірностей – це те, чим займається цей розділ математики. Розглянемо основні поняття математичної статистики.
Різниця з теорією ймовірностей
Методи математичної статистики тісно перетинаються з теорією ймовірностей. Обидва розділу математики займаються дослідженням численних випадкових явищ. Пов’язують дві дисципліни між собою граничні теореми. Проте існує велика різниця між цими науками. Якщо теорія імовірностей визначає на основі математичної моделі характеристики процесу в реальному світі, то математична статистика робить навпаки – встановлює властивості моделі на основі спостережуваної інформації.
Етапи
Застосування математичної статистики може здійснюватися тільки по відношенню до випадкових подій або процесів, а точніше, до даними, отриманими з спостереження за ними. І відбувається це в кілька етапів. Спочатку дані експериментів і дослідів проходять певну обробку. Їх впорядковують для наочності і зручності аналізу. Потім проводиться точна або приблизна оцінка необхідних параметрів спостережуваного випадкового процесу. Ними можуть бути:
- оцінка ймовірності тієї чи іншої події (ймовірність його спочатку невідома);
- вивчення поведінки невизначеної функції розподілу;
- оцінка математичного очікування;
- оцінка дисперсії
- і т. д.
Третій етап можна виділити перевірку будь-яких гіпотез, поставлених до проведення аналізу, тобто отримання відповіді на питання про те, наскільки результати експериментів відповідають теоретичним викладкам. За фактом, це основний етап математичної статистики. Прикладом може бути розгляд питання про те, чи є поведінка спостережуваного випадкового процесу в межах нормального закону розподілу.
Генеральна сукупність
У основні поняття математичної статистики входять генеральна та вибіркова сукупності. Дана дисципліна займається вивченням безлічі деяких об’єктів відносно якої-небудь властивості. В якості прикладу можна навести роботу таксиста. Розглянемо ці випадкові величини:
- завантаженість або кількість клієнтів: у добу, до обіду, після обіду, …;
- середній час поїздки;
- кількість заявок або їх прихильність до районам міста та багато іншого.
Варто також відзначити, що можна дослідити сукупність подібних випадкових процесів, яка також буде представляти собою випадкову величину, над якою можна проводити спостереження.
Отже, в методах математичної статистики всі безліч досліджуваних об’єктів або результатів різноманітних спостережень, які проводяться в однакових умовах над взятим об’єктом, називається генеральною сукупністю. Іншими словами, математично більш строго, це випадкова величина, яка визначена в просторі елементарних подій, з позначеним в ньому класом підмножин, елементи якого володіють певною ймовірністю.
Вибіркова сукупність
Бувають випадки, коли неможливо або недоцільне з якихось причин (вартість, витрати часу) провести суцільне дослідження для вивчення кожного об’єкта. Наприклад, відкривати кожну банку запечатаного варення для контролю його якості – сумнівне рішення, а спроба оцінити траєкторію кожної молекули повітря в кубічному метрі – нездійсненна. У таких випадках використовують спосіб вибіркового спостереження: з генеральної сукупності здійснюється вибір (як правило, випадковим чином) деякої кількості об’єктів, і їх піддають їх аналізу.
Ці поняття можуть здаватися складними спочатку. Тому, щоб найбільш повно зрозуміти тему, потрібно вивчати підручник Ст. Е. Гмурмана “Теорія ймовірностей і математична статистика”. Таким чином, вибіркова сукупність або вибірка – це ряд об’єктів, обраних випадковим чином з генерального множини. Говорячи строгим математичним мовою, це послідовність незалежних, рівномірно розподілених випадкових величин, для кожної з яких розподіл збігається з тим, яке визначене для генеральної випадкової величини.
Основні поняття
Розглянемо ряд інших основних понять математичної статистики. Кількість об’єктів у генеральною сукупністю або вибіркою називається об’ємом. Значення вибірки, які отримують в ході експерименту, називається реалізацією вибірки. Щоб оцінка генеральної сукупності на основі вибіркової була достовірною, важливо мати так звану представницьку або репрезентативну вибірку. Це означає, що вибірка повинна в повному обсязі представляти генеральну сукупність. Домогтися цього можна тільки в тому випадку, коли всі елементи генеральної сукупності мають рівну ймовірність опинитися у вибірці.
Вибірки розрізняють з поверненням та без повернення. У першому випадку у вмісті вибірки повторний елемент повертається в генеральну безліч, у другому – немає. Зазвичай на практиці застосовується вибірка без повернень. Слід також зазначити, що обсяг генеральної сукупності завжди значно перевершує обсяг вибірки. Існує безліч варіантів процесу вибірки:
- простий – елементи вибираються випадковим чином по одному;
- типізований – генеральна сукупність поділяється на типи, і з кожного виробляється вибір; прикладом може послужити опитування жителів: чоловіки і жінки окремо;
- механічний – наприклад, вибрати кожен 10-й елемент;
- серійний – вибір проводиться серіями елементів.
Статистичне розподіл
Згідно Гмурману, теорія ймовірностей і математична статистика є вкрай важливими дисциплінами в науковому світі, особливо в практичній його частини. Розглянемо статистичний розподіл вибірки.
Нехай у нас є група студентів, до якої було проведено тестування з математики. В результаті у нас є сукупність оцінок: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 – це наш первинний статистичний матеріал.
Насамперед нам потрібно його впорядкувати, або провести операцію ранжування: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 – і отримати, таким чином, варіаційний ряд. Кількість повторень кожної з оцінок при цьому називається частотою оцінки, а їх відношення до обсягу вибірки – відносною частотою. Складемо таблицю статистичного розподілу вибірки, або просто статистичний ряд:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
або
ai | 1 | 2 | 3 | 4 | 5 |
pi* | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
Нехай у нас є випадкова величина, над якою ми будемо проводити серію експериментів і дивитися, яке значення приймає ця величина. Припустимо, вона прийняла a1 – m1 разів; a2 – m2 разів і т. д. Об’ємом даної вибірки буде m1 + … + mk = m. Безліч ai, де i змінюється від 1 до k, являє собою статистичний ряд.
Інтервальний розподіл
У книзі Ст. Е. Гмурмана “Теорія ймовірностей і математична статистика” також представлений інтервальний статистичний ряд. Його складання можливо, коли значення досліджуваного ознаки безперервно в певному інтервалі, і число значень велике. Розглянемо групу студентів, а точніше, їх зростання: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159, 173, 171, 164, 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 – всього 30 студентів. Очевидно, що ріст людини – це безперервна величина. Нам потрібно визначити крок інтервалу. Для цього використовується формула Стерджеса.
h= | max – min | = | 190 – 156 | = | 33 | = | 5,59 |
1+log2m | 1+log230 | 5,9 |
Таким чином, за розмір інтервалу можна прийняти величину 6. Також слід сказати, що значення 1+log2m – це формула для визначення кількості інтервалів (зрозуміло, з відповідним округленням). Таким чином, виходить за формулами 6 інтервалів, кожен з яких має розмір 6. І першим значенням початкового інтервалу буде число, яке визначається за формулою: min – h/2 = 156 – 6/2 = 153. Складемо таблицю, яка буде містити інтервали і число студентів, зростання яких потрапив в певний інтервал.
H | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P* | 0,06 | 0,17 | 0,1 | 0,3 | 0,27 | 0,1 |
Зрозуміло, це далеко не все, бо в математичній статистиці формул куди більше. Ми розглянули лише деякі базові поняття.
Графік розподілу
У основні поняття математичної статистики також входить графічне представлення розподілу, яке відрізняється наочністю. Існує два види графіків: полігон та гістограма. Перший використовується для дискретного статистичного ряду. А для безперервного розподілу, відповідно, другий.