Статистичне моделювання: методи, опис, застосування

Приклади моделей

Припустимо, що у нас є популяція школярів з рівномірно розподіленими за віком дітьми. Зріст дитини буде стохастически пов’язаний з віком: наприклад, коли ми знаємо, що дитині 7 років, це впливає на ймовірність того, що дитина буде зростом 5 футів (приблизно 152 см). Ми могли б формалізувати цю взаємозв’язок у моделі лінійної регресії, наприклад: зростання = b0 + b1agei + εi, де b0 – перетин, b1 – параметр, на який множиться вік при отриманні прогнозу зростання, εi – термін помилки. Це означає, що зростання прогнозується віком з деякою помилкою.

Допустима модель повинна відповідати всім точкам даних. Таким чином, пряма лінія (heighti = b0 + b1agei) не може бути рівнянням для моделі даних – якщо тільки вона точно не відповідає всім точкам даних, тобто всі точки даних ідеально лежать на лінії. Член помилки εi повинен бути включений в рівняння, щоб модель відповідала всім точкам даних.

Щоб зробити статистичний висновок, нам спочатку необхідно прийняти деякі імовірнісні розподілу для εi. Наприклад, ми можемо припустити, що розподілу εi є Гауссовскими, з нульовим середнім параметром. В цьому випадку модель буде мати 3 параметри: b0, b1 і дисперсію розподілу Гауса.