Багатофакторний аналіз: види, приклади, методи проведення аналізу, призначення і результати

Багатофакторний дисперсійний аналіз являє собою сукупність різних статистичних методів, які призначені для перевірки гіпотез і зв’язку між досліджуваними факторами і певними ознаками, що не мають кількісного опису. Також подібна методика дозволяє визначити ступінь взаємодії факторів та їх вплив на певні процеси. Всі ці визначення звучать досить заплутано, тому давайте розберемося в них більш детально в нашій статті.

Критерії та види дисперсійного аналізу

Метод багатофакторного дисперсійного аналізу найчастіше використовується для пошуку зв’язку між безперервної кількісної змінної і номінальними якісними ознаками. По суті, дана методика являє собою тестування різних гіпотез про рівність різних арифметичних вибірок. Таким чином, її можна розглядати і в якості критерію для порівняння декількох вибірок. Проте результати будуть ідентичними, якщо для порівняння використовується лише два елементи. Дослідження t-критерію показує, що подібна методика дозволяє вивчити проблему гіпотез більш детально, ніж будь-який інший відомий спосіб.

Також не можна не відзначити той факт, що деякі види дисперсійного аналізу базуються на певному законі: сума квадратів міжгрупових відхилень і сума квадратів внутрішньогрупових відхилень абсолютно рівні. В якості дослідження використовується критерій Фішера, який використовується для детального аналізу внутрішньогрупових дисперсій. Хоча для цього необхідні передумови нормальності розподілу, а також гомоскедастічності вибірок – рівність дисперсій. Що стосується видом дисперсійного аналізу, то розрізняють наступні:

  • багатовимірний або багатофакторний аналіз;
  • однофакторний або одновимірний аналіз.

Не важко здогадатися, що другий розглядає залежність однієї ознаки і досліджуваної величини, а перший – базується на аналізі відразу декількох ознак. Крім того, багатофакторна дисперсія не дозволяє виявляти більш міцний зв’язок між кількома елементами, оскільки досліджується залежність відразу декількох величин (хоча проводити метод набагато простіше).

Фактори

Задумалися про методи проведення багатофакторного кореляційного аналізу? Тоді вам слід знати, що для детального вивчення слід вивчити ті фактори, які контролюють обставини експерименту і впливають на кінцевий результат. Також під факторами можуть матися на увазі способи і рівні обробки значень, що характеризують конкретний прояв певної умови. У цьому разі цифри подаються в порядкової або номінальної системі вимірювань. Якщо ж виникає проблема, пов’язана з групуванням даних, доводиться вдаватися до використання однакових числових значень, що трохи змінює кінцевий результат.

Також слід розуміти, що кількість спостережень і груп не може бути надмірно великим, адже це призводить до надлишку даних і неможливості закінчити розрахунок. У той же час спосіб групування залежить не тільки від об’єму, але і від характеру варіювання значень. Розміри і кількість інтервалів в аналізі можуть визначатися за принципом рівних частот, а також однакових проміжків між ними. У підсумку всі отримані дослідження будуть вказані в статистиці багатофакторного аналізу, яка повинна базуватися на різних прикладах. До цього ми ще повернемося в наступних розділах.

Призначення дисперсійного аналізу

Отже, іноді можуть виникати ситуації, коли необхідно порівняти між собою дві або більше різних вибірок. У цьому разі логічніше всього буде застосувати багатофакторний кореляційно-регресійний аналіз, який базується на вивченні гіпотези і зв’язку різних факторів ступеня регресії. Також назва методики вказує на той факт, що в процесі дослідження використовуються різні складові дисперсії.

В чому суть дослідження? Для початку два або більше показників розбивають на окремі частини, кожна з яких відповідає дії певного фактора. Після цього проводиться ряд дослідницьких процедур на пошук взаємозв’язку різних вибірок та зв’язків між ними. Щоб більш детально розібратися в настільки складною, але цікавою методикою, рекомендуємо вивчити кілька прикладів багатофакторного кореляційного аналізу, наведених у наступних розділах нашої статті.

Приклад перший

У виробничому цеху є кілька автоматичних верстатів, кожен з яких призначений для виготовлення певної деталі. Розмір виробленого елемента являє собою випадкову величину, яка залежить не тільки від параметрів самого верстата, але і випадкових відхилень, які неминуче будуть виникати в результаті виробництва деталей. Але як робочого визначити правильність роботи верстата, якщо він спочатку виробляє деталі з шлюбом? Правильно, необхідно придбати таку ж деталь на ринку і порівняти її розміри з тим, що виходить під час виробництва. Після цього можна регулювати обладнання таким чином, щоб воно випускало деталі потрібних розмірів. І зовсім не важливо, що є виробничий шлюб, адже він також враховується при розрахунках.

У той же час якщо на верстатах будуть визначені показники, що дозволяють визначити інтенсивність регулювання (осей X і Y, глибини і так далі), то показники на всіх верстатах будуть абсолютно різними. Якщо вимірювання виявилися абсолютно однаковими, то виробничий шлюб можна не враховувати зовсім. Однак таке відбувається вкрай рідко, особливо якщо похибки вимірюються в міліметрах. Але якщо випущена деталь має ті ж розміри, що і стандарт, придбаний на ринку, значить ні про який шлюб не може бути й мови, оскільки при виробництві “ідеалу” також використовувався верстат, що дає певні похибки, які напевно також враховувалися робітниками.

Приклад другий

Для виготовлення певного приладу, що працює на електриці, необхідно використовувати кілька типів різної ізоляційної папери: електротехнічну, конденсаторну і так далі. Крім того, апарат може бути просочений смолою, лаком, епоксидним складам і іншими хімічними елементами, що подовжують термін експлуатації. Ну а різні витоку під вакуумним циліндром при підвищеному тиску легко усуваються за допомогою методу нагрівання або викачування повітря. Однак якщо майстер до цього використовував лише по одному елементу з кожного списку, в процесі виробництва за нової технології можуть виникнути різні труднощі. Причому, практично напевно, подібна ситуація викликана з одного елемента. Проте розрахувати, який саме фактор впливає на погану працездатність приладу, буде практично нереально. Саме тому рекомендується використовувати не багатофакторний метод аналізу, а однофакторний, щоб якнайшвидше розібратися з причиною несправності.

Звичайно ж, при використанні різних інструментів та приладів, які відстежують вплив того або іншого фактора на кінцевий результат, дослідження спрощується в рази, однак обзавестися подібними агрегатами починаючому інженеру буде не по кишені. Саме тому рекомендується застосовувати однофакторний дисперсійний аналіз, що дозволяє виявити причину неполадок за лічені хвилини. Для цього буде достатньо поставити перед собою одну з найбільш вірогідних гіпотез, після чого почати доводити її шляхом експериментів і аналізу показників працездатності приладу. Досить скоро майстру вдасться знайти причину неполадок і усунути її, замінивши одну з вибірок альтернативним варіантом.

Приклад третій

Ще один приклад багатофакторного аналізу. Припустимо, що тролейбусне депо може обслуговувати кілька маршрутів протягом доби. На цих маршрутах працюють тролейбуси абсолютно різних марок, а оплату за проїзд збирають 50 різних контролерів. Однак керівництво депо цікавиться тим, яким чином можна порівняти між собою кілька різних показників, що впливають на загальну виручку: марка тролейбуса, ефективність маршруту та вміння працівника. Щоб побачити економічну доцільність, необхідно детально проаналізувати вплив кожного з цих факторів на кінцевий результат. Приміром, деякі контролери можуть погано справлятися зі своїми обов’язками, тому доведеться найняти більш відповідальних співробітників. Більшість пасажирів не люблять їздити на старих тролейбусах, тому доцільніше всього використовувати нову марку. Однак якщо обидва цих чинника йдуть поряд з тим, що більша частина маршрутів є високо затребуваними, то чи варто взагалі щось змінювати?

Завдання дослідника полягає в тому, щоб за допомогою аналітичного методу отримати якомога більше корисної інформації з приводу впливу кожного з факторів на кінцевий результат. Для цього необхідно висувати як мінімум 3 різних гіпотези, які доведеться доводити різними способами. Дисперсійний аналіз дозволяє вирішити подібні завдання в максимально короткий термін і отримати максимум корисної інформації, особливо якщо використовується багатофазний метод. Однак не забувайте про те, що однофакторний аналіз дає куди більше впевненості з приводу впливу того чи іншого чинника, оскільки він досліджує вибірку більш детально. Приміром, якщо депо спрямує всі сили на аналіз роботи кондукторів, то можна буде виявити багато недобросовісних робітників на всіх маршрутах.

Однофакторний аналіз

Однофакторний аналіз – це сукупність методів дослідження, спрямованих на аналіз певного фактора на кінцевий результат у конкретному випадку. Також досить часто подібна методика використовується для порівняння найбільшого впливу між двома факторами. Якщо проводити аналогію з тим же депо, то слід спершу проаналізувати окремо вплив різних маршрутів і марок тролейбусів на прибутковість, після чого порівняти отримані результати між собою і визначити, в якому напрямку буде найкраще розвивати станцію.

Крім того, не варто забувати про таке поняття, як нульова гіпотеза – тобто гіпотеза, яка не може бути відкинутий і на неї у будь-якому випадку впливають всі фактори з перерахованих в тій чи іншій мірі. Навіть якщо ми будемо порівнювати між собою лише маршрути і тролейбусів марки, від впливу професіоналізму кондукторів все одно нікуди не дітися. Тому навіть якщо цей фактор не піддається аналізу, про вплив нульової гіпотези забувати не варто. Наприклад, якщо ви вирішили дослідити залежність прибутку від маршруту, пускайте в рейс одного і того ж кондуктора, щоб свідчення виявилися максимально точними.

Двохфакторну аналіз

Найчастіше цю методику також називають методом порівняння і використовують для того, щоб виявити залежність двох факторів один від одного. На практиці доведеться використовувати різні таблиці з точними показниками, щоб не заплутатися у власних розрахунках і вплив на них факторів. Наприклад, можна пустити за двома однаковими маршрутами два абсолютно різних тролейбуса в один і той же час, нехтуючи чинником нульової гіпотези (вибрати двох відповідальних кондукторів). У цьому випадку порівняння двох ситуацій буде максимально якісним, оскільки експеримент проходить в один і той же час.

Багатофакторний аналіз з повторними дослідами

Даний метод застосовується на практиці набагато частіше інших, особливо якщо мова йде про групу дослідників-початківців. Повторний досвід дозволяє не тільки переконатися під вплив того або іншого фактора на кінцевий результат, але і знайти помилки, які були допущені в ході дослідження. Приміром, більшість недосвідчених аналітиків забувають про наявність одного або відразу декількох нульових гіпотез, що призводить до отримання неточних результатів у ході дослідження. Продовжуючи приклад з депо, можна проаналізувати вплив тих чи інших факторів у різний сезон року, оскільки кількість пасажирів взимку сильно відрізняється від літнього. Крім того, повторний досвід може наштовхнути дослідника на нові ідеї і висунення нових гіпотез.

Відеоролик та висновок

Сподіваємося, наша стаття допомогла вам розібратися в тому, на чому заснований метод багатофакторного кореляційного аналізу. Якщо у вас до сих пір залишилися якісь питання по даній темі, то рекомендуємо переглянути невеликий відеоролик. В ньому у всіх подробицях розповідається про методи дисперсійного дослідження на конкретному прикладі.

Як бачите, багатофакторний аналіз – це досить складний, але дуже цікавий процес, який дозволяє виявити залежність певних факторів на кінцевий результат. Дана методика може застосовуватися абсолютно у всіх сферах життя і ефективно використовуватися для ведення бізнесу. Також модель багатофакторного аналізу можна використовувати для досягнення значних завдань за допомогою простих методів.