Валідизація – це… Визначення, типи, види, критерії

Які бувають види валідизації? Що це таке? Відповіді на ці та інші питання ви знайдете в статті. Валідність за своєю суттю – це єдина характеристика, яка включає, з одного боку, дані про те, чи придатна технологія для виміру того, для чого вона була розроблена, а з іншого боку, яка її ефективність, практична корисність, дієвість. Перевірку валідності технології іменують валидизацией. Більш детально її розглянемо нижче.

Види

Багато людей запитують: «Валідизація – що це таке». Кажуть, що для витонченого розуму не існує кордонів. Методологи ніби змагаються між собою в тому, хто більше знайде або придумає типів і видів валідності. Яких тільки назв не виникло останнім часом! Виявляється, є:

  • валідність зовнішня і внутрішня;
  • конвергентна;
  • дискриминантная;
  • очевидна;
  • факторна;
  • прогностична;
  • конструктна;
  • критеріальна;
  • змістовна і так далі.

Розібратися, а тим більш толково відрізнити одну варіацію від іншої, немає ніякої можливості. Плутанина у визначенні і класифікації призводить до того, що різні автори одній і тій же формі валідності приписують зовсім різнорідні способи її поліпшення.

Зовнішні критерії

Для виконання прагматичної валідизації методики, тобто для оцінки її практичної значущості, дієвості, ефективності, зазвичай застосовують зовнішній незалежний критерій – показник вияву досліджуваної якості у буденному житті. Таким критерієм можуть бути і виробничі досягнення (для технологій професійної спрямованості), і успішність (для тестів інтелекту, досягнень чи здібностей до навчання), та ефективність фактичної діяльності – моделювання, малювання і так далі (тестів особливих умінь), персональні оцінки (для перевірки особи).

Типи зовнішніх критеріїв валідизації існують наступні:

  • мірки виконання (в їх число можуть входити такі як, кількість реалізованої роботи, витрачений на навчання час, успішність, темп зростання кваліфікації тощо);
  • фізіологічні ознаки (застосовуються при вивченні впливу навколишнього середовища та інших ситуаційних змінних на психіку і організм людини);
  • заміряються тиск крові, частота пульсу, симптоми стомлення, електроопір шкіри і так далі;
  • суб’єктивні мірки (включають різноманітні види відповідей, що відбивають ставлення людини до кого-небудь або чого-небудь, його погляди, думки, переваги; як правило, такі мірки отримують з допомогою анкет, опитувальників, інтерв’ю);
  • ознаки випадковостей (використовуються, коли мета вивчення стосується, наприклад, проблеми селекції для роботи таких людей, які нещасних випадків менше схильні).

Валідність емпірична. Про що мова?

Мало хто знає, що таке емпірична валідизація. У випадку з змістовної валідністю тест оцінюється експертами (встановлюють відповідність завдань випробування змістом об’єкта вимірювання). А емпірична завжди заміряється з допомогою коррелирования статистичного: калькулюється кореляція двох типів значень – балів по тесту та індексів за зовнішнім параметром, обраному у вигляді критерію достовірності.

Конструктна

Типи методів валідизації знають не всі. Що собою являє конструктна валідність? Вона має відношення до теоретичного конструкту самому по собі і складається з пошуку факторів, які пояснюють поведінку при виконанні тесту.

Як специфічний тип конструктна валідність узаконена у статті Миля і Кронбаха (1955). З допомогою цієї форми валідності автори оцінювали всі тестові обстеження, які на передбачення деяких значущих критеріїв не були безпосередньо спрямовані. Дослідження містило відомості про психологічні конструкти к.

Валідність за змістом

Ви досі питаєте: «Валідизація – що це таке». Розглянемо змістовну валідність. Вона вимагає, щоб кожна задача, питання або завдання, що належать до встановленої сфері, мали однакові шанси перетворитися на завдання тесту.

Валідність змісту оцінює придатність сутності тесту вимірюваної зоні поведінки. Повірки, створені двома групами розробників, що проводяться на вибірці перевіряються. Надійність тестів калькулюється шляхом розщеплення питань на дві зони, в результаті чого виходить індекс змістовної валідності.

Прогностична

Продовжуємо розглядати методи валідизації. Прогностична валідність встановлюється також по зовнішньому, досить надійному критерію. Але відомості про нього збираються через деякий час після перевірки.

Зовнішнім мірилом зазвичай буває виявлену в будь-яких оцінках покликання індивідуума до того виду занять, для яких він відбирався за підсумками діагностичних тестів.

Хоча ця метода найбільш відповідає завданню діагностичних засобів – прогнозу майбутньої успішності, його застосовувати досить складно. Точність прогнозу перебуває у зворотній підпорядкованості від часу, призначеного для такого передбачення. Чим більше після вимірювання часу проходить, тим більша кількість чинників потрібно враховувати, оцінюючи прогностичну значущість технології. Однак врахувати всі фактори, що впливають на прогноз, майже неможливо.

Ретроспективна

Погодьтеся, валідизація – це досить складний процес. Відомо, що ретроспективна валідність виявляється на базі критерію, що відображає стан якості або події в минулому. Може застосовуватися для миттєвого отримання даних про пророчі джерелах технології. Так, для ревізії того, якою мірою хороші підсумки тесту умінь відповідають швидкого навчання, можна порівняти попередні експертні висновки, оцінки успішності і так далі у осіб з низькими і високими на даний момент діагностичними індексами.

Дискриминантная і конвергентна

Види валідизації цікаві багатьом. З’ясуємо, що собою представляють дискриминантная і конвергентна валідність. Від того, як психолог виявляє конструкт діагностичний, залежить стратегія введення в тест встановлених пунктів. Якщо Айзенк якість «нейротизм» визначає як незалежне від інтроверсії-екстраверсії, то це означає, що в його анкеті мають бути порівну представлені позиції, які будуть схвалювати невротичні екстраверти та інтроверти.

Якщо ж на практиці виявиться, що в завданні пункти з квадранта «інтроверсія-невротизм» будуть переважати, то з позиції теорії Айзенка, це означає, що показник «нейротизм» навантажений иррелевантным показником – «интроверсией». Ідентичний ефект з’являється тоді, коли виникає перекіс у вибірці – якщо невротичних інтровертів в ній буде більше, ніж таких же екстравертів.

Для того щоб уникнути таких труднощів, психологи бажають мати справу з такими емпіричними пунктами, які інформують лише про єдиному факторі. Але реально це вимога не виконується ніколи: кожен емпіричний індекс виявляється детермінований не тільки тим фактором, який нам необхідний, але і іншими – иррелевантными проблеми вимірювання.

Таким чином, щодо факторів, концептуально визначаються як ортогональні до вымериваемому (зустрічаються з ним у всіх поєднаннях), творець тесту зобов’язаний, відбираючи пункти, використовувати стратегію неподлинного балансування.

Відповідність пунктів вымериваемому показником гарантує конвергентну валідність тесту. Узгодженість пунктів щодо иррелевантных джерел забезпечує дискримінантну валідність. Емпірично вона проявляється у відсутності суттєвої кореляції з тестом, вымеривающим концептуально одноосібне якість.

Набір засобів

В загальний набір способів валідизації автори зазвичай включають:

  • неформалізовані (від нехитрих прийомів уважно переглянути перелік альтернатив у анкеті до більш складних процедур поетапного теоретичного аналізу);
  • формалізовані, куди відносять процедури і технології математичної статистики: перевірку статистичних гіпотез, обчислення оцінок, кореляційний аналіз, побудова довірчих інтервалів, оцінку відносин між змінними, дисперсний, факторний, регресійний та структурний аналізи і так далі.

Створення інструментів

І все-таки, валідизація – це що таке? Вишукані інструменти валідизації першими почали створювати психологи. Ще в 1959 році була розроблена особлива методика Д. Фіске і Д. Кампбеллом (США). Вона отримала цілком природне для англійської, але неперекладне на нашу мову, найменування: мультиметодная-мультичертовая матриця (МТММ). Ця матриця являла собою таблицю кореляцій. Вона складалася з двох вельми привабливих винаходів, один з яких призначався для виявлення конвергентної істинності, а інше – для дискримінантної.

Її автори стверджували, що кожен зможе довести внутрішню прийнятність, якщо:

  • величини, між якими предположен високий рівень теоретичної зв’язку, виявлять ідентичний рівень в емпірії (конвергенція);
  • величини, теоретично не пов’язані між собою, будуть не пов’язаними і емпірично після виконання випробування (дискримінація).

Грубо кажучи, конвергентна валідність повинна виявити, що між двома командами найманих фахівців, наприклад, будівельними і конвеєрними робітниками, щодо шансів на ринку праці набагато більше схожості, ніж між власниками і найманими працівниками. Якщо теоретично намічена зв’язок виявлена емпірично, ваш зразок валиден.

Валідність дискриминантная виявляє ступінь ідентифікації різних явищ. Якщо взяти той же приклад з ринком праці, то потрібно очікувати, що відмінно побудована теорія може закладеними в неї засобами відрізнити можливості власників і найманих працівників на ринку праці. Плутати їх не можна, і ваша теорія їх розрізнити здатна.

Якщо ви створили шкалу, вымеривающую математичні здібності, то в разі валідності конвергентної індекси математичних обдарувань повинні добре корелювати з загальними вміннями людини, якщо на теоретичному рівні така зв’язок є, і погано – з естетичними здібностями, які вимагають від людини зовсім інших талантів, ніж навички рахунку, якщо, звісно ж, низька кореляція проголошується вашою теорією.

Типи

Валидизацией називається процес налаштувань, поліпшення створюваної психодіагностичної методи. Його базової завданням є прагнення домогтися того, щоб технологія діагностувала саме те, що необхідно розробнику. Розрізняють валідизацію теоретичну і прагматичну.

Для першого типу кардинальною проблемою є відношення між психічними явищами та їх індексами, з допомогою яких ці явища намагаються пізнати. Вона показує, що підсумки методики і абстрактний задум автора збігаються.

Для встановлення абстрактної валідності відшукати який-небудь самостійний критерій, що перебуває поза методики, дуже складно. В історії психодіагностики на ранніх етапах тому опора була на інстинктивну концепцію про те, що тест вимірює:

  • Методу визнавалася валидной, якщо це просто «очевидно».
  • Доказ валідності базувалася на впевненості дослідника в тому, що його технологія дозволяє зрозуміти тестованого».
  • Схема розглядалася як валидная лише тому, що теорія, на базі якої створювалася технологія, «дуже хороша».
  • Далі почалися пошуки доказів, виправданих наукою. Тут треба відзначити те, що величезне значення в цьому процесі має непомітний нагромадження арсеналу технологій з вже обґрунтованою і відомої валідністю. Якщо психодіагност створює схему для оцінки якого-небудь якості і при цьому відомо, що на цю ж оцінку спрямовані інші, валідні технології, то можна вивчити кореляцію, порівняти підсумки по чужій і своїй методі.

    Якщо коефіцієнт кореляції виявиться занадто високим, значить, створюється схема володіє значною абстрактної валідністю. Якщо ви сумніваєтеся в тому, чому саме дає оцінку технологія, порівняйте підсумки по ній з результатами по чужих валідним схемами, розпізнає суміжні (підозрілі) властивості. Якщо величини кореляції виявляться несподівано великими, можна зробити висновок, що методу оцінює не те, що очікувалося.

    Таким чином, якщо вже є чужі схеми, спрямовані на вымеривание точно таких же норм або суміжних, можна визначити дискримінантну і конвергентну валідність.

    Нюанси

    Отже, валідизація – що це? Простими словами кажучи, – це ревізія продукції на те, наскільки вона збігається із заявленими характеристиками. Тобто, якийсь смартфон валідацію не відбудеться до тих пір. Поки клієнти не впевняться, що він оснащений саме такими камерою і об’ємом пам’яті, за які вони готові заплатити.

    Критерієм валідизації іменують незалежну і безпосередню від валидизируемого тесту міру психічного якості, на дослідження якого спрямована психодиагностичекая схема.

    Поточна валідність – особливість тесту, що відображає його здатність розрізняти випробовуваних на базі діагностичного ознаки, що є об’єктом вивчення у даній методі.

    Конкурентна валідність оцінюється по кореляції створеного тесту з іншими, валідність яких щодо вымеряемого параметра встановлена. Диференціальна валідність може бути розтлумачити на прикладі тестів інтересів.