Метод кластеризації: опис, основні поняття, особливості застосування

Зовнішня оцінка

При такій разбалловке результати кластеризації оцінюються на основі даних, які не використовувалися для угруповання. Тобто таких, як відомі мітки класів і зовнішні тести. Такі питання складаються з набору попередньо класифікованих елементів, і вони часто створюються експертами (людьми). Таким чином, еталонні комплекти можна розглядати як золотий стандарт для оцінки. Ці типи методів оцінки вимірюють, наскільки кластеризація близька до заданих еталонним класів. Проте нещодавно обговорювалося, чи є це адекватним для реальних даних або тільки для синтетичних наборів з фактичної істинністю підстави. Оскільки класи можуть містити внутрішню структуру, а наявні атрибути можуть не допускати поділу кластерів. Крім того, з точки зору виявлення знань, відтворення відомих фактів необов’язково може дати очікуваний результат. У спеціальному сценарії обмеженою кластеризації, де метаінформація для (наприклад, мітки класів) вже використовується в процесі угруповання, утримання всіх відомостей для оціночних цілей не є тривіальним.

Тепер зрозуміло, що не відноситься до методів кластеризації, а які моделі застосовуються для цих цілей.