Багатомірне шкалювання: визначення, цілі, завдання та приклад

Вивчення

Сучасне вивчення візуалізації почалося з комп’ютерної графіки, яка “з самого початку використовувалася для вивчення наукових проблем. Однак у перші роки недолік графічної потужності часто обмежував її корисність. Пріоритет на візуалізації почав розвиватися в 1987 році, з випуску особливого для комп’ютерної графіки і візуалізації в наукових обчисленнях. З тих пір було проведено кілька конференцій і семінарів, спільно організованих IEEE Computer Society і ACM SIGGRAPH”.

Вони були присвячені загальним темам візуалізації даних, візуалізації інформації і наукової візуалізації, а також більш конкретним галузям, таким як візуалізація обсягу.

Узагальнення

Узагальнене багатомірне шкалювання (ОМШ, GMDS) є розширенням метричного багатовимірного масштабування, в якому цільове простір неевклидово. Коли відмінності представляють собою відстані на поверхні, а цільове простір – це інша поверхня, GMDS дозволяє знаходити вкладення з мінімальним спотворенням однієї поверхні в іншу.

GMDS – це новий напрямок досліджень. В даний час основними додатками є розпізнавання деформівних об’єктів (наприклад, для тривимірного розпізнавання осіб) і накладення текстури.

Метою багатовимірного шкалювання є уявлення багатовимірних даних. Багатовимірні дані, тобто дані, для подання яких вимагається більше двох або трьох вимірів, буває важко інтерпретувати. Один з підходів до спрощення полягає в тому, щоб припустити, що цікавлять дані лежать на вкладеному нелінійному різноманітті в багатовимірному просторі. Якщо колектор має досить низьке вимір, дані можуть бути візуалізовані в низкоразмерном просторі.

Багато з нелінійних методів зменшення розмірності пов’язані з лінійними методами. Нелінійні методи можна в цілому класифікувати на дві групи: ті, які забезпечують відображення (або з багатовимірного простору в низкоразмерное вкладення, або навпаки), і ті, які просто дають візуалізацію. У контексті машинного навчання методи відображення можуть розглядатися як попередній етап виділення ознак, після якого застосовуються алгоритми розпізнавання образів. Зазвичай ті, які просто дають візуалізацію, засновані на даних про близькість – тобто вимірювання відстані. Багатомірне шкалювання у психології та інших гуманітарних науках також досить поширене.

Якщо кількість атрибутів велике, то простір унікальних можливих рядків також експоненціально велике. Таким чином, чим більше розмір, тим складніше стає зобразити простір. Це викликає багато проблем. Алгоритми, які працюють з багатовимірними даними, мають тенденцію до дуже високої складності. Скорочення даних до меншого числа вимірювань часто робить алгоритми аналізу більш ефективними і може допомогти алгоритмів машинного навчання робити більш точні прогнози. Тому багатомірне шкалювання даних настільки популярно.