Data Mining – це… Поняття, алгоритм проведення аналізу, призначення та застосування

Фараони і загадки минулих століть

Історію періодично переписували:

  • держави – заради своїх стратегічних інтересів;
  • авторитетні вчені – заради своїх суб’єктивних переконань.

Сказати що правда, а що брехня – важко. Застосування Data Mining дозволяє вирішити цю задачу. Наприклад, технологія будівництва пірамід описувалася літописцями і вивчалася вченими в різні століття. В Інтернет потрапили далеко не всі матеріали, що тут не все унікально, а у багатьох даних може не бути:

  • описуваного моменту часу;
  • часу складання опису;
  • дат, на яких грунтується опис;
  • автора (авторів), враховуються думок (посилань);
  • підтверджень об’єктивності.

У бібліотеках, храмах і «несподіваних місцях» можна виявити рукописи різних століть і матеріальні свідчення минулого.

Цікава мета: зібрати все воєдино і розкопати «істину». Особливість задачі: інформація може бути здобута від першого опису літописцем, ще за життя фараонів, до поточного століття, в якому дана задача вирішується сучасними методами безліччю вчених.

Обгрунтування для використання Data Mining: застосування ручної праці не можливо. Занадто великі кількості:

  • джерел інформації;
  • мов представлення інформації;
  • дослідників, які описують одне і теж по-різному;
  • дат, подій і термінів;
  • проблем кореляції термінів;
  • аналіз статистики по групам даних у часі може відрізнятися і пр.

В кінці минулого століття, коли чергове фіаско ідеї штучного інтелекту стало очевидним не тільки людині, але і досвідченому фахівцеві, з’явилася ідея: «відтворити особистість».

Наприклад, за творами Пушкіна, Гоголя, Чехова формується певна система правил, логіки поведінки і створюється інформаційна система, яка може відповідати на ті чи інші питання так, як це б зробив осіб: Пушкін, Гоголь чи Чехів. Теоретично така задача цікава, але практично її вкрай складно здійснити.

Однак, ідея такої задачі наводить на дуже практичну думка: «як створити інтелектуальний пошук інформації». Інтернет – це безліч ресурсів, що розвиваються, величезна база даних і це прекрасний привід застосувати Data Mining в поєднанні з людською логікою у форматі спільного розвитку.

Машина і людина в парі – прекрасна завдання і безсумнівний успіх в області інформаційної археології», якісні розкопки в даних і результати, які поставлять під сумнів, але поза всяким сумнівом дозволять отримати нові знання і будуть затребувані в суспільстві.