Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - 4.1. Принципи функціонування автоматичних засобів видобування знань
4.1. Принципи функціонування автоматичних засобів видобування знань
Для аналізу і розв'язання задач різного характеру, в тому числі і економічних, сучасні інформаційні технології пропонують широкий спектр засобів прийняття рішень - людино-машинні інтерактивні системи, які дозволяють особам, що приймають рішення, використовувати дані, знання, об'єктивні чи суб'єктивні моделі. Необхідно зазначити, що вибір засобу для обробки інформації обумовлюється властивостями поставленої задачі.
Структуровані задачі містять кількісні та якісні змінні, підлягають формалізації, яка нескладно реалізується. Надалі для них можна розробити повністю структуровані процедури знаходження рішень.
Слабоструктуровані задачі містять як кількісні, так якісні змінні, для них можна частково розробити структуровані процедури знаходження рішень.
Неструктуровані задачі містять лише якісні описи, їх неможливо формалізувати, вимагають нестандартних процедур прийняття рішень, де використовуються досвід, кваліфікація та інтуїція людини.
Існує два способи отримання знань: документальний і експертний. В першому випадку відомості містяться у різноманітних інформаційних джерелах (книги, документи, бази даних, інформаційні системи і т. п.). Експертний спосіб припускає видобування і структуризацію знань з пам'яті людини - експерта, або фахівця в наочній області. Використовується для рішення неструктурованих задач.
Серед методів першої групи в економіці поширені методи математичної статистики, що вирішують спектр задач, проте не дозволяють знаходити і видобувати знання з масивів даних. Також, високі вимоги до кваліфікації кінцевих користувачів обмежують їх використання.
Серед другої групи поширені так звані експертні системи - спеціальні комп'ютерні програми, що моделюють процеси розмірковування та прийняття рішення людини. Наприклад, експертна система ухвалення рішень на ринку цінних паперів, експертна система оцінки кредитних ризиків, тощо. Висока вартість створення і впровадження експертних систем, нездатність людей знаходити складну і нетривіальну залежність, часто відсутність фахівців, здатних грамотно структурувати свої знання також ускладнюють популяризацію такого підходу.
Специфіка сучасних вимог до обробки інформації робить безсилим як статистичні, так і експертні підходи в багатьох практичних областях, у тому числі і економічних. Тому для аналізу сучасних баз даних методи повинні бути ефективними, простими у використанні, володіти значним рівнем масштабності і певною автоматизованістю.
Методи виявлення знань можна умовно розбити на п'ять груп:
O класифікація;
O кластеризація - групування об'єктів на основі даних, що описують сутність об'єкту. Об'єкти всередині кластера повинні бути "подібними" один на одного і відрізнятися від об'єктів, що увійшли до інших кластерів. Ступінь подібності об'єктів характеризує точність кластеризації. Для економічних задач використовують термін сегментація;
O регресія, у тому числі і задача прогнозування. Це встановлення залежності вихідних змінних від вхідних. До цього ж типу задач відноситься і прогнозування часового ряду на основі хронологічних даних.
O асоціація - виявлення закономірностей між пов'язаними подіями. Прикладом такої закономірності служить правило, яке вказує, що з події X випливає подія Y.
Такі правила називаються асоціативними. Вперше ця задача була розв'язана для знаходження типових шаблонів покупок в супермаркетах, тому іноді її ще називають аналізом споживчого кошика (market basket analysis).
Послідовні шаблони - встановлення закономірностей між пов'язаними у часі подіями
Розглянуті вище задачі знайшли широке застосування при видобуванні знань економічного характеру. Розглянемо декілька наступних прикладів.
Класифікація використовується у випадку, коли класи об'єктів є наперед відомими. Наприклад, віднесення нового товару певної товарної групи (продовольчі, промислові), віднесення клієнта до визначеної категорії (постійний клієнт, новачок). При кредитуванні це може бути, наприклад, віднесення клієнта за певними ознаками до однієї з груп ризику.
Кластеризація може використовуватися для сегментації і побудови профілів клієнтів (покупців). При достатньо великій кількості клієнтів неможливо розробити для кожного індивідуальний підхід. Тому клієнтів зручно об'єднати в групи - сегменти з однорідними ознаками (групами ознак). Це можуть бути сегменти по сфері діяльності, по географічному розташуванню. Після сегментації можна отримати відомості, які саме сегменти є найактивнішими, які приносять найбільший прибуток, виділити характерні для них ознаки. Ефективність роботи з клієнтами підвищується за рахунок обліку їх персональних переваг.
Регресія використовується для встановлення залежності в чинниках. Наприклад, в задачі прогнозування залежною величиною є обсяги продажів, а чинниками, що впливають на цю величину, можуть бути попередні обсяги продажів, зміна курсу валют, активність конкурентів і т. д. Або, наприклад, при кредитуванні фізичних осіб вірогідність повернення кредиту залежить від особистих характеристик людини, сфери його діяльності, наявності майна, платоспроможності, тощо.
Асоціації допомагають виявляти товари, які люди купують одночасно. Це може бути корисно для більш зручного розміщення товару на прилавках, стимулювання продажів (наприклад: розміщення гірчиці чи кетчупу біля сосисок, чаю біля печива гарантує збільшення сукупних обсягів продажу цих продуктів).
Послідовні шаблони можуть використовуватись при плануванні продажів або наданні послуг. Наприклад: якщо людина придбала фотоплівку, то через деякий час віддасть її на проявлення і замовить друк фотографій.
Застосовуючи індуктивні методи до множини вхідних даних можна виявити нелінійні закономірності та видобути певні знання. Проте, незалежно від методу, їх якість та важливість насамперед залежить від якості, змістовності та повноти даних, що будуть проаналізовані.
Схожі статті
-
4.1. Принципи функціонування автоматичних засобів видобування знань Для аналізу і розв'язання задач різного характеру, в тому числі і економічних,...
-
Дані представляють собою спосіб представлення, збереження та елементарних операцій обробки інформації. Дані - це основа інформації. Поняття "дані" -...
-
Життєвий цикл (ЖЦ) фіксує найбільш істотні, характерні для певного об'єкту стани, визначає їх основні характеристики та значення в даних станах, а також...
-
Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - ВСТУП
Поняття "інформаційна технологія" (ІТ) у сучасному контексті набуває особливої багатогранності та поширюється на всі області діяльності людини, оскільки...
-
Основною метою систем чи підсистем, що розробляються, є необхідність отримання бажаного результату в межах деякого інтервалу часу. В інформаційних...
-
Структурування інформації пов'язане з необхідністю її зберігання, обробки чи передачі. Структуру економічної інформації визначає її будова, відокремлення...
-
Кодування представляє собою процес присвоєння коду об'єкту класифікації. Кодування забезпечує унікальну ідентифікацію об'єктів, яка в сукупності з...
-
Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - Технологічні модулі
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
Інформаційні процеси та інформаційні технології, що їх обслуговують, поділяють на наступні компоненти: Інформаційно-технологічна система Це...
-
2.1. Види інформації. Поняття економічної інформації В Законі України " Про інформацію" визначено наступні види інформації: O статистична інформація; O...
-
Опис класифікаційних угруповань, кодових позначень та найменувань об'єктів міститься в документі, який називається класифікатором. Класифікатор -...
-
Практика використання інформаційних технологій для моделювання та автоматизації підтримки прийняття рішень в управлінні соціально-економічними процесами...
-
2.1. Види інформації. Поняття економічної інформації В Законі України " Про інформацію" визначено наступні види інформації: O статистична інформація; O...
-
3.1. Етапи розвитку інформаційних технологій Інформаційні технології посідають чільне місце в нашому житті, тому це поняття є багатофункціональним та...
-
Інформаційна технологія представляє собою комплекс збору, передачі, обробки, збереження і доведення до користувача інформації, що реалізована сучасними...
-
3.1. Етапи розвитку інформаційних технологій Інформаційні технології посідають чільне місце в нашому житті, тому це поняття є багатофункціональним та...
-
Для забезпечення повноцінного і ефективного обміну інформацією як всередині ІС, так і між різними ІС, автоматизації роботи з даними різних типів,...
-
1.1. Визначення поняття технології Словник іншомовних слів визначає технологію як сукупність способів переробки матеріалів, виготовлення виробів і...
-
1.1. Визначення поняття технології Словник іншомовних слів визначає технологію як сукупність способів переробки матеріалів, виготовлення виробів і...
-
1.1. Визначення поняття технології Словник іншомовних слів визначає технологію як сукупність способів переробки матеріалів, виготовлення виробів і...
-
Обсяг інформації вимірюється кількістю символів (розрядів) у повідомленні. У різних системах обчислення один розряд має різну вагу, і відповідно...
-
Юридична психологія - Бочелюк В. Й. - РОЗДІЛ 1 ЮРИДИЧНА ПСИХОЛОГІЯ В СИСТЕМІ ПСИХОЛОГІЧНИХ ЗНАНЬ
1.1. Психологія як наука. Предмет і завдання юридичної психології Внутрішній світ кожної окремої людини називають також суб'єктивним, підкреслюючи тим...
-
Термін "безпека" використовується в розумінні мінімізації вразливості активів і ресурсів. Актив - це те, що має якесь значення (вартість), вразливість -...
-
Термін "безпека" використовується в розумінні мінімізації вразливості активів і ресурсів. Актив - це те, що має якесь значення (вартість), вразливість -...
-
Термін "безпека" використовується в розумінні мінімізації вразливості активів і ресурсів. Актив - це те, що має якесь значення (вартість), вразливість -...
-
Звичайно, що побудова такої важливої підсистеми має відбуватись на науковій основі згідно з основоположними началами її функціонування, таким чином можна...
-
Лекція 2. СТВОРЕННЯ ЗАСОБІВ ПОДАННЯ НАВЧАЛЬНИХ МАТЕРІАЛІВ ЗА ДОПОМОГОЮ ТЕКСТОВОГО ПРОЦЕСОРА. MICROSOFT OFFICE WORD 2007 Основні поняття: інтегрована...
Інформаційні технології та моделювання бізнес-процесів - Томашевський О. М. - 4.1. Принципи функціонування автоматичних засобів видобування знань