Dss – системы поддержки принятия решений – сппр. Понятие системы поддержки принятия решений (сппр)

Целью написания этой статьи было сделать краткий обзор принципов построения Интеллектуальных Систем Поддержки Принятия Решений (ИСППР ), роли машинного обучения, теории игр, классического моделирования и примеров их использования в СППР. Целью статьи не является забуриться вглубь тяжелой теории автоматов, самообучаемых машин, равно как и инструментов BI.

Введение

Существет несколько определений ИСППР , которые, в общем-то, крутятся вокруг одного и того же функционала. В общем виде, ИСППР - это такая система, которая ассистирует ЛПР (Лицам, Принимающим Решения) в принятии этих самых решений, используя инструментарии дата майнинга, моделирования и визуализации, обладает дружелюбным (G)UI, устойчива по качеству, интерактивна и гибка по настройкам.

Зачем нужны СППР :

  1. Сложность в принятии решений
  2. Необходимость в точной оценке различных альтернатив
  3. Необходимость предсказательного функционала
  4. Необходимость мультипотокового входа (для принятия решения нужны выводы на основе данных, экспертные оценки, известные ограничения и т.п.)
Первые СППР (тогда еще без И) выросли из СПТ (Систем Процессинга Транзакций), в середине 60-х - начале 70-х. Тогда эти системы не обладали никакой интерактивностью, представляя собой, по сути, надстройки над РСУБД, с некоторым (совсем не большим) функционалом численного моделирования. Одной из первых систем можно назвать DYNAMO, разработанную в недрах MIT и представлявшую собой систему симуляции каких-либо процессов на основе исторических транзакций. После выхода на рынок мейнфреймов IBM 360 стали появляться и условно-коммерческие системы, применявшиеся в оборонке, спецслужбах и НИИ.

С начала 80-х уже можно говорить о формировании подклассов СППР , таких как MIS (Management Information System), EIS (Executive Information System), GDSS (Group Decision Support Systems), ODSS (Organization Decision Support Systems) и др. По сути, эти системы представляли собой фреймворки, спососбные работать с данными на различных уровнях иерархии (от индивидуального до общеорганизационного), а внутрь можно было внедрить какую угодно логику. Примером может служить разработанная Texas Instruments для United Airlines система GADS (Gate Assignment Display System), которая поодерживала принятие решений в Field Operations - назначение гейтов, определение оптимального времени стоянки и т.п.

В конце 80-х появились ПСППР (Продвинутые - Advanced), которые позволяли осуществлять «what-if» анализ и использовали более продвинутый инструментарий для моделирования.

Наконец, с середины 90-х на свет стали появляться и ИСППР , в основе которых стали лежать инструменты статистики и машинного обучения, теории игр и прочего сложного моделирования.

Многообразие СППР

На данных момент существует несколько способов классификации СППР, опишем 3 популярных:

По области применения

  • Бизнес и менеджмент (прайсинг, рабочая сила, продукты, стратегия и т.п.)
  • Инжиниринг (дизайн продукта, контроль качества...)
  • Финансы (кредитование и займы)
  • Медицина (лекарства, виды лечения, диагностика)
  • Окружающая среда

По соотношению данные\модели (методика Стивена Альтера)

  • FDS (File Drawer Systems - системы предоставления доступа к нужным данным)
  • DAS (Data Analysis Systems - системы для быстрого манипулирования данными)
  • AIS (Analysis Information Systems - системы доступа к данным по типу необходимого решения)
  • AFM(s) (Accounting & Financial models (systems) - системы рассчета финансовых последствий)
  • RM(s) (Representation models (systems) - системы симуляции, AnyLogic как пример)
  • OM(s) (Optimization models (systems) - системы, решающие задачи оптимизации)
  • SM(s) (Suggestion models (systems) - системы построения логических выводов на основе правил)

По типу использумого инструментария

  • Model Driven - в основе лежат классические модели (линейные модели, модели управления запасами, транспортные, финансовые и т.п.)
  • Data Driven - на основе исторических данных
  • Communication Driven - системы на оснвое группового принятия решений экспертами (системы фасилитации обмена мнениями и подсчета средних экспертных значений)
  • Document Driven - по сути проиндексированное (часто - многомерное) хранилище документов
  • Knowledge Driven - внезапно, на основе знаний. При чем знаний как экспертных, так и выводимых машинно

Я требую жалобную книгу! нормальную СППР

Несмотря на такое многообразие вариантов классификаций, требования и атрибуты СППР хорошо ложатся в 4 сегмента:
  1. Качество
  2. Организация
  3. Ограничения
  4. Модель
На схеме ниже покажем, какие именно требовани и в какие сегменты ложаться:

Отдельно отметим такие важные атрибуты, как масштабируемость (в ныне одном подходе agile никуда без этого), способность обрабатывать плохие данные, юзабилити и user-friendly interface, нетребовательность к ресурсам.

Архитектура и дизайн ИСППР

Существет несколько подходов к тому, как архитектурно представить СППР. Пожалуй, лучшее описание разности подходов - «кто во что горазд». Несмотря на разнообразие подходов, осуществляются попытки создать некую унифицированную архитектуру, хотя бы на верхнем уровне.

Действительно, СППР вполне можно разделить на 4 больших слоя:

  1. Интерфейс
  2. Моделирование
  3. Data Mining
  4. Data collection
А уж в эти слои можно напихать какие угодно инструменты.

На схеме ниже представляю мое видение архитектуры, с описанием функционала и примерами инструментов:

С архитектурой более или менее понятно, перейдем к дизайну и собственно построению СППР.

В прицнипе, тут нет никакого rocket science. При построении ИСППР необходимо придерживаться следующих шагов:

  1. Анализ домена (собственно, где мы будем нашу ИСППР использовать)
  2. Сбор данных
  3. Анализ данных
  4. Выбор моделей
  5. Экспертный анализ\интерпретация моделей
  6. Внедрение моделей
  7. Оценка ИСППР
  8. Внедрение ИСППР
  9. Сбор обратной свзяи (на любом этапе , на самом деле)
На схеме это выглядит так:

Оценивать ИСППР можно двумя способами. Во-первых, по матрице атрибутов, которая представлена выше. Во-вторых, по критериальному чек-листу, который может быть любым и зависеть от вашей конкретной задачи. В качестве примера такого чек-листа я бы привел следующее:

Подчеркну, что это только ИМХО и вы можете сами сделать удобный для себя чек-лист.

А где тут машинное обучение и теория игр?

Да практически везде! По крайней мере в слое, связанном с моделированием.

С одной стороны, есть классические домены, назовем их «тяжелыми», вроде управления цепями поставок, производства, запасов ТМЦ и проч. В тяжелых доменах наши с вами любимые алгоритмы могут привнести дополнительные инсайты для зарекомендовавших себя классических моделей. Пример: предиктивная аналитика по выходам из строя оборудования (машинное обучение) отлично сработается с каким-нибудь FMEA анализом (классика).

С другой стороны, в «легких» доменах, вроде клиентской аналитики, предсказании churn, выплаты кредитов - алгоритмы машинного обучения будут на первых ролях. А в скоринге, например, можно совмещать классику с NLP, когда решаем выдавать ли кредит на основе пакета документов (как раз-таки document driven СППР).

Классические алгоритмы машинного обучения

Допустим, есть у нас задачка: менеджеру по продажам стальной продукции надо еще на этапе получения заявки от клиента понимать, какого качества готовая продукция поступит на склад и применить некое управляющее воздействие, если качество будет ниже требуемого.

Поступаем очень просто:

Шаг 0. Определяем целевую переменную (ну, например, содержание оксида титана в готовой продукции)
Шаг 1. Определяемся с данными (выгружаем из SAP, Access и вообще ото всюду, куда дотянемся)
Шаг 2. Собираем фичи\генерим новые
Шаг 3. Рисуем процесс data flow и запускаем его в продакшн
Шаг 4. Выбираем и обучаем модельку, запускаем ее крутиться на сервере
Шаг 5. Определяем feature importances
Шаг 6. Определяемся со вводом новых данных. Пусть наш менеджер их вводит, например, руками.
Шаг 7. Пишем на коленке простой web-based интерфейс, куда менеджер вводит ручками значения важных фич, это крутится на серваке с моделькой, и в тот же интерфейс выплевываестя прогнозируемое качество продукции

Вуа-ля, ИСППР уровня детсад готова, можно пользоваться.

Подобные «простые» алгоритмы также использует IBM в своей СППР Tivoli, которая позволяет определять состояние своих супер-компьютеров (Watson в первую очередь): на основе логов выводится информация по перформансу Watson, прогнозируется доступность ресурсов, баланс cost vs profit, необходимость обслуживания и т.п.

Компания ABB предлагает своим клиентам DSS800 для анализа работы электродвигателей той же ABB на бумагоделательной линии.

Финская Vaisala , производитель сенсоров для минтранса Финляндии использует ИСППР для предсказания того, в какие периоды необходимо применять анти-обледенитель на дорогах во избежания ДТП.

Опять-таки финская Foredata предлагает ИСППР для HR, которая помогает принимать решения по годности кандидата на позицию еще на этапе отбора резюме.

В аэропорту Дубай в грузовом терминале работает СППР, которая определяет подозрительность груза. Под капотом алгоритмы на основе сопровидительных документов и вводимых сотрудниками таможни данных выделяют подозрительные грузы: фичами при этом являются страна происхождения, информация на упаковке, конкретная информация в полях декларации и т.п.

Тысячи их!

Обычные нейронные сети

Кроме простого ML, в СППР отлично ложится и Deep Learning.

Некоторые примеры можно найти в ВПК, например в американской TACDSS (Tactical Air Combat Decision Support System). Там внутри крутятся нейронки и эволюционные алгоритмы, помогающие в определении свой-чужой, в оценке вероятности попадания при залпе в данный конкретный момент и прочие задачки.

В немного более реальном мире можно рассмотреть такой пример: в сегменте B2B необходимо определить, выдавать ли кредит организации на основе пакета документов. Это в B2C вас оператор замучает вопросами по телефону, проставит значения фич у себя в системе и озвучит решение алгоритма, в B2B несколько посложнее.

ИСППР там может строиться так: потенциальный заемщик приносит заранее согласованный пакет документов в офис (ну или по email присылает сканы, с подписями и печатями, как положено), документы скармливаются в OCR, затем передаются в NLP-алгоритм, который дальше уже делит слова на фичи и скармливает их в NN. Клиента просят попить кофе (в лучшем случае), или вот где карту оформляли туда и идите прийти после обеда, за это время как раз все и обсчитается и выведет на экран девочке-операционисту зеленый или красный смайлик. Ну или желтый, если вроде ок, но нужно больше справок богу справок.

Подобными алгоритмами пользуются также в МИД: анкета на визу + прочие справки анализируются прямо в посольстве \ консульстве, после чего сотруднику на экране высвечивается один из 3 смайликов: зеленый (визу выдать), желтый (есть вопросы), красный (соискатель в стоп-листе). Если вы когда-нибудь получали визу в США, то то решение, которое озвучивает вам сотрудник консульства - это именно результат работы алгоритма в совокупности с правилами, а никак не его личное субъективное мнение о вас:)

В тяжелых доменах известны также СППР на основе нейронок, определяющие места накопления буфера на производственных линиях (см, напимер, Tsadiras AK, Papadopoulos CT, O’Kelly MEJ (2013) An artificial neural network based decision support system for solving the buffer allocation problem in reliable production lines. Comput Ind Eng 66(4):1150–1162 ), Общие Нечеткие Нейронные Сети на основе мин-макса (GFMMNN) для кластеризации потребителей воды (Arsene CTC, Gabrys B, Al-Dabass D (2012) Decision support system for water distribution systems based on neural networks and graphs theory for leakage detection. Expert Syst Appl 39(18):13214–13224 ) и другие.

Вообще стоит отметить, что NN как нельзя лучше подходят для принятия решений в условиях неопределенности, т.е. условиях, в которых и живет реальный бизнес. Алгоритмы кластеризации также хорошо вписались.

Байесовские сети

Бывает иногда и так, что данные у нас неоднородны по видам появления. Приведем пример из медицины. Поступил к нам больной. Что-то мы про него знаем из анкеты (пол, возраст, вес, рост и т.п.) и анамнеза (перенесенные инфаркты, например). Назовем эти данные статическими. А что-то мы про него узнаем в процессе периодического обследования и лечения (несколько раз в день меряем температуру, состав крови и проч). Эти данные назовем динамическими. Понятно, что хорошая СППР должна уметь учитывать все эти данные и выдавать рекомендации, основываясь на всей полноте информации.

Динамические данные обновляются во времени, соответственно, паттерн работы модели будет такой: обучение-решение-обучение , что в общем похоже на работу врача: примерно определить диагноз, прокапать лекарство, посмотреть за реакцией. Таким образом, мы постоянно пребываем в состоянии неопределенности, подействует лечение или нет. И состояние пациента меняется динамически. Т.е. нам надо построить динамическую СППР, причем еще и knowledge driven.

В таких случаях нам отлично помогут Динамические Байесовские Сети (ДБС) - обобщение моделей на основе фильтров Калмана и Скрытой Марковской Модели.

Разделим данные по пациенту на статические и динамические.

Если бы мы строили статическую байесовскую сетку, то нашей задачей было бы посчитать следующую вероятность:

,

Где - узел нашей сетки (вершина графа, по сути), т.е. значение каждой переменной (пол, возраст....), а С - предсказываемый класс (болезнь).

Статическая сетка выглядит так:

Но это не айс. Состояние пациента меняется, время идет, надо решать, как же его лечить.

Вот для этого и применим ДБС.

Сначала, в день приема пацитента, строим статическую сетку (как на картинке выше). Потом, в каждый день i строим сетку на основе динамически меняющихся данных:

Соответственно, совокупная модель примет следующий вид:

Таким, образом, результат мы расчитаем по следующей формуле:

Где T - совокупное время госпитализации, N - количество переменных на каждом из шагов ДБС.

Внедрить эту модель в СППР необходимо несколько иначе - скорее тут надо идти от обратного, сначала эту модель зафиксировать, а потом строить интерфейс вокруг . Т.е., по сути, мы сделали хард модель, внутри которой динамические элементы.

Теория игр

Теория игр, в свою очередь, гораздо лучше подойдет для ИСППР, созданных для принятия стратегических решений. Приведем пример.

Допустим, на рынке существует олигополия (малое количество соперников), есть определенный лидер и это (увы) не наша компания. Нам необходимо помочь менеджменту принять решение об объемах выпускаемой нами продукции: если мы будем выпускать продукцию в объеме , а наш соперник - , уйдем мы в минус или нет? Для упрощения возьмем частный случай олигополии - дуополию (2 игрока). Пока вы думаете, RandomForest тут или CatBoost, я вам предложу использовать классику - равновесие Штакельберга. В этой модели поведение фирм описывается динамической игрой с полной совершенной информацией, при этом особенностью игры является наличие лидирующей фирмы, которая первой устанавливает объём выпуска товаров, а остальные фирмы ориентируются в своих расчетах на неё.
Для решения нашей задачи нам надо всего-то посчитать такое , при котором решится задача оптимизации следующего вида:

Для ее решения (сюрприз-сюрприз!) надо лишь приравнять первую производную по к нулю.

При этом для такой модели нам понадобится знать только предложение на рынке и стоимость за товар от нашего конкурента, после чего построить модель и сравнить получившееся q с тем, которое хочет выкинуть на рынок наш менеджмент. Согласитесь, несколько проще и быстрее, чем пилить NN.

Для таких моделей и СППР на их основе подойдет и Excel. Конечно, если вводимые данные надо посчитать, то нужно что-то посложнее, но не сильно. Тот же Power BI справится.

Искать победителя в битве ML vs ToG бессмысленно. Слишком разные подходы к решению задачи, со своими плюсами и минусами.

Что дальше?

С современным состоянием ИСППР вроде бы разобрались, куда идти дальше?

В недавнем интервью Джуда Перл, создатель тех самых байесовских сетей, высказал любопытное мнение. Если слегка перефразировать, то

«все, чем сейчас занимаются эксперты в машинном обучении, это подгонка кривой под данные. Подгонка нетривиальная, сложная и муторная, но все-таки подгонка.»
(почитать)

Скорее всего, вангую, через лет 10 мы перестанем жестко хардкодить модели, и начнем вместо этого повсеместно обучать компьютеры в создаваемых симулируемых средах. Наверное, по этому пути и пойдет реализация ИСППР - по пути AI и прочих скайнетов и WAPR"ов.

Если же посмотреть на более близкую перспективу, то будущее ИСППР за гибкостью решений. Ни один из предложенных способов (классические модели, машинное обучение, DL, теория игр) не универсален с точки зрения эффективности для всех задач. В хорошей СППР должны сочетаться все эти инструменты + RPA, при этом разные модули должны использоваться под разные задачи и иметь разные интерфейсы вывода для разных пользователей. Этакий коктейль, смешанный, но ни в коем случае не взболтанный.

Литература

  1. Merkert, Mueller, Hubl , A Survey of the Application of Machine Learning in Decision Support Systems, University of Hoffenhaim 2015
  2. Tariq, Rafi ,Intelligent Decision Support Systems- A Framework, India, 2011
  3. Sanzhez i Marre, Gibert , Evolution of Decision Support Systems, University of Catalunya, 2012
  4. Ltifi, Trabelsi, Ayed, Alimi , Dynamic Decision Support System Based on Bayesian Networks, University of Sfax, National School of Engineers (ENIS), 2012

Секция «Информационно-экономические системы»

УДК 658.5.011

СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

А. А. Стародубцев Научный руководитель - Д. В. Тихоненко

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева

Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: [email protected]

Описано, зачем нужны системы поддержки принятия решений, чем они могут быть полезны и их классификация.

Ключевые слова: СППР, принятие решений, система поддержки.

DECISION SUPPORT SYSTEM

A. A. Starodubcev Scientific Supervisor - D. V. Tkhonenko

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected]

The article explains why need a decision support system, than they can be useful and their classification.

Keywords: DSS, making decisions, support system.

Система поддержки принятия решений (СППР) - компьютерная автоматизированная система, целью которой является помощь людям, принимающим решение в сложных условиях для полного и объективного анализа предметной деятельности.

СППР возникли в результате слияния управленческих информационных систем и систем управления базами данных.

Система поддержки принятия решений предназначена для поддержки многокритериальных решений в сложной информационной среде. При этом под многокритериальностью понимается тот факт, что результаты принимаемых решений оцениваются не по одному, а по совокупности многих показателей (критериев) рассматриваемых одновременно. Информационная сложность определяется необходимостью учета большого объема данных, обработка которых без помощи современной вычислительной техники практически невыполнима. В этих условиях число возможных решений, как правило, весьма велико, и выбор наилучшего из них «на глаз», без всестороннего анализа может приводить к грубым ошибкам .

Система поддержки решений СППР решает две основные задачи. Во-первых, выбор наилучшего решения из множества возможных (оптимизация). Во-вторых, упорядочение возможных решений по предпочтительности (ранжирование).

В обеих задачах первым и наиболее принципиальным моментом является выбор совокупности критериев, на основе которых в дальнейшем будут оцениваться и сопоставляться возможные решения (будем называть их также альтернативами). Система СППР помогает пользователю сделать такой выбор .

Для анализа и выработок предложений в СППР используются разные методы. Это могут быть:

Информационный поиск;

Интеллектуальный анализ данных;

Поиск знаний в базах данных;

Рассуждение на основе прецедентов;

Имитационное моделирование;

Актуальные проблемы авиации и космонавтики - 2016. Том 2

Эволюционные вычисления и генетические алгоритмы;

Нейронные сети;

Ситуационный анализ;

Когнитивное моделирование и др.

Некоторые из этих методов были разработаны в рамках искусственного интеллекта. Если в основе работы СППР лежат методы искусственного интеллекта, то говорят об интеллектуальной СППР или ИСППР.

Система позволяет решать задачи оперативного и стратегического управления на основе учетных данных о деятельности компании.

Система поддержки принятия решений представляет собой комплекс программных инструментальных средств для анализа данных, моделирования, прогнозирования и принятия управленческих решений, состоящий из собственных разработок корпорации и приобретаемых программных продуктов (Oracle, IBM, Cognos).

Теоретические исследования в области разработки первых систем поддержки принятия решений проводились в технологическом институте Карнеги в конце 50-х начале 60-х годов XX века. Объединить теорию с практикой удалось специалистам из Массачусетского технологического института в 60-х годах. В середине и конце 80-х годов XX столетия стали появляться такие системы, как EIS, GDSS, ODSS. В 1987 году компания Texas Instruments разработала для United Airlines Gate Assignment Display System. Это позволило значительно снизить убытки от полетов и отрегулировать управление различными аэропортами, начиная от Международного аэропорта O"Hare в Чикаго и заканчивая Stapleton в Денвере, штат Колорадо. В 90-х годах сфера возможностей СППР расширялась благодаря внедрению хранилищ данных и инструментов OLAP. Появление новых технологий отчетности сделало СППР незаменимой в менеджменте .

Выделяют несколько больших групп СППР.

По взаимодействию с пользователем выделяют три вида СППР:

Пассивные помогают в процессе принятия решений, но не могут выдвинуть конкретного предложения;

Активные непосредственно участвуют в разработке правильного решения;

Кооперативные предполагают взаимодействие СППР с пользователем. Выдвинутое системой предложение пользователь может доработать, усовершенствовать, а затем отправить обратно в систему для проверки. После этого предложение вновь представляется пользователю, и так до тех пор, пока он не одобрит решение.

По способу поддержки различают:

Модельно-ориентированные СППР, используют в работе доступ к статистическим, финансовым или иным моделям;

СППР, основанные на коммуникациях, поддерживают работу двух и более пользователей, занимающихся общей задачей;

СППР, ориентированные на данные, имеют доступ к временным рядам организации. Они используют в работе не только внутренние, но и внешние данные;

СППР, ориентированные на документы, манипулируют неструктурированной информацией, заключенной в различных электронных форматах;

СППР, ориентированные на знания, предоставляют специализированные решения проблем, основанные на фактах.

По сфере использования выделяют:

Общесистемные

Настольные СППР.

Общесистемные работают с большими системами хранения данных (СХД) и применяются многими пользователями. Настольные являются небольшими системами и подходят для управления с персонального компьютера одного пользователя.

В структуре СППР фигурирует четыре основных компонента:

Информационные хранилища данных;

Средства и методы извлечения, обработки и загрузки данных (ETL);

Многомерная база данных и средства анализа OLAP;

Средства Data Mining.

Секция «Информационно-экономические системыi»

СППР позволяет облегчить работу руководителям предприятий и повысить ее эффективность. Они значительно ускоряют решение проблем в бизнесе. СППР способствуют налаживанию межличностного контакта. На их основе можно проводить обучение и подготовку кадров. Данные информационные системы позволяют повысить контроль над деятельностью организации. Наличие четко функционирующей СППР дает большие преимущества по сравнению с конкурирующими структурами. Благодаря предложениям, выдвигаемым СППР, открываются новые подходы к решению повседневных и нестандартных задач.

Использование системы позволяет найти ответы на множество вопросов, возникающих как и у генерального директора, так и у руководителя какого-либо отдела.

Процесс создания системы управленческой отчетности, анализа данных и поддержки принятия решений состоит из следующих этапов:

Анализ существующих на предприятии информационных потоков и процедур управления предприятием;

Выявление показателей, влияющих на финансово-экономическое состояние предприятия и отражающих эффективность ведения бизнеса (на основе данных из уже использующихся систем);

Выработка процедур, обеспечивающих получение управленческим персоналом необходимой информации в нужное время, в нужном месте и в нужном виде;

Настройка программных средств многомерного анализа;

Обучение персонала Заказчика работе с программными средствами многомерного анализа.

Итог - продуманные решения, опирающиеся на информационный фундамент, адекватные действия, квалифицированное исполнение и как результат успех всего предприятия.

1. Системы поддержки принятия решений, назначение и решаемые задачи [Электронный ресурс]. URL: http://referatz.ru/works/296331/ (дата обращения: 10.03.2016).

Материал из ПИЭ.Wiki

Систе́ма подде́ржки приня́тия реше́ний (СППР) (англ. Decision Support System, DSS) - компьютерная автоматизированная система, целью которой является помощь людям, принимающим решение в сложных условиях для полного и объективного анализа предметной деятельности. СППР возникли в результате слияния управленческих информационных систем и систем управления базами данных.

Для анализа и выработок предложений в СППР используются разные методы. Это могут быть: информационный поиск, интеллектуальный анализ данных, поиск знаний в базах данных, рассуждение на основе прецедентов, имитационное моделирование, эволюционные вычисления и генетические алгоритмы, нейронные сети, ситуационный анализ, когнитивное моделирование и др. Некоторые из этих методов были разработаны в рамках искусственного интеллекта. Если в основе работы СППР лежат методы искусственного интеллекта, то говорят об интеллектуальной СППР, или ИСППР.

Решение вопросов

Использование системы позволяет найти ответы на множество вопросов, возникающих у руководителей компании, например:

На сколько процентов выполнен план по продажам, доходу, прибыли, расходам

Какова доля рынка, принадлежащего компании

Каковы тенденции развития сегмента рынка, на котором представлена компания

Каковы ключевые показатели производительности компании в текущем периоде

Каковы тенденции изменения ключевых показателей производительности компании со временем

Какие из партнеров приносят наибольший доход, прибыль

Какие проекты, группы продуктов лучше всего продает данный партнер

Каковы тенденции изменения продаж через партнеров

Сколько каждый проект стоит моему предприятию

Сколько стоит поддержка продаваемых проектов

Какие проекты в этом году стоят больше, чем в прошлом

Как расходы различных подразделений и компании в целом соотносятся с доходами

Насколько точно различные подразделения компании соблюдают установленный бюджет

Каковы тенденции расходов по различным подразделениям, статьям бюджета

Какие из моих поставщиков предлагают наилучшее соотношение цена/качество

Какие из поставщиков доставляют товары быстрее остальных Медленнее остальных

Как часто происходят задержки поставок от того или иного поставщика

Каких поставщиков выбрать для поставок крупных/небольших партий продукта

Насколько предприятие выполняет план по продажам, доходам, прибыли

Какие области бизнеса вносят положительный вклад, а какие - отрицательный

Каков прогноз ключевых показателей производительности на следующий период (месяц, квартал, год)

Каково среднее время выполнения заявки на обслуживание

Каковы расходы на выполнение одной заявки

Каково среднее время до первой поломки данной модели

Какова производительность персонала, прошедшего определенное обучение перед теми, кто его не проходил

Каковы тенденции ежегодного роста персонала компании в различных регионах, подразделениях

Каково прогнозируемое количество персонала на следующий год

Каковы прогнозы по поводу состава

Какие сотрудники нуждаются в обучении

Каким набором навыков должен обладать сотрудник чтобы хорошо выполнять свои обязанности

Какие проекты доставляются вовремя Какие - с запозданием

Имеют ли определенные клиенты или проекты недопустимо долгий срок поставки

Изменилось ли время доставки определенных продуктов со временем

Насколько быстрее или медленнее стала поставка продуктов (услуг) в определенный сегмент рынка

Каковы основные причины отказа от продукта (услуги)

1.Процесс создания системы управленческой отчетности, анализа данных и поддержки принятия решений состоит из следующих этапов: 2.Анализ существующих на предприятии информационных потоков и процедур управления предприятием; 3.Выявление показателей, влияющих на финансово-экономическое состояние предприятия и отражающих эффективность ведения бизнеса (на основе данных из уже спользующихся систем); 4.Выработка процедур, обеспечивающих получение управленческим персоналом необходимой информации в нужное время, в нужном месте и в нужном виде; 5.Настройка программных средств многомерного анализа; 6.Обучение персонала Заказчика работе с программными средствами многомерного анализа.

Итог – продуманные решения опирающиеся на информационный фундамент, адекватные действия, квалифицированное исполнение и как результат успех всего предприятия.

История создания СППР

До середины 60-х годов прошлого века создание больших информационных систем (ИС) было чрезвычайно дорогостоящим, поэтому первые ИС менеджмента (так называемые Management Information Systems - MIS) были созданы в эти годы лишь в достаточно больших компаниях. MIS предназначались для подготовки периодических структурированных отчетов для менеджеров. В конце 60-х годов появляется новый тип ИС - модель-ориентированные СППР (Model-oriented Decision Support Systems - DSS) или системы управленческих решений (Management Decision Systems - MDS).

По мнению первооткрывателей СППР Keen P. G. W., Scott Morton M. S. (1978), концепция поддержки решений была развита на основе «теоретических исследований в области принятия решений… и технических работ по созданию интерактивных компьютерных систем». В 1971 г. - опубликована книга Scott Morton‘а , в которой впервые были описаны результаты внедрения СППР, основанной на использовании математических моделей. 1974 г. - в работе дано определение ИС менеджмента - MIS (Management Information System): «MIS - это интегрированная человеко-машинная система обеспечения информацией, поддерживающая функции операций, менеджмента и принятия решений в организации. Системы используют компьютерную технику и программное обеспечение, модели управления и принятия решений, а также базу данных» . 1975 г. - J.D.C.Little в работе предложил критерии проектирования СППР в менеджменте. 1978 г. - опубликован учебник по СППР , в котором исчерпывающе описаны аспекты создания СППР: анализ, проектирование, внедрение, оценка и разработка. 1980 г. - опубликована диссертация S. Alter , в которой он дал основы классификации СППР. 1981 г. - Bonczek, Holsapple и Whinston в книге создали теоретические основы проектирования СППР. Они выделили 4 необходимых компонента, присущих всем СППР: 1) Языковая система (Language System - LS) - СППР может принимать все сообщения; 2) Система презентаций (Presentation System (PS)) (СППР может выдавать свои сообщения); 3) Система знаний (Knowledge System - KS) - все знания СППР сохраняет; 4) Система обработки задач (Problem-Processing System (PPS)) - программный «механизм», который пытается распознать и решить задачу во время работы СППР. 1981 г. - В книге R.Sprague и E.Carlson описали, каким образом на практике можно построить СППР. Тогда же была разработана информационная система руководителя (Executive Information System (EIS)) - компьютерная система, предназначенная для обеспечения текущей адекватной информации для поддержки принятия управленческих решений менеджером. Начиная с 1990-х, разрабатываются так называемые Data Warehouses - хранилища данных. В 1993 г Е. Коддом (E.F. Codd) для СППР специального вида был предложен термин OLAP (Online Analytical Processing)- оперативный анализ данных, онлайновая аналитическая обработка данных для поддержки принятия важных решений. Исходные данные для анализа представлены в виде многомерного куба, по которому можно получать нужные разрезы - отчёты. Выполнение операций над данными осуществляется OLAP-машиной. По способу хранения данных различают MOLAP, ROLAP и HOLAP. По месту размещения OLAP-машины различаются OLAP-клиенты и OLAP-серверы. OLAP-клиент производит построение многомерного куба и вычисления на клиентском ПК, а OLAP-сервер получает запрос, вычисляет и хранит агрегатные данные на сервере, выдавая только результаты.

Пример OLAP-преобразования: многомерный куб

В начале нового тысячелетия была создана СППР на основе Web. 27 октября 2005 года в Москве на Международной конференции «Информационные и телемедицинские технологии в охране здоровья» (ITTHC 2005), А. Пастухов (Россия) представил СППР нового класса - PSTM (Personal Information Systems of Top Managers). Основным отличием PSTM от существующих СППР является построение системы для конкретного лица, принимающее решение, с предварительной логико-аналитической обработкой информации в автоматическом режиме и выводом информации на один экран.

Интересно отметить создание предтечи СППР коллежским советником С. Н. Корсаковым, опубликовавшим еще в 1832 году описание механических устройств, так называемых «интеллектуальных машин», которые "могли быть использованы при решении различных задач в повседневной жизни, для того, чтобы сделать какой бы то ни было вывод", например помочь принять решение о наиболее подходящих лекарствах по наблюдаемым у пациента симптомам заболевания.

Классификации СППР

Для СППР отсутствует не только единое общепринятое определение, но и исчерпывающая классификация. Разные авторы предлагают разные классификации.

На уровне пользователя Haettenschwiler (1999) делит СППР на пассивные, активные и кооперативные СППР. Пассивной СППР называется система, которая помогает процессу принятия решения, но не может вынести предложение, какое решение принять. Активная СППР может сделать предложение, какое решение следует выбрать. Кооперативная позволяет ЛПР изменять, пополнять или улучшать решения, предлагаемые системой, посылая затем эти изменения в систему для проверки. Система изменяет, пополняет или улучшает эти решения и посылает их опять пользователю. Процесс продолжается до получения согласованного решения.

На концептуальном уровне Power (2003) отличает СППР, управляемые сообщениями (Communication-Driven DSS), СППР, управляемые данными (Data-Driven DSS), СППР, управляемые документами (Document-Driven DSS), СППР, управляемые знаниями (Knowledge-Driven DSS) и СППР, управляемые моделями (Model-Driven DSS). СППР, управляемые моделями, характеризуются в основном доступ и манипуляции с математическими моделями (статистическими, финансовыми, оптимизационными, имитационными). Отметим, что некоторые OLAP-системы, позволяющие осуществлять сложный анализ данных, могут быть отнесены к гибридным СППР, которые обеспечивают моделирование, поиск и обработку данных.

Управляемая сообщениями (Communication-Driven DSS) (ранее групповая СППР - GDSS) СППР поддерживает группу пользователей, работающих над выполнением общей задачи.

СППР, управляемые данными (Data-Driven DSS) или СППР, ориентированные на работу с данными (Data-oriented DSS) (также известные как Business Intelligence) в основном ориентируются на доступ и манипуляции с данными. СППР, управляемые документами (Document-Driven DSS), управляют, осуществляют поиск и манипулируют неструктурированной информацией, заданной в различных форматах. Наконец, СППР, управляемые знаниями (Knowledge-Driven DSS) обеспечивают решение задач в виде фактов, правил, процедур.

На техническом уровне Power (1997) различает СППР всего предприятия и настольную СППР. СППР всего предприятия подключена к большим хранилищам информации и обслуживает многих менеджеров предприятия. Настольная СППР - это малая система, обслуживающая лишь один компьютер пользователя. Существуют и другие классификации (Alter , Holsapple и Whinston , Golden, Hevner и Power ). Отметим лишь, что превосходная для своего времени классификация Alter‘a, которая разбивала все СППР на 7 классов, в настоящее время несколько устарела.

В зависимости от данных, с которыми эти системы работают, СППР условно можно разделить на оперативные и стратегические. Оперативные СППР предназначены для немедленного реагирования на изменения текущей ситуации в управлении финансово-хозяйственными процессами компании. Стратегические СППР ориентированы на анализ значительных объемов разнородной информации, собираемых из различных источников. Важнейшей целью этих СППР является поиск наиболее рациональных вариантов развития бизнеса компании с учетом влияния различных факторов, таких как конъюнктура целевых для компании рынков, изменения финансовых рынков и рынков капиталов, изменения в законодательстве и др. СППР первого типа получили название Информационных Систем Руководства (Executive Information Systems, ИСР). По сути, они представляют собой конечные наборы отчетов, построенные на основании данных из транзакционной информационной системы предприятия, в идеале адекватно отражающей в режиме реального времени основные аспекты производственной и финансовой деятельности. Для ИСР характерны следующие основные черты: отчеты, как правило, базируются на стандартных для организации запросах; число последних относительно невелико; ИСР представляет отчеты в максимально удобном виде, включающем, наряду с таблицами, деловую графику, мультимедийные возможности и т. п.; как правило, ИСР ориентированы на конкретный вертикальный рынок, например финансы, маркетинг, управление ресурсами.

В общем виде система поддержки принятия решений (СППР)

СППР второго типа предполагают достаточно глубокую проработку данных, специально преобразованных так, чтобы их было удобно использовать в ходе процесса принятия решений. Неотъемлемым компонентом СППР этого уровня являются правила принятия решений, которые на основе агрегированных данных дают возможность менеджерам компании обосновывать свои решения, использовать факторы устойчивого роста бизнеса компании и снижать риски. СППР второго типа в последнее время активно развиваются. Технологии этого типа строятся на принципах многомерного представления и анализа данных (OLAP).

При создании СППР можно использовать Web-технологии. В настоящее время СППР на основе Web-технологий для ряда компаний являются синонимами СППР предприятия.

Архитектура СППР представляется разными авторами по-разному. Приведем пример. Marakas (1999) предложил обобщенную архитектуру, состоящую из 5 различных частей: (a) система управления данными (the data management system - DBMS), (b) система управления моделями (the model management system - MBMS), (c) машина знаний (the knowledge engine (KE)), (d) интерфейс пользователя (the user interface) и (e) пользователи (the user(s)).

Архитектура

Функциональные СППР

Являются наиболее простыми с точки зрения архитектуры. Они распространены в организациях, не ставящих перед собой глобальных задач и имеющих невысокий уровень развития информационных технологий. Отличительной особенностью функциональных СППР является то, что анализу подвергаются данные, содержащиеся в операционных системах. Преимуществами подобных СППР являются компактность из-за использования одной платформы и оперативность в связи с отсутствием необходимости перегружать данные в специализированную систему. Из недостатков можно отметить следующие: сужение круга вопросов, решаемых с помощью системы, снижение качества данных из-за отсутствия этапа их очистки, увеличение нагрузки на операционную систему с потенциальной возможностью прекращения ее работы.

Обработка и анализ информационных потоков

СППР, использующие независимые витрины данных

Применяются в крупных организациях, имеющих несколько подразделений, в том числе отделы информационных технологий. Каждая конкретная витрина данных создается для решения определенных задач и ориентирована на отдельный круг пользователей. Это значительно повышает производительность системы. Внедрение подобных структур достаточно просто. Из отрицательных моментов можно отметить то, что данные многократно вводятся в различные витрины, поэтому могут дублироваться. Это повышает затраты на хранение информации и усложняет процедуру унификации. Наполнение витрин данных достаточно сложно в связи с тем, что приходится использовать многочисленные источники. Отсутствует единая картина бизнеса организации, вследствие того что нет окончательной консолидации данных.

СППР на основе двухуровневого хранилища данных

Используется в крупных компаниях, данные которых консолидированы в единую систему. Определения и способы обработки информации в данном случае унифицированы. На обеспечение нормальной работы подобной СППР требуется выделить специализированную команду, которая будет ее обслуживать. Такая архитектура СППР лишена недостатков предыдущей, но в ней нет возможности структурировать данные для отдельных групп пользователей, а также ограничивать доступ к информации. Могут возникнуть трудности с производительностью системы.

СППР на основе трехуровневого хранилища данных

Такие СППР применяют хранилище данных, из которого формируются витрины данных, используемые группами пользователей, решающих сходные задачи. Таким образом, обеспечивается доступ как к конкретным структурированным данным, так и к единой консолидированной информации. Наполнение витрин данных упрощается ввиду использования проверенных и очищенных данных, находящихся в едином источнике. Имеется корпоративная модель данных. Такие СППР отличает гарантированная производительность. Но существует избыточность данных, которая ведет к росту требований на их хранение. Кроме того, необходимо согласовать подобную архитектуру с множеством областей, имеющих потенциально различные запросы.

Структура

Выделяют четыре основных компонента:

информационные хранилища данных;

средства и методы извлечения, обработки и загрузки данных (ETL);

многомерная база данных и средства анализа OLAP;

средства Data Mining.

Преимущества

СППР позволяет облегчить работу руководителям предприятий и повысить ее эффективность. Они значительно ускоряют решение проблем в бизнесе. СППР способствуют налаживанию межличностного контакта. На их основе можно проводить обучение и подготовку кадров. Данные информационные системы позволяют повысить контроль над деятельностью организации. Наличие четко функционирующей СППР дает большие преимущества по сравнению с конкурирующими структурами. Благодаря предложениям, выдвигаемым СППР, открываются новые подходы к решению повседневных и нестандартных задач.

Динамическое моделирование

Особый класс систем стратегического управления и поддержки принятия решений представляют собой системы, позволяющие осуществлять динамическое моделирование процессов. При использовании методов динамического моделирования деятельность компании описывается в виде математической модели, в которой все бизнес-задачи и процессы представляются как система взаимосвязанных вычисляемых показателей.

Системы поддержки принятия решений (DSS) - это компьютерные системы, почти всегда интерактивные, разработанные, чтобы помочь менеджеру (или руководителю) в принятии решений. DSS включают и данные, и модели, чтобы помочь принимающему решения решить проблемы, особенно те, которые плохо формализованы. Данные часто извлекаются из системы диалоговой обработки запросов или базы данных. Модель может быть простой типа "доходы и убытки", чтобы вычислить прибыль при некоторых предположениях, или комплексной типа оптимизационной модели для расчета загрузки для каждой машины в цехе. DSS и многие из систем, обсуждаемых в следующих разделах, не всегда оправдываются традиционным подходом стоимость - прибыль; для этих систем многие из выгод неосязаемы, типа более глубокого принятия решения и лучшего понимания данных.

Рис. 1.4 показывает, что система поддержки принятия решений требует трех первичных компонентов: модели управления, управления данными для сбора и ручной обработки данных и управления диалогом для облегчения доступа пользователя к DSS. Пользователь взаимодействует с DSS через пользовательский интерфейс, выбирая частную модель и набор данных, которые нужно использовать, а затем DSS представляют результаты пользователю через тот же самый пользовательский интерфейс. Модель управления и управление данными в значительной степени действуют незаметно и варьируются от относительно простой типовой модели в электронной таблице до сложной комплексной модели планирования, основанной на математическом программировании.

Рис. 1.4. Компоненты системы поддержки принятия решений

Чрезвычайно популярный тип DSS - в виде генератора финансового отчета. С помощью электронной таблицы типа Lotus 1-2-3 или Microsoft Excel создаются модели, чтобы прогнозировать различные элементы организации или финансового состояния. В качестве данных используются предыдущие финансовые отчеты организации. Начальная модель включает различные предположения относительно будущих трендов в категориях расхода и дохода. После рассмотрения результатов базовой модели менеджер проводит ряд исследований типа "что, если", изменяя одно или большее количество предположений, чтобы определить их влияние на исходное состояние. Например, менеджер мог бы зондировать влияние на рентабельность, если бы продажа нового изделия росла на 10% ежегодно. Или менеджер мог бы исследовать влияние большего, чем ожидаемое, увеличения цены сырья, например 7% вместо 4% ежегодно. Этот тип генератора финансового отчета - простые, но мощные DSS для руководства принятием финансовых решений.

Пример DSS по приведению транзакций данных - система определения размеров ассигнований на полицейские выезды, используемая городами Калифорнии. Эта система позволяет офицеру полиции увидеть карту и выводит данные географической зоны, показывает полиции звонки вызовов, типы вызовов и время вызовов. Интерактивная способность графики системы разрешает офицеру манипулировать картой, зоной и данными, чтобы быстро и легко предположить вариации альтернатив полицейских выездов.



Другой пример DSS - интерактивная система для планирования объема и производства в большой бумажной компании. Эта система использует детальные предыдущие данные, прогнозирующие и планирующие модели, чтобы проиграть на компьютере общие показатели компании при различных плановых предположениях. Большинство нефтяных компаний развивают DSS, чтобы поддержать принятие решения капиталовложений. Эта система включает различные финансовые условия и модели для создания будущих планов, которые могут быть представлены в табличной или графической форме.

Все приведенные примеры DSS названы специфическими DSS. Они -фактические приложения, которые помогают в процессе принятия решения. Напротив, генератор системы поддержки принятия решений - это система, которая обеспечивает набор возможностей быстро и легко строить специфические DSS. Генератор DSS - пакет программ, разработанный для выполнения на частично компьютерной основе. В нашем примере финансового отчета Microsoft Excel или Lotus 1-2-3 могут рассматриваться как генераторы DSS, в то время как модели для проектирования финансовых отчетов для частного отделения компании на базе Excel или Lotus 1-2-3 - это специфические DSS.

Более подробно DSS рассматриваются в разд. 2.2.

Целью написания этой статьи было сделать краткий обзор принципов построения Интеллектуальных Систем Поддержки Принятия Решений (ИСППР ), роли машинного обучения, теории игр, классического моделирования и примеров их использования в СППР. Целью статьи не является забуриться вглубь тяжелой теории автоматов, самообучаемых машин, равно как и инструментов BI.

Введение

Существет несколько определений ИСППР , которые, в общем-то, крутятся вокруг одного и того же функционала. В общем виде, ИСППР - это такая система, которая ассистирует ЛПР (Лицам, Принимающим Решения) в принятии этих самых решений, используя инструментарии дата майнинга, моделирования и визуализации, обладает дружелюбным (G)UI, устойчива по качеству, интерактивна и гибка по настройкам.

Зачем нужны СППР :

  1. Сложность в принятии решений
  2. Необходимость в точной оценке различных альтернатив
  3. Необходимость предсказательного функционала
  4. Необходимость мультипотокового входа (для принятия решения нужны выводы на основе данных, экспертные оценки, известные ограничения и т.п.)
Первые СППР (тогда еще без И) выросли из СПТ (Систем Процессинга Транзакций), в середине 60-х - начале 70-х. Тогда эти системы не обладали никакой интерактивностью, представляя собой, по сути, надстройки над РСУБД, с некоторым (совсем не большим) функционалом численного моделирования. Одной из первых систем можно назвать DYNAMO, разработанную в недрах MIT и представлявшую собой систему симуляции каких-либо процессов на основе исторических транзакций. После выхода на рынок мейнфреймов IBM 360 стали появляться и условно-коммерческие системы, применявшиеся в оборонке, спецслужбах и НИИ.

С начала 80-х уже можно говорить о формировании подклассов СППР , таких как MIS (Management Information System), EIS (Executive Information System), GDSS (Group Decision Support Systems), ODSS (Organization Decision Support Systems) и др. По сути, эти системы представляли собой фреймворки, спососбные работать с данными на различных уровнях иерархии (от индивидуального до общеорганизационного), а внутрь можно было внедрить какую угодно логику. Примером может служить разработанная Texas Instruments для United Airlines система GADS (Gate Assignment Display System), которая поодерживала принятие решений в Field Operations - назначение гейтов, определение оптимального времени стоянки и т.п.

В конце 80-х появились ПСППР (Продвинутые - Advanced), которые позволяли осуществлять «what-if» анализ и использовали более продвинутый инструментарий для моделирования.

Наконец, с середины 90-х на свет стали появляться и ИСППР , в основе которых стали лежать инструменты статистики и машинного обучения, теории игр и прочего сложного моделирования.

Многообразие СППР

На данных момент существует несколько способов классификации СППР, опишем 3 популярных:

По области применения

  • Бизнес и менеджмент (прайсинг, рабочая сила, продукты, стратегия и т.п.)
  • Инжиниринг (дизайн продукта, контроль качества...)
  • Финансы (кредитование и займы)
  • Медицина (лекарства, виды лечения, диагностика)
  • Окружающая среда

По соотношению данные\модели (методика Стивена Альтера)

  • FDS (File Drawer Systems - системы предоставления доступа к нужным данным)
  • DAS (Data Analysis Systems - системы для быстрого манипулирования данными)
  • AIS (Analysis Information Systems - системы доступа к данным по типу необходимого решения)
  • AFM(s) (Accounting & Financial models (systems) - системы рассчета финансовых последствий)
  • RM(s) (Representation models (systems) - системы симуляции, AnyLogic как пример)
  • OM(s) (Optimization models (systems) - системы, решающие задачи оптимизации)
  • SM(s) (Suggestion models (systems) - системы построения логических выводов на основе правил)

По типу использумого инструментария

  • Model Driven - в основе лежат классические модели (линейные модели, модели управления запасами, транспортные, финансовые и т.п.)
  • Data Driven - на основе исторических данных
  • Communication Driven - системы на оснвое группового принятия решений экспертами (системы фасилитации обмена мнениями и подсчета средних экспертных значений)
  • Document Driven - по сути проиндексированное (часто - многомерное) хранилище документов
  • Knowledge Driven - внезапно, на основе знаний. При чем знаний как экспертных, так и выводимых машинно

Я требую жалобную книгу! нормальную СППР

Несмотря на такое многообразие вариантов классификаций, требования и атрибуты СППР хорошо ложатся в 4 сегмента:
  1. Качество
  2. Организация
  3. Ограничения
  4. Модель
На схеме ниже покажем, какие именно требовани и в какие сегменты ложаться:

Отдельно отметим такие важные атрибуты, как масштабируемость (в ныне одном подходе agile никуда без этого), способность обрабатывать плохие данные, юзабилити и user-friendly interface, нетребовательность к ресурсам.

Архитектура и дизайн ИСППР

Существет несколько подходов к тому, как архитектурно представить СППР. Пожалуй, лучшее описание разности подходов - «кто во что горазд». Несмотря на разнообразие подходов, осуществляются попытки создать некую унифицированную архитектуру, хотя бы на верхнем уровне.

Действительно, СППР вполне можно разделить на 4 больших слоя:

  1. Интерфейс
  2. Моделирование
  3. Data Mining
  4. Data collection
А уж в эти слои можно напихать какие угодно инструменты.

На схеме ниже представляю мое видение архитектуры, с описанием функционала и примерами инструментов:

С архитектурой более или менее понятно, перейдем к дизайну и собственно построению СППР.

В прицнипе, тут нет никакого rocket science. При построении ИСППР необходимо придерживаться следующих шагов:

  1. Анализ домена (собственно, где мы будем нашу ИСППР использовать)
  2. Сбор данных
  3. Анализ данных
  4. Выбор моделей
  5. Экспертный анализ\интерпретация моделей
  6. Внедрение моделей
  7. Оценка ИСППР
  8. Внедрение ИСППР
  9. Сбор обратной свзяи (на любом этапе , на самом деле)
На схеме это выглядит так:

Оценивать ИСППР можно двумя способами. Во-первых, по матрице атрибутов, которая представлена выше. Во-вторых, по критериальному чек-листу, который может быть любым и зависеть от вашей конкретной задачи. В качестве примера такого чек-листа я бы привел следующее:

Подчеркну, что это только ИМХО и вы можете сами сделать удобный для себя чек-лист.

А где тут машинное обучение и теория игр?

Да практически везде! По крайней мере в слое, связанном с моделированием.

С одной стороны, есть классические домены, назовем их «тяжелыми», вроде управления цепями поставок, производства, запасов ТМЦ и проч. В тяжелых доменах наши с вами любимые алгоритмы могут привнести дополнительные инсайты для зарекомендовавших себя классических моделей. Пример: предиктивная аналитика по выходам из строя оборудования (машинное обучение) отлично сработается с каким-нибудь FMEA анализом (классика).

С другой стороны, в «легких» доменах, вроде клиентской аналитики, предсказании churn, выплаты кредитов - алгоритмы машинного обучения будут на первых ролях. А в скоринге, например, можно совмещать классику с NLP, когда решаем выдавать ли кредит на основе пакета документов (как раз-таки document driven СППР).

Классические алгоритмы машинного обучения

Допустим, есть у нас задачка: менеджеру по продажам стальной продукции надо еще на этапе получения заявки от клиента понимать, какого качества готовая продукция поступит на склад и применить некое управляющее воздействие, если качество будет ниже требуемого.

Поступаем очень просто:

Шаг 0. Определяем целевую переменную (ну, например, содержание оксида титана в готовой продукции)
Шаг 1. Определяемся с данными (выгружаем из SAP, Access и вообще ото всюду, куда дотянемся)
Шаг 2. Собираем фичи\генерим новые
Шаг 3. Рисуем процесс data flow и запускаем его в продакшн
Шаг 4. Выбираем и обучаем модельку, запускаем ее крутиться на сервере
Шаг 5. Определяем feature importances
Шаг 6. Определяемся со вводом новых данных. Пусть наш менеджер их вводит, например, руками.
Шаг 7. Пишем на коленке простой web-based интерфейс, куда менеджер вводит ручками значения важных фич, это крутится на серваке с моделькой, и в тот же интерфейс выплевываестя прогнозируемое качество продукции

Вуа-ля, ИСППР уровня детсад готова, можно пользоваться.

Подобные «простые» алгоритмы также использует IBM в своей СППР Tivoli, которая позволяет определять состояние своих супер-компьютеров (Watson в первую очередь): на основе логов выводится информация по перформансу Watson, прогнозируется доступность ресурсов, баланс cost vs profit, необходимость обслуживания и т.п.

Компания ABB предлагает своим клиентам DSS800 для анализа работы электродвигателей той же ABB на бумагоделательной линии.

Финская Vaisala , производитель сенсоров для минтранса Финляндии использует ИСППР для предсказания того, в какие периоды необходимо применять анти-обледенитель на дорогах во избежания ДТП.

Опять-таки финская Foredata предлагает ИСППР для HR, которая помогает принимать решения по годности кандидата на позицию еще на этапе отбора резюме.

В аэропорту Дубай в грузовом терминале работает СППР, которая определяет подозрительность груза. Под капотом алгоритмы на основе сопровидительных документов и вводимых сотрудниками таможни данных выделяют подозрительные грузы: фичами при этом являются страна происхождения, информация на упаковке, конкретная информация в полях декларации и т.п.

Тысячи их!

Обычные нейронные сети

Кроме простого ML, в СППР отлично ложится и Deep Learning.

Некоторые примеры можно найти в ВПК, например в американской TACDSS (Tactical Air Combat Decision Support System). Там внутри крутятся нейронки и эволюционные алгоритмы, помогающие в определении свой-чужой, в оценке вероятности попадания при залпе в данный конкретный момент и прочие задачки.

В немного более реальном мире можно рассмотреть такой пример: в сегменте B2B необходимо определить, выдавать ли кредит организации на основе пакета документов. Это в B2C вас оператор замучает вопросами по телефону, проставит значения фич у себя в системе и озвучит решение алгоритма, в B2B несколько посложнее.

ИСППР там может строиться так: потенциальный заемщик приносит заранее согласованный пакет документов в офис (ну или по email присылает сканы, с подписями и печатями, как положено), документы скармливаются в OCR, затем передаются в NLP-алгоритм, который дальше уже делит слова на фичи и скармливает их в NN. Клиента просят попить кофе (в лучшем случае), или вот где карту оформляли туда и идите прийти после обеда, за это время как раз все и обсчитается и выведет на экран девочке-операционисту зеленый или красный смайлик. Ну или желтый, если вроде ок, но нужно больше справок богу справок.

Подобными алгоритмами пользуются также в МИД: анкета на визу + прочие справки анализируются прямо в посольстве \ консульстве, после чего сотруднику на экране высвечивается один из 3 смайликов: зеленый (визу выдать), желтый (есть вопросы), красный (соискатель в стоп-листе). Если вы когда-нибудь получали визу в США, то то решение, которое озвучивает вам сотрудник консульства - это именно результат работы алгоритма в совокупности с правилами, а никак не его личное субъективное мнение о вас:)

В тяжелых доменах известны также СППР на основе нейронок, определяющие места накопления буфера на производственных линиях (см, напимер, Tsadiras AK, Papadopoulos CT, O’Kelly MEJ (2013) An artificial neural network based decision support system for solving the buffer allocation problem in reliable production lines. Comput Ind Eng 66(4):1150–1162 ), Общие Нечеткие Нейронные Сети на основе мин-макса (GFMMNN) для кластеризации потребителей воды (Arsene CTC, Gabrys B, Al-Dabass D (2012) Decision support system for water distribution systems based on neural networks and graphs theory for leakage detection. Expert Syst Appl 39(18):13214–13224 ) и другие.

Вообще стоит отметить, что NN как нельзя лучше подходят для принятия решений в условиях неопределенности, т.е. условиях, в которых и живет реальный бизнес. Алгоритмы кластеризации также хорошо вписались.

Байесовские сети

Бывает иногда и так, что данные у нас неоднородны по видам появления. Приведем пример из медицины. Поступил к нам больной. Что-то мы про него знаем из анкеты (пол, возраст, вес, рост и т.п.) и анамнеза (перенесенные инфаркты, например). Назовем эти данные статическими. А что-то мы про него узнаем в процессе периодического обследования и лечения (несколько раз в день меряем температуру, состав крови и проч). Эти данные назовем динамическими. Понятно, что хорошая СППР должна уметь учитывать все эти данные и выдавать рекомендации, основываясь на всей полноте информации.

Динамические данные обновляются во времени, соответственно, паттерн работы модели будет такой: обучение-решение-обучение , что в общем похоже на работу врача: примерно определить диагноз, прокапать лекарство, посмотреть за реакцией. Таким образом, мы постоянно пребываем в состоянии неопределенности, подействует лечение или нет. И состояние пациента меняется динамически. Т.е. нам надо построить динамическую СППР, причем еще и knowledge driven.

В таких случаях нам отлично помогут Динамические Байесовские Сети (ДБС) - обобщение моделей на основе фильтров Калмана и Скрытой Марковской Модели.

Разделим данные по пациенту на статические и динамические.

Если бы мы строили статическую байесовскую сетку, то нашей задачей было бы посчитать следующую вероятность:

,

Где - узел нашей сетки (вершина графа, по сути), т.е. значение каждой переменной (пол, возраст....), а С - предсказываемый класс (болезнь).

Статическая сетка выглядит так:

Но это не айс. Состояние пациента меняется, время идет, надо решать, как же его лечить.

Вот для этого и применим ДБС.

Сначала, в день приема пацитента, строим статическую сетку (как на картинке выше). Потом, в каждый день i строим сетку на основе динамически меняющихся данных:

Соответственно, совокупная модель примет следующий вид:

Таким, образом, результат мы расчитаем по следующей формуле:

Где T - совокупное время госпитализации, N - количество переменных на каждом из шагов ДБС.

Внедрить эту модель в СППР необходимо несколько иначе - скорее тут надо идти от обратного, сначала эту модель зафиксировать, а потом строить интерфейс вокруг . Т.е., по сути, мы сделали хард модель, внутри которой динамические элементы.

Теория игр

Теория игр, в свою очередь, гораздо лучше подойдет для ИСППР, созданных для принятия стратегических решений. Приведем пример.

Допустим, на рынке существует олигополия (малое количество соперников), есть определенный лидер и это (увы) не наша компания. Нам необходимо помочь менеджменту принять решение об объемах выпускаемой нами продукции: если мы будем выпускать продукцию в объеме , а наш соперник - , уйдем мы в минус или нет? Для упрощения возьмем частный случай олигополии - дуополию (2 игрока). Пока вы думаете, RandomForest тут или CatBoost, я вам предложу использовать классику - равновесие Штакельберга. В этой модели поведение фирм описывается динамической игрой с полной совершенной информацией, при этом особенностью игры является наличие лидирующей фирмы, которая первой устанавливает объём выпуска товаров, а остальные фирмы ориентируются в своих расчетах на неё.
Для решения нашей задачи нам надо всего-то посчитать такое , при котором решится задача оптимизации следующего вида:

Для ее решения (сюрприз-сюрприз!) надо лишь приравнять первую производную по к нулю.

При этом для такой модели нам понадобится знать только предложение на рынке и стоимость за товар от нашего конкурента, после чего построить модель и сравнить получившееся q с тем, которое хочет выкинуть на рынок наш менеджмент. Согласитесь, несколько проще и быстрее, чем пилить NN.

Для таких моделей и СППР на их основе подойдет и Excel. Конечно, если вводимые данные надо посчитать, то нужно что-то посложнее, но не сильно. Тот же Power BI справится.

Искать победителя в битве ML vs ToG бессмысленно. Слишком разные подходы к решению задачи, со своими плюсами и минусами.

Что дальше?

С современным состоянием ИСППР вроде бы разобрались, куда идти дальше?

В недавнем интервью Джуда Перл, создатель тех самых байесовских сетей, высказал любопытное мнение. Если слегка перефразировать, то

«все, чем сейчас занимаются эксперты в машинном обучении, это подгонка кривой под данные. Подгонка нетривиальная, сложная и муторная, но все-таки подгонка.»
(почитать)

Скорее всего, вангую, через лет 10 мы перестанем жестко хардкодить модели, и начнем вместо этого повсеместно обучать компьютеры в создаваемых симулируемых средах. Наверное, по этому пути и пойдет реализация ИСППР - по пути AI и прочих скайнетов и WAPR"ов.

Если же посмотреть на более близкую перспективу, то будущее ИСППР за гибкостью решений. Ни один из предложенных способов (классические модели, машинное обучение, DL, теория игр) не универсален с точки зрения эффективности для всех задач. В хорошей СППР должны сочетаться все эти инструменты + RPA, при этом разные модули должны использоваться под разные задачи и иметь разные интерфейсы вывода для разных пользователей. Этакий коктейль, смешанный, но ни в коем случае не взболтанный.

Литература

  1. Merkert, Mueller, Hubl , A Survey of the Application of Machine Learning in Decision Support Systems, University of Hoffenhaim 2015
  2. Tariq, Rafi ,Intelligent Decision Support Systems- A Framework, India, 2011
  3. Sanzhez i Marre, Gibert , Evolution of Decision Support Systems, University of Catalunya, 2012
  4. Ltifi, Trabelsi, Ayed, Alimi , Dynamic Decision Support System Based on Bayesian Networks, University of Sfax, National School of Engineers (ENIS), 2012