Интегрированныеинформационно- аналитические системы

Оглавление

Введение 

Глава 1. Общие сведения об интегрированных информационно-аналитических  систем……………………………………………………….

1.1. Понятие  и назначение интегрированных  информационно – аналитических систем…………………………………...……………………….

1.2. Создание информационно-аналитической  системы на базе хранилища  данных

1.3. Классификация интегрированных информационно - аналитических систем

Глава 2. Проектирование интегрированных информационно - аналитических систем

2.1. Структура создания интегрированных информационно - аналитических систем

2.2. Этапы проектирования интегрированных информационно - аналитических систем

2.3. Программные средства  реализации информационно - аналитических систем

Глава 3. Разработка функциональной и информационной моделей деятельности больницы

3.1. Описание предметной  области…..

3.2. Создание информационной  модели предметной области

3.3. Разработка модели  «Как есть»

3.4. Разработка модели  «Как должно быть»

Глава 4. Разработка моделей  «Больницы» с применением языка  моделирования UML

4.1. Статистические диаграмма  модели…..

4.2. Динамические диаграмма  модели….

Глава 1. Общие сведения об интегрированных информационно- аналитических  систем

1.1. Понятие и назначение  интегрированных информационно  - аналитических систем

Назначением любой современной  информационно-аналитической системы (ИАС) является обеспечение руководителей, аналитиков и менеджеров информацией  о всех аспектах деятельности компании для ее последующей оценки и анализа. В состав информационно-аналитической  системы обычно включаются следующие  подсистемы:

-подсистема сбора и  хранения корпоративных данных, решающая задачи по сбору и  фильтрации данных, накоплению и  индексированию информации, обеспечивающая  возможность использования информации  в аналитических целях, а также  при поддержке принятия решений  на различных уровнях управления;

-подсистема доступа к  данным, анализа и корпоративной  отчетности, включающая в себя  модули, обеспечивающие доступ к  данным и защиту конфиденциальной  информации, инструменты по поддержке  принятия решений и оперативному  анализу информации, средства корпоративной  отчетности и визуализации данных.

Первая подсистема традиционно  базируется на технологии оперативной  обработки транзакций OLTP (On-Line Transaction Processing). В основе второй лежит концепция  хранилищ данных (Data Warehouse).

Хранилища данных содержат непротиворечивые консолидированные  исторические данные предприятия, отражающие его деятельность за достаточно продолжительный  период времени, а также данные о  внешней среде его функционирования.

Часто, наряду с общим  хранилищем данных предприятия, используют витрины данных (Data Mart), представляющие собой специализированные аналитические  базы данных по конкретному подразделению  или аспекту деятельности предприятия. В соответствии с этим хранилище  данных может иметь как двухуровневую (источники данных – хранилище  данных), так и трехуровневую (источники  данных – общее хранилище данных – специализированные аналитические  базы данных) архитектуру.

Другими словами, хранилище  данных определяется как “предметно-ориентированная, интегрированная, зависимая от времени, некорректируемая коллекция данных, предназначенная для поддержки  принятия управленческих решений”.

Основной целью создания интегрированных информационно-аналитических систем является перемещение информационного базиса компании из аморфной среды в структурированную, развивающуюся в соответствии с заранее намеченным планом, являющуюся источником информации, отвечающей насущным потребностям бизнеса. Создание и наполнение такой среды является первым шагом на пути к архитектуре корпоративных данных (информационной архитектуре), способной удовлетворять информационные потребности бизнеса.

Интегрированные информационно - аналитические системы предназначены, прежде всего, для работников управления, они объединяет, анализирует и хранит как единое целое информацию, извлекаемую как из операционных баз данных, так и из внешних источников. Входящие в состав информационно-аналитических систем хранилища данных обеспечивают преобразование больших объемов сильно детализированных данных в управляемые и выверяемые обзорные отчеты, которые могут быть использованы работниками управления для принятия обоснованных решений. Интегрированные информационно - аналитические системы являются сегодня инструментом для всех руководителей, столь же настоятельно необходимым, как и транзакционные системы, которые эффективно регистрируют операционную активность организации.

Интегрированные информационно - аналитические система, как правило, базируется на хранилище данных, которое:

-является базой данных, предназначенной только для чтения;

-обновляется из операционных  деловых систем на периодической  основе;

-предлагает единый подход  к именованию и хранению данных, причем не имеет значения, как  организованы данные в источниках;

-разрабатывается для  поддержки управленческих нужд, а не для транзакционной обработки.

Хранилище данных предлагает среду накопления данных, оптимизированную для выполнения сложных аналитических  запросов управленческого персонала. Эти запросы могут быть достаточно индивидуальны для каждого подразделения  и даже отдельного руководителя.

Хранилище данных автоматически  собирает операционные данные, согласовывая их и объединяя в предметно-ориентированный  формат, который нужен работникам управления. Данные в хранилище данных не предназначены для модификации.

Предметная ориентация хранилищ данных означает, что данные объединены в категории и хранятся в соответствии с теми областями, которые они  описывают, а не с приложениями, в  которых они используются.

Интегрированность хранилищ данных подразумевает, что при переносе в хранилище данных, принадлежащих  различным источникам, кодирование  которых обычно не совпадает, эти  данные согласуются по существующей системе наименований. Интегрированность  определяет данные сразу таким образом, чтобы они удовлетворяли требованиям  всего предприятия (в его развитии), а не единственной функции бизнеса. Тем самым, хранилище данных гарантирует, что одинаковые отчеты, сгенерированные  для разных аналитиков будут содержать  одинаковые результаты.

Некорректируемость хранилищ данных заключается в том, что  хранилище данных само только считывает  данные, оно не создает данные (они  поступают от операционных или внешних  источников), не корректирует их и не удаляет. Целостность данных обеспечивает концепцию единого источника  достоверной информации в организации.

Зависимость от времени данных в хранилищах подразумевает, что  хранилище данных предназначено  для анализа данных во времени, например, чтобы их можно было использовать для сравнений, идентификации трендов  и прогнозов. Важно знать не только значения данных, но и время их появления. Кроме того, данные в хранилище  данных должны быть согласованы во времени. Нельзя допустить, чтобы данные из различных источников считывались  по состоянию на разные моменты времени.

Направленность хранилищ данных на потребности управления гарантирует  правильное использование хранилища  данных для анализа и поддержки  принятия решений, а не для обработки  транзакций.

Хранилище данных содержит данные, извлеченные из систем оперативной  работы, и физически отличается от обычных баз данных организации. Хранилище данных обеспечивает среду  накопления данных, которая не только надежна, но также оптимизирована по доступу к данным и манипулированию  ими.

Наиболее важное отличие  между хранилищем данных и традиционными  базами данных заключается в методах  суммаризации данных, а также в  использовании словаря метаданных для описания и управления этими  данными. Осуществление суммаризации в громадной степени уменьшает  объем данных и увеличивает скорость доступа. В то же самое время, это  позволяет пользователям быстро получить обзор ситуации, чтобы затем  детально посмотреть на нужный предмет. Суммаризация также обеспечивает эффективный  механизм повышения секретности  между данными разных уровней  агрегации, описанными в словаре  метаданных.

Хранилище данных дополняет  и расширяет функции систем оперативной  работы без отрицательного воздействия  на них. Более того, хорошо организованное хранилище данных также оптимизирует существующие инвестиции компании в  данные и оборудование.

Несмотря на обилие данных, возможностей их сбора и хранения, компании до сих пор испытывают существенный недостаток в информации, необходимой  для стратегического и оперативного управления своей деятельностью. Существующие системы сбора и обработки  корпоративных данных в принципе не пригодны для использования в  многоплановом процессе принятия управленческих решений.

Согласно опросу, проведенному консалтинговой группой META Group, существует несколько основных причин, по которым  компании применяют технологии хранилищ данных:

-возможность принятия  высокоэффективных решений;

-повышение качества деловой  информации;

-улучшение услуг для  клиентов;

-поддержка стратегического  планирования;

-общая реорганизация  бизнес-процесса.

В условиях быстро меняющегося  рынка, нестабильной политической обстановки, ужесточающейся конкуренции новые  требования предъявляются к актуальности деловой информации и ее достоверности. В результате развития горизонтальных связей и делегирования полномочий вниз все больше требуется оперативный  анализ ситуации, все большее значение приобретают тактические решения.

В этой ситуации промышленный процесс производства информации должен укладываться в жесткие временные  рамки. Именно хранилище данных может  и должно обеспечить требуемые временные  характеристики. После того, как  традиционная система обработки  данных реализована и начинает функционировать, она становится ровно таким же самостоятельным объектом, как и  любой производственный процесс. В  этом смысле данные обладают ровно  теми же свойствами и характеристиками, что и любой промышленный продукт: сроком годности, местом складирования (хранения), совместимостью с данными  из других производств, рыночной стоимостью, транспортабельностью, комплектностью, ремонтопригодностью и т.д.

Именно с этой точки  зрения рассматриваются данные в  хранилище данных. Предметом рассмотрения являются не способы описания и отображения  объектов предметной области, а собственно данные, как самостоятельный объект предметной области, порожденный в  результате функционирования ранее  созданных систем оперативной обработки  данных.

Сегодня можно говорить о  том, что появление концепции  хранилища данных послужило серьёзным  стимулом для развития внутренней архитектуры  современных систем управления базами данных (СУБД), их программного окружения, инструментальных средств конечного  пользователя, различных межкорпоративных стандартов.

Среди особенностей разработки хранилищ данных, прежде всего, выделяется проблема обеспечения защиты данных. Хранилища данных представляют собой  совокупность конфиденциальной информации, собранной со всего предприятия. Доступ к ней конкурентов в  той или иной форме может привести к существенным потерям для компании. Проблемы могут возникать даже вследствие доступа к «чужой» информации сотрудниками компании, когда сотрудники одного подразделения, например, получают доступ к внутренней информации другого  подразделения. Решение этой проблемы не всегда возможно на уровне администрирования  доступа в СУБД, так как требует  разделения доступа на уровне отдельных  строк. В результате проблемы обеспечения  конфиденциальности должны решаться на уровне разрабатываемых приложений.

Традиционная проблема создания хранилищ данных – обеспечение требуемого объема хранения данных. Согласно данным консалтинговой группы META Group, уже сегодня, около половины организаций планируют  хранилища объемом в сотни  гигабайт. При этом следует помнить, что объем необходимого дискового  пространства может в несколько  раз (до десяти) превышать объеме хранимых данных (и этот коэффициент растет с ростом объема хранимых данных).

Наиболее распространённой на сегодня ошибкой, является попытка  найти в концепции хранилища  данных некий законченный рецепт реализации информационной аналитической  системы. Тем более, это не некий  готовый программный продукт  или некое готовое универсальное  решение. В этом смысле, интересна  и показательна оценка компании Butler Group Co. структуры затрат на реализацию хранилища данных, по которой до 50% от стоимости системы составляет стоимость консалтинга и лишь оставшиеся 50% является стоимость аппаратных, сетевых и программных компонент.

Эффект от правильной организации, стратегического и оперативного планирования развития бизнеса трудно заранее оценить в цифрах, но очевидно, что он в десятки и даже сотни  раз может превзойти затраты  на реализацию таких систем. Однако не следует и заблуждаться. Эффект обеспечивает не сама система, а люди с ней работающие. Поэтому не совсем корректны декларации типа: “Хранилище данных будет помогать менеджеру  принимать правильные решения”. Современные  аналитические системы не являются системами искусственного интеллекта и они не могут ни помочь, ни помешать в принятии решения. Их цель своевременно обеспечить менеджера всей информацией, необходимой для принятия решения. А какая информация будет запрошена  и какое решение будет принято  на её основе, зависит только от конкретного  человека.

Экономический эффект, обеспечиваемый информационно-аналитическими системами, существенно превышает эффект от традиционных оперативных систем. Однако стоимость аналитических систем, базирующихся на хранилищах данных, остается достаточно высокой, поскольку методологии  и технологии реализации таких систем находятся ещё в стадии становления. В этой связи необходимо подчеркнуть, что непременным условием успеха проекта создания информационно-аналитической  системы является наличие соответствующей  технологии, регламентирующей весь жизненный  цикл ее.

 

1.2. Создание информационно-аналитической  системы на базе хранилища данных

В системах, используемых для  автоматизации бизнес-процессов  современных компаний, реализуются  два следующих основных подхода:

- подход, основанный на OLTP-технологии оперативной обработки транзакций (соответствующие системы также называют автоматизированными системами обработки данных или транзакциоными системами);

- подход, основанный концепции хранилищ данных.

Опережающее развитие OLTP-технологий характерно как для всей отрасли  информационных технологий, так и  для конкретного предприятия, развивающего собственную автоматизацию. Это  связано с тем, что транзакционные системы, во-первых, позволяют навести  порядок именно в процессах повседневной рутинной обработки (переработки) данных, что является первоочередной задачей  автоматизации, а, во-вторых, именно они  являются, по сути, источниками данных для аналитических систем. Однако, если развитие технологии хранилищ данных запаздывает, возникает парадоксальная ситуация, при которой на предприятии  накоплены большие архивы исторических данных, но использовать их для решения  конкретных аналитических задач  невозможно. Дело в том, что на достаточно большом предприятии (корпорации), как  правило, используется несколько, а  иногда и достаточно много информационных систем. Данные в системах могут  быть структурированы различным  образом. Они плохо стыкуются  между собой. Их трудно интегрировать. Другой причиной сложности использования  этих данных для анализа является то, что используемые в них структуры  данных формируются для оптимального выполнения операций ввода и редактирования данных. Операции поиска данных по сложным  критериям и их агрегации при  этом нередко требуют большого времени  и, что еще хуже, тормозят работу операторов, осуществляющих ввод и  редактирование оперативных данных. Поэтому, например, операции формирования отчетов традиционно выполняются  в таких системах в то время, когда  оперативная нагрузка на системы  снижается, то есть, чаще всего, ночью.

Чтобы упростить решение  указанных выше проблем, создаются  корпоративные хранилища данных. Хранилища данных содержат выверенную и согласованную информацию, предназначенную  для использования в информационно-аналитических  системах и системах поддержки принятия решений. Информация в них хранится в специальной форме, удобной  для быстрого выполнения различных  запросов, позволяющих предоставлять  данные в различных разрезах с  различной степенью агрегации. Эти  данные могут быть востребованы непосредственно, а также могут использоваться для реализации нескольких витрин данных, представляющих собой, по сути, специализированные аналитические базы данных для решения  конкретных задач, например, поддерживающие прогнозирование спроса, планирование производства или анализ издержек.

Следует особо отметить, что информация, собираемая в хранилищах данных, существенно отличается от информации в OLTP-системах. Основные отличия  представлены в таблице (таблица 1).

 

 

Характеристика данных

OLTP-системы 

Хранилища данных

Частота обновления

Высокая частота, маленькими порциями

Малая частота, большими порциями

Источники данных

В основном - внутренние

В основном - внешние

Объемы хранимых данных

Сотни мегабайт, гигабайты

Гигабайты и терабайты

Возраст данных

Текущие (за период от нескольких месяцев до одного года)

Текущие и исторические (за период в несколько лет, десятки  лет)

Назначение

Фиксация, оперативный поиск  и преобразование данных

Хранение детализированных и агрегированных исторических данных, аналитическая обработка, прогнозирование  и моделирование 


 

Таблица 1. Сравнение характеристик  данных в OLTP-системах и хранилищах данных.

Необходимость создания хранилищ данных кроме того связана с потребностями  в специфических способах визуализации информации для руководителей, в  формировании не только регламентированных отчетов, характерных для OLTP-систем, но и отчетов по произвольным запросам, представляющих данные в различных  разрезах и с различной степенью агрегации. Хранилище данных должно обеспечить высших руководителей компании информацией для формирования и  коррекция целей развития корпорации, принятия стратегических решений.

 

1.3. Классификация  интегрированных информационно  – аналитических систем

Различают два вида интегрированных информационно – аналитических систем по режиму и темпу анализа:

- статические - имеют заранее разработанный сценарий обработки данных при весьма ограниченных возможностях вариаций запросов – так называемые информационные системы руководителя (Exequtive Information system EIS);

- динамические – обеспечивают обработку нерегламентированных запросов и гибкую систему подготовки отчетов.

Статические ИАС при всей кажущейся простоте и соответственно привлекательности для ЛПР имеют  ограниченные возможности по информационной поддержке принятия решений. Зачастую полученная в отчетах информация порождает вытекающие из ее содержания вопросы, на которые в допустимое время ответ не может быть получен.

Динамические интегрированных информационно – аналитических систем предназначены для обработки незапланированных заранее, неожиданных запросов. Пользователи системы работают с такой ИАС в интерактивном режиме. Обрабатывается серия непредусмотренных заранее запросов, которые возникают в ходе полготовки и принятия решения. Заранее может быть подготовлена некоторая цепочка действий или сценарий, который может корректироваться.

Поддержка принятия управленческих решений осуществляется в следующих  режимах или базовых сферах:

- сфера детализированных данных;

- сфера агрегированных показателей;

- сфера закономерностей.

В сфере детализированных данных подсистемы интегрированных информационно – аналитических систем или автономные ИС нацелены на поиск данных. Эту задачу отлично выполняют реляционные СУБД. В качестве языка манипулирования данными, ставшего стандартным, используется, как правило, SQL. Для поиска детализированной информации используются информационно-поисковые системы, которые могут работать с операционными, локальными или региональными базами и хранилищами данных.

Сфера агрегированных показателей  отличается агрегацией данных, оперативной  аналитической обработкой, многомерным  представлением в виде гиперкубов, многомерным анализом. В этой сфере  используются специальные многомерные  СУБД. Допустимо использование реляционных  представлений данных. При правильном применении реляционных СУБД, как  показано выше, показатели эффективности  интегрированных информационно - аналитических систем сопоставимы со специализированными многомерными. Агрегированные массивы при реляционном подходе представлены в виде описанных выше схем: «звезды» и других. Агрегация может производиться также «на лету» при обработке запроса.

Анализ детализированных данных и агрегированных показателей  относится к оперативному или OLAP-анализу.

Сфера закономерностей связана  или основана на интеллектуальной обработке  данных. Главной задачей здесь  является выявление закономерностей  в исследуемых процессах, взаимосвязей и взаимовлияния различных факторов, поиск крупных «непривычных»  отклонений, прогноз хода различных  существенных процессов. Эта сфера  относится к интеллектуальному  анализу.

 

 

 

Глава 2. Проектирование интегрированных информационно - аналитических систем

2.1. Структура создания интегрированных информационно - аналитических систем

Создание интегрированных информационно-аналитических систем всегда направлено на решение задач управления во всех его аспектах - управления финансовыми, кадровыми, техническими ресурсами и т.д. Поэтому, в конечном счете, отдача от внедрения информационно-аналитической системы будет состоять в резком повышении эффективности управления: оперативного принятия сбалансированных решений, возможности долговременного планирования и прогнозирования и т.д. Эффективность управления достигается, в том числе, и за счет существенного возрастания обоснованности принятых решений на основе больших выборок точных данных и огромного аналитического аппарата.

Следует подчеркнуть, что интегрированная информационно-аналитическая система - это не готовый продукт или семейство продуктов. Успех реализации информационно-аналитической системы зависит от правильного выбора и максимально тесной интеграции используемых для его реализации средств.

Типовыми компонентами интегрированных информационно-аналитических систем на основе хранилищ данных являются:

-автоматизированные и  информационные OLTP-системы, которые  рассматриваются как источники  данных для хранилища данных;

-средства извлечения, преобразования, согласования и транспортировки  данных;

-средства моделирования,  используемые для подготовки  информационной модели, описывающей  существующие структуры данных  в источниках их получения  (оперативных базах, архивах и  т.д.); правила, процедуры и периодичность  их выборки, согласования и  агрегации, целевые структуры  данных в хранилище данных; процедуры  формирования регламентов выборки  и представления данных;

-репозиторий, используемый  для хранения описаний моделей  данных и метаданных;

-средства реализации  баз данных хранилища данных;

-инструментальные средства  реализации регламентированных  процедур выборки и представления  данных (регламентированные запросы);

-инструментальные средства  конечного пользователя, предназначенные  для формирования нерегламентированных  запросов, выполняемых в пакетном  режиме;

-инструментальные средства  конечного пользователя, предназначенные  для формирования нерегламентированных  запросов, выполняемых в оперативном  режиме.

Интегрированные информационно-аналитические  системы объединяют, анализируют  и хранят как единое целое информацию, извлекаемую как из учетных баз  данных организации, так и из внешних  источников.

 

2.2. Этапы проектирования  интегрированных информационно  - аналитических систем

Этапами проектирования интегрированных информационно - аналитических систем являются:

  • Описание предметной области, целей создания системы и выполнение постановки задачи.
  • Составление словаря системы.
  • Разработка базы знаний и базы данных.
  • Внедрение системы.

Этап 1. Описание предметной области, целей создания системы и выполнение постановки задачи. Описание должно отражать специфику предметной области в нескольких формах. Первая из них - это текстовое представление содержание процессов, объектов и связей между ними. Вторая форма описания представляет собой графическое представление дерева целей, стоящих перед пользователем, или дерева И-ИЛИ.

Постановка всякой задачи предполагает указание результатов функционирования системы, исходных данных, а также  общее описание процедур, формул и  алгоритмов преобразования исходных данных в результирующие данные.

Этап 2. Составление словаря системы. Словарь системы - это набор слов, фраз, кодов, наименований, используемых разработчиком для обозначения условий, целей, заключений и гипотез. Благодаря словарю пользователь понимает результаты работы системы. Составление словаря - важная работа, ибо четко сформулированные условия и ответы резко повышают эффективность эксплуатации системы.

Этап 3. Разработка базы знаний и базы данных. База знаний, как правило, состоит из двух компонентов: дерева целей с расчетными формулами и базы правил (сеть вывода). База правил создается на основании графа целей и сформулировавши ранее гипотез. Главное внимание здесь уделяется коэффициентам определенности исходных условий и правил их обработки.

Этап 4. Внедрение. Проверяется и оцениваются правильность работы системы. Устанавливаются результаты, которые затем сравниваются с полученными в процессе запуска системы. Проверяются также промежуточные расчеты с помощью блока, отвечающего на вопросы как и почему.

Интегрированныеинформационно- аналитические системы