Базы данных и хранилища данных. Состав, свойства, ключевые функции
МИНОБРНАУКИ РОССИИ
Нижегородский государственный технический университет имени Р.Е. Алексеева
Кафедра «Управление финансами предприятий»
Факультет экономики, менеджмента и инноваций
РЕФЕРАТ
по дисциплине: «Информационный менеджмент и информационный системы организаций»
на тему: «Базы данных и хранилища данных. Состав, свойства, ключевые функции»
Выполнил: студент группы 10 ИНМ
Ильина Л.В.
Нижний Новгород
2012 г
Содержание
1.Введение……………………………………………………
2. Хранилища данных……………………………………
3. Принципы построения…………………………………………….7
3.1. Основополагающие концепции…………
3.2. Основные компоненты хранилища данных……………………7
4.Технологии управления информацией …………………………...9
4.1. СУБД для хранилища данных…………………………………..9
4.2. OLAP-технология………………………………………
5. Понятие баз данных………………………………
6. Создание БД…………………………………………………
6.1. Структура таблиц…………….……………………
6.2. Пользовательские формы……………………
6.3. Создание запросов…………………………………
6.4. Создание отчетов……………………………………
7. Заключение……………………………………………………
8.Список литературы……………………………………………….
1. Введение
Рассмотрим фирму, которая ведет некую производственную и торговую деятельность: скажем, что-то проектирует, производит и продает. Для продажи у нее имеется, в частности, торговая система, которая учитывает движение товарных и денежных средств.
Повседневная деятельность такой фирмы сопровождается ежедневным внесением в базу данных десятков счетов, накладных и других оперативных документов. Реляционные СУБД, проектировались и используются для выполнения именно такой работы - для управления большим потоком транзакций, каждая из которых связана с внесением небольших изменений в оперативные данные предприятия. Системы такого типа называются системами оперативной обработки транзакций или OLTP (Online Transaction Processing) Будем называть их просто оперативными системами.
Известно, что структура
БД оперативных систем в высокой
степени нормализована, т.е. состоит
из множества таблиц, связанных между
собой посредством внешних
Потребности в оперативных документах краткосрочны. С оперативными документами работают в течение какого-то времени: отслеживают оплату счета, приход денег, поставку товара и т.д. Для контроля данного процесса периодически формируются отчеты, которые имеют несколько стандартных для фирмы разновидностей и строятся путем выборки данных непосредственно из БД торговой системы. Оперативный документ, сыграв свою роль, далее в рамках торговой системы, как правило, больше не используется. Со временем растущий объем данных начинает замедлять выполнение операций, что порождает естественное желание избавиться от старых неиспользуемых данных.
Между тем в накопленных
данных содержится история развития
предприятия, история его взаимоотношений
с поставщиками и покупателями. Данные,
накопленные в предприятии, - уникальный
ресурс. В результате их анализа
можно было бы получить ценнейшую
информацию, позволяющую принимать
эффективные управленческие решения.
Ценность информации, а, следовательно,
и глубина анализа еще более
возрастут, если использовать объединенную
информацию всего предприятия, всех
его систем. Но для этого руководителю
может потребоваться
Следует отметить, что подобные исследования редко проводятся самим руководителем. Чаще он приглашает или выращивает в своей фирме аналитика, который хочет извлечь из данных все, что можно. Например, понять, какой тип клиентов наиболее перспективен для фирмы, или какие скидки будут оптимальными этой весной. Но сделать это оказывается не так-то просто.
Традиционный анализ, который, как правило, осуществляется при помощи изучения набора готовых отчетных форм, а его результатом является принятие одного из стандартных бизнес-решений, здесь явно не поможет. Если считать, что в распоряжении аналитика имеется только традиционная СУБД, то при выполнении возложенных на него обязанностей он столкнется с рядом проблем:
Построение сводных отчетов
над нормализованной
Для построения систем ОLАР используются специализированные многомерные БД либо надстройки над обычными реляционными БД. До последнего времени ОLАР-технология ассоциировалась с большими проектами по хранению массивов данных и сложными приложениями для их анализа. Сложный и дорогой ОLАР-инструментарий был доступен только очень крупным компаниям.
И все же в последнее
время ситуация на рынке резко
изменилась. Произошло это благодаря
тому, что было найдено компромиссное
решение: укомплектовать полноценным
ОLАР-сервером хорошо зарекомендовавшие
себя недорогие программные
2. Хранилища данных
Хранилища данных – это процесс сбора, отсеивания и предварительной обработки данных с целью представления результирующей информации пользователям для статистического анализа и аналитических отчетов. Ральф Кинболл (автор концепции хранилищ данных) описывал хранилища данных как «место, где люди могут получить доступ к своим данным». Он же сформулировал основные требования к хранилищам данных:
-поддержка высокой скорости данных из хранилища;
-поддержка внутренней непротиворечивости данных;
-возможность получения и сравнения данных;
-наличие удобных утилит просмотра данных хранилища;
-полнота и достоверность хранимых данных;
-поддержка качественного процесса пополнения данных.
Всем перечисленным
в-третьих – средства пополнения хранилищ данных. Типичное хранилище данных как правило отличается от реляционной базы данных:
1)Обычная база данных
предназначена для того, чтобы
помочь пользователям
2)Обычная база данных
подвержена постоянным
-данные в нем обновляются согласно расписанию (например, ежечасно, ежедневно, ежемесячно),
-в идеале, процесс пополнения
данными за определенный
3)Обычная база данных
чаще всего является
3. Принципы построения
3.1 Основополагающие концепции
Информация, которая загружается в хранилище, должна интегрироваться в целостную структуру, отвечающую целям анализа данных. При этом минимизируются несоответствия между данными из различных оперативных систем, в хранилище именуются и выражаются единым образом. Данные интегрированы на множестве уровней: на уровне ключа, атрибута, на описательном, структурном уровне и так далее. Общие данные и общая обработка данных консолидированы и являются единообразным для всех данных, которые подобны или схожи в хранилище данных. При этом информация структурируется по разным уровням детализации:
-высокая степень суммаризации;
-низкая степень суммаризации;
-текущая детальная информация.
Хранилища можно рассматривать как набор моментальных снимков состояния данных: можно восстановить картинку на любой момент времени. Атрибут времени всегда явно присутствует в структурах данных хранилища.
Попав однажды в хранилище, данные уже никогда не изменяются, а только пополняются новыми данными из оперативных систем, где данные постоянно меняются. Новые данные по мере поступления обобщаются с уже накопленной информацией в хранилище данных.
3.2. Основные компоненты хранилища данных
Использование технологии хранилищ данных предполагает наличие в системе следующих компонентов:
-оперативных источников данных;
-средств переноса и трансформации данных;
-метаданных – включают
каталог хранилища и правила
преобразования данных при
-реляционного хранилища;
-OLAP-хранилища;
-средств доступа и анализа данных.
Назначение перечисленных компонентов таково. Оперативные данные собираются из различных источников. Поступившие оперативные данные очищаются, интегрируются и складываются в реляционные хранилище. Они уже доступны для анализа при помощи средств построения отчетов. Затем данные (полностью или частично) подготавливаются с использованием средств переноса и трансформации данных для OLAP-анализа, который реализуется применением средств доступа и анализа данных. При этом они могут быть загружены в специальную базу данных OLAP или оставаться в реляционном хранилище.
Важнейшим элементом хранилища
являются метаданные, т.е. данные о структуре,
размещении, трансформации данных,
которые используются любыми процессами
хранилища. Метаданные могут быть востребованы
для различных целей, например: извлечения
и загрузки данных; обслуживании хранилища
и запросов. Метаданные для различных
процессов могут иметь
Вывод. Итак, хранилища данных являются структурированными. Они содержат базовые данные, которые образуют единый источник для обработки данных во всех системах поддержки принятия решений. Элементарные данные, присутствующие в хранилище, могут быть представлены в различной форме. Хранилища данных исключительно велики, поскольку в них содержатся интегрированные и детализированные данные.
Эти характеристики являются общими для всех хранилищ данных. Но, несмотря на то что хранилища обладают общими свойствами, разные типы хранилищ имеют свои индивидуальные особенности.
4.Технологии управления информацией
4.1.СУБД для хранилища данных
Для работы с хранилищем
данных используются СУБД, к которым
предъявляются специальные
-высокая производительность загрузки данных;
-возможность обработки данных на уровне загрузки;
-наличие средств управления качеством данных;
-высокая производительность запросов;
-широкая масштабируемость
по размеру и количеству
-возможность организации сети хранилищ данных;
-наличие средств
-поддержка интегрированного многомерного анализа;
-расширенный набор
4.2.OLAP-технология
Для упрощения анализа была предложена и разработаны концепция хранилища данных. Предполагается, что такое хранилище содержит сведения, поступающие от разных источников, а так же интегрированные данные, получаемые в результате анализа первичных данных. Естественно, для поддержки предложенной концепции потребовались специальные средства управления процессом хранения и обработки информации, к которым относятся инструментальные средства OLAP-технологии.
OLAP (on-line analytical processing
Для построения систем OLAP используются специализированные многомерные базы данных, либо надстройки над обычными реляционными базами данных. До последнего времени OLAP-технология ассоциировалась с большими проектами по хранению массивов данных и сложными приложениями для их анализа. Сложный и дорогой OLAP-инструментарий был доступен только очень крупным компаниям.
И все же в последнее время ситуация на рынке резко изменилась. Произошло это благодаря тому, что было найдено компромиссное решение: укомплектовать полноценным OLAP-сервером хорошо зарекомендовавшие себя недорогие программные продукты. К таким продуктам относятся, например, MS SQL-сервер баз данных, начиная с версии 7 и позднее, который во всем мире активно используется для построения хранилищ данных. Компания Microsoft предпринимает ряд серьезных мер, чтобы обеспечить наилучшую поддержку хранилищ данных и построения информационных систем. Вследствие указанного изменения ситуации современные OLAP-системы анализа данных стали действительно доступны малому и среднему бизнесу.
5.Понятие баз данных
Теория баз данных — сравнительно молодая область знаний Возраст ее составляет немногим более 30 лет. Однако изменился ритм времени, оно уже не бежит, а летит, и мы вынуждены подчиняться ему во всем. И действительно, современный мир информационных технологий трудно представить себе без использования баз данных. Практически все системы в той или иной степени связаны с функциями долговременного хранения и обработки информации. Фактически информация становится фактором, определяющим эффективность любой сферы деятельности. Увеличились информационные потоки и повысились требования к скорости обработки данных, и теперь уже большинство операций не может быть выполнено вручную, они требуют применения наиболее перспективных компьютерных технологий. Любые административные решения требуют четкой и точной оценки текущей ситуации и возможных перспектив ее изменения. И, если раньше в оценке ситуации участвовало несколько десятков факторов, которые могли быть вычислены вручную, то теперь таких факторов сотни и сотни тысяч, и ситуация меняется не в течение года, а через несколько минут, а обоснованность принимаемых решений требуется большая, потому что и реакция на неправильные решения более серьезная, более быстрая и более мощная, чем раньше. И, конечно, обойтись без информационной модели производства, хранимой в базе данных, в этом случае невозможно.
Эффективное развитие государства немыслимо без систем управления. Современные системы управления базируются на комплексных системах обработки информации, на современных информационных технологиях.
Современные системы компьютерного управления обеспечивают:
1)Выполнение точного и полного анализа данных.
2)Получение информации во времени без задержек.
3)Определение тенденций изменения важных показателей.
Приложение Microsoft Access является мощной и высокопроизводительной 32-разрядной системой управления реляционной базой данных (СУБД).
База данных – это совокупность структурированных и взаимосвязанных данных и методов, обеспечивающих добавление выборку и отображение данных.
Реляционная база данных. Практически все СУБД позволяют добавлять новые данные в таблицы. С этой точки зрения СУБД не отличаются от программ электронных таблиц (Excel) ,которые могут эмулировать некоторые функции баз данных. Существует три принципиальных отличия между СУБД и программами электронных таблиц:
- СУБД разрабатываются
с целью обеспечения
- СУБД может легко связывать
две таблицы так, что для
пользователя они будут
- СУБД минимизируют общий объём
базы данных. Для этого таблицы,
содержащие повторяющиеся
Access – мощное приложение Windows. При этом производительность СУБД органично сочетаются со всеми удобствами и преимуществами Windows.
Как реляционная СУБД Access обеспечивает доступ ко всем типам данных и позволяет одновременно использовать несколько таблиц базы данных. Можно использовать таблицы, созданные в среде Paradox или dBase. Работая в среде Microsoft Office , пользователь получает в своё распоряжение полностью совместимые с Access текстовые документы(Word), электронные таблицы(Excel) , презентации(PowerPoint).С помощью новых расширений для Internet можно напрямую взаимодействовать с данными из World Wide Web и транслировать представление данных на языке HTML, обеспечивая работу с такими приложениями как Internet Explorer и Netscape Navigator.
Access специально спроектирован
для создания многопользовательских
приложений, где файлы базы данных
являются разделяемыми
6.Создание баз данных
База данных - это совокупность структурированных и взаимосвязанных данных и методов, обеспечивающих добавление выборку и отображение данных. Microsoft Access позволяет управлять всеми сведениями из одного файла базы данных. В рамках этого файла используются следующие объекты:
- таблицы для сохранения данных;
- запросы для поиска и извлечения только требуемых данных;
- формы для просмотра, добавления и изменения данных в таблицах;
- отчеты для анализа
и печати данных в
Удачная разработка базы данных обеспечивает простоту ее поддержания. Данные следует сохранять в таблицах, причем каждая таблица должна содержать информацию одного типа, тогда достаточно будет обновить конкретные данные только в одном месте, чтобы обновленная информация отображалась во всей базе данных.
База данных для решения поставленной задачи состоит из:
- Таблиц
- Запросов
- Форм
- Отчетов
6.1.Структура таблиц
Данные в базе данных хранятся в таблицах, каждая из которых имеет свое уникальное имя в базе данных. В таблицах данные распределяются по столбцам (которые называют полями) и строкам (которые называют записями). Все данные, содержащиеся в поле таблицы, должны иметь один и тот же тип. Каждое поле таблицы характеризуется наименованием, типом и шириной поля. При задании типа данных поля можно также указать размер, формат и другие параметры, влияющие на отображение значения поля и точность числовых данных. Основные типы данных:
- Текстовый. Текст или числа не требующие проведения расчётов.
- МЕМО. Поле этого типа предназначено для хранения небольших текстовых данных (до 64000 символов). Поле этого типа не может быть ключевым или проиндексированным.
- Числовой. Этот тип данных содержит множество подтипов. От выбора подтипа (размера) зависит точность вычислений.
- Счётчик. Уникальные, последовательно возрастающие числа, автоматически вводящиеся при добавлении новой записи в таблицу.
- Логический. Логические значения, а так же поля, которые могут содержать одно из двух возможных значений.
- Денежный. Денежные значения и числовые данные, используемые в математических вычислениях.
- Дата/Время. Дата и время хранятся в специальном фиксированном формате.
- Поле объекта OLE. Включает звукозапись, рисунок и прочие типы данных. Поле этого типа не может быть ключевым или проиндексированным.
- Гиперсвязь. Содержит адреса Web-страниц.
Одним из основных требований, предъявляемых к СУБД, является возможность быстрого поиска требуемых записей среди большого объема информации. Индексы представляют собой наиболее эффективное средство, которое позволяет значительно ускорить поиск данных в таблицах.
Важной особенностью индексов
является то, что можно использовать
индексы для создания первичных
ключей. В этом случае индексы должны
быть уникальными. Первичные ключи
и дополнительные индексы используются
при определении отношений
В базе данных содержится множество
таблиц, связь между которыми устанавливается
с помощью совпадающих значений
в ключевых полях. В большинстве
случаев связывают ключевое поле
одной таблицы с
6.2. Пользовательские формы
Формы Access позволяют создавать пользовательский интерфейс для таблиц базы данных. Хотя для выполнения тех же самых функций можно использовать режим таблицы, формы предоставляют преимущества для представления данных в упорядоченном и привлекательном виде. Формы позволяют также создавать списки значений для полей, в которых для представления множества допустимых значений используются коды. Правильно разработанная форма ускоряет процесс ввода данных и минимизирует ошибки.
Формы создаются из набора
отдельных элементов
Формы Access являются многофункциональными; они позволяют выполнять задания, которые нельзя выполнить в режиме таблицы. Формы позволяют производить проверку корректности данных, содержащихся в таблице. Access позволяет создавать формы, включающие другие формы (форма внутри формы называется подчиненной). Формы позволяют вычислять значения и выводить на экран результат.
6.3. Создание запросов
Запросы являются важным инструментом в любых системах управления базами данных. Они используются для выделения, обновления и добавления новых записей в таблицы. Чаще всего запросы используются для выделения специфических групп записей, чтобы удовлетворить определенному критерию. Кроме того, их можно использовать для получения данных из различных таблиц, обеспечивая единое представление связанных элементов данных. При помощи этих мощных гибких средств можно:
- Формировать сложные критерии для выбора записей из одной или нескольких таблиц;
- Указать поля, которые должны быть отображены для выбранных записей;
- Выполнять вычисления с использованием выбранных данных.
В Access существует четыре типа запросов для различных целей:
- Запросы на выборку отображают данные из одной или нескольких таблиц в виде таблицы.
- Перекрестные запросы собирают данные из одной или нескольких таблиц в формате, похожем на формат электронной таблицы. Эти запросы используются для анализа данных и создания диаграмм, основанных на суммарных значениях числовых величин из некоторого множества записей.
- Запросы на изменение используются для создания новых таблиц из результатов запроса и для внесения изменений в данные существующих таблиц. С их помощью можно добавлять или удалять записи из таблицы и изменять записи согласно выражениям, задаваемым в режиме конструктора запроса.
- Запросы с параметрами - это такие запросы, свойства которых изменяются пользователем при каждом запуске. При запуске запроса с параметром появляется диалоговое окно, в котором нужно ввести условие отбора. Этот тип запроса не является обособленным, т. е. параметр можно добавить к запросу любого типа.
6.4. Создание отчетов
Конечным продуктом
Создаваемые Access отчеты делятся на шесть основных типов:
- Отчеты в одну колонку представляют собой один длинный столбец текста, содержащий значения всех полей каждой записи таблицы или запроса. Надпись указывает имя, а справа от нее указывается значение поля. Новое средство Access Автоотчёт позволяет создать отчет в одну колонку щелчком по кнопке панели инструментов Автоотчет. Отчеты в одну колонку используются редко, поскольку такой формат представления данных приводит к лишней трате бумаги.
- В ленточных отчетах для каждого поля таблицы или запроса выделяется столбец, а значения всех полей каждой записи выводятся по строчкам, каждое в своем столбце. Если в записи больше полей, чем может поместиться на странице, то дополнительные страницы будут печататься до тех пор, пока не будут выведены все данные; затем начинается печать следующей группы записей.
- Многоколоночные отчеты создаются из отчетов в одну колонку при использовании колонок "газетного" типа или колонок "змейкой", как это делается в настольных издательских системах и текстовых процессорах. Информация, которая не помещается в первом столбце, переносится в начало второго столбца, и так далее. Формат многоколоночных таблиц позволяет сэкономить часть бумаги, но применим не во всех случаях, поскольку выравнивание столбцов едва ли соответствует ожиданиям пользователя.

- Базы данных как информационный ресурс
- Базы данных. Области применения баз данных
- Базы данных о покупателях и прямой маркетинг
- Базы данных. Основные понятия и характеристика
- Базы данных. Системы правления базами данных. Компоненты правления базами данных
- Базы данных. Системы управления базами данных
- Базы данных. Создание и управление базами данных. Создание баз данных на основе Microsoft Access
- Базы данных ЕАИС таможенных органов России
- Базы данных и их сравнительные характеристики
- Базы данных и системы управления базами данных
- Базы данных и системы управления базами данных
- Базы данных и системы управления базами данных
- Базы данных и системы управления базами данных
- Базы данных и системы управления базами данных (2)