Преимущество и проблемы интеграции информации

Интеграция информации – сбор информации в одну кучу.

Достоинства:

1. Синхронное поддержание данных для всех приложений.

2. Устраняется избыточность информации.

3. Благодаря исключению дублирования повышается достоверность информации

4. Унификация средств организации данных – пользователя не интересует, как и где хранится информация, он делает запросы и получает то, что ему надо (вот эгоист!).

5. Высокий уровень независимости приложения от организации данных.

Проблемы:

1. Поскольку пользователь уже не является единоличным владельцем своей информации возникает целая служба администратора базы данных, которая должна обеспечить нормальную работу:

1.1. Защита данных от разрушения при сбое оборудования (физическая целостность). Обеспечивается созданием резервных копий БД и ведения журнала изменений.

1.2. Защита от некорректных обновлений (логическая целостность). Создаются фильтры для каждого пользователя – то есть программ, допускающих пользователя только к своей информации. АБД для каждого пользователя определяет степень доступа (чтение; чтение/запись)

1.3. Большинство СУБД позволяет устанавливать область допустимых значений на данные.

1.4. Защита данных от несанкционированного доступа (использование ключей, паролей и так далее). Не делай легкий пароль блеять.

1.5. Обеспечение коллективного-параллельного доступа к данным. При параллельном чтении нет проблем. А вот при параллельном изменении данных БИДА. Если один пользователь начинает изменять данные, то работа остальных пользователей блокируется, до момента завершения изменений. Если в процессе внесений изменений произошла ошибка, то вся работа начинается с исходной точки.

Проектирование баз данных

1. Системный анализ

2. Инфологическое проектирование

3. Выбор СУБД

4. Даталогическое проектирование

5. Физическая реализация

Проектирование базы данных – это переход от одного уровня абстракции информации к другому, то есть последовательный переход от словестного описания информационного описания предметной области к формализованному описанию объектов предметной области в терминах некоторой модели.

Системный анализ

1. Системный анализ – подробное описание объектов предметной области и взаимосвязи между ними, то есть подробное описание информационной системы

На этом этапе определяется:

· Какие задачи решает система

· Какие ограничения существуют в системе

· Какие документы используются в системе

· Какие запросы удовлетворяются

Пример описания информационной системы «библиотека».

· Описание деятельности библиотеки

· Выделить основные объекты

1. Книга

1.1. ISBN

1.2. Автор

1.3. Область знаний

1.4. Количество страниц

1.5. Издательство

1.6. Издание

1.7. Год издания

1.8. Количество в библиотеке

2. Читатель

2.1. Номер читательского билета

2.2. ФИО

2.3. Год рождения

2.4. Адрес

2.5. Место работы

2.6. Телефон

3. Экземпляр

3.1. инвентарный номер

3.2. Место расположения

3.3. Вкладыш (кому, когда, дата возврата)

Ограничения:

1. Книга может иметь ни одного автора

2. Читатели старше 17 лет (или не старше, если для мелких)

3. Книга 1980 года и выше.

4. Каждый читатель должен иметь на руках не более 5 книг

5. Каждый читатель должен иметь домашний телефон

6. Каждая область знания может содержать много книг, каждая книга может относиться ко многим областям знаний.

Пользователи информационной системы

1. Библиотекарь. Его задачи:

· Прием и регистрация новых книг

· Относит книгу к одной или нескольким областям знаний

· Определяет инвентарный номер и размещение

· Списывает старые и утерянные книги

· Записывает нового читателя в библиотеку

· Уничтожает данные о выбывших читателях

· Учет выдачи книг

2. Читатель. Задачи читателя:

· Просмотр системного каталога по областям знаний, получение полного списка книг

· Получение инвентарного номера выбранных книг и дату возврата, если книга на руках

· Список книг по авторам

· …

3. Администратор. Его задачи:

· Должен иметь способ получать сведения о задолжниках

· Получить сведения о непопулярных книгах

· Получить сведения о наиболее популярных книгах

Инфологическое проектирование (без относительно конкретной СУБД)

Так как проектирование база дранных - это процесс длительный, итерационный, то для получения максимально положительного результата необходимо иметь такое представление модели базы дранных, что бы оно было всеобъемлющим и понятным, особенно заказчику.

Для представления инфологической базы данных используются ER модели.

КУРСОВАЯ – у меня отличная тема, я молодец

ER-модели

В базе модели 3 понятия

1. Сущность – это собирательное понятие некоторого объекта, процесса или явления. Сущность имеет уникальное имя. Множество экземпляров, характеризуются атрибутами.

2. Атрибут – поименованная характеристика сущности, причем набор атрибутов должен быть таким, что бы один экземпляр отличался от другого. Набор атрибутов, однозначно идентифицирующих экземпляр сущности, называется ключевым.

3. Между сущностями могут быть установлены связи – бинарные ассоциации показывающие, каким образом сущности взаимодействуют друг с другом.

Всякие графики с has_many belongs_to и прочие.

Выбор СУБД

При выборе СУБД большое значение имеет логическая модель, свойственная для данной СУБД. При этом выделяют 3 логические модели:

1. Иерархическая модель данных

2. Сетевая МД

3. Реляционная МД

Иерархическая модель данных

Рисунок дерева.

Особенности:

1. Могут присутствовать связи has_many, has_one

2. Структура древовидная.

3. Иерархия всегда начинается с корня (i = 1)

4. Корень только 1

5. На нижних уровнях, где i = 2,…,n – порожденные узлы и их может быть сколько угодно.

6. Доступ к каждому порожденному узлу выполняется только через его исходный.

7. Существует единственный иерархический путь доступа к любому узлу, начиная с корня.

Достоинства:

· На неё хорошо ложатся организационные системы

Недостатки:

· Сложный длительный поиск

Сетевая модель

Особенности:

1. Любой элемент может быть как исходным, так и порожденным

2. Любой элемент может иметь сколько угодно исходных.

3. Исходный элемент в сетевой модели называется владельцем набора, а порожденный – членом набора.

4. Любой элемент может быть одновременно и в роли владельца и в роли члена набора.

5. Связи могут быть: has_one, has_many, M:1, M:M

На сетевую систему хорошо ложатся ИС типа «план графиков»

Недостаток:

Запутанные пути, и поэтому возникает задача поиска оптимального пути.

Реляционная модель данных (РМД)

РМД - это множество взаимосвязанных таблиц, то есть информация в них представляется множеством таблиц.

Терминология в БД

Формальный термин РБД Неформальный эквивалент
Отношение Таблица
Схема отношения Строка заголовков, столбцов таблицы
Кортеж Строка
Атрибут Заголовок столбца
Домен Множество значений атрибута
Значение атрибута Значение поля в строке
Первичный ключ Один или несколько атрибутов, однозначно определяющих каждую строку
Тип данных Тип значений элементов в таблице
Степень Количество столбцов
Кардинальное число Количество строк в таблице

R:Студент

Номер зачетки ФИО Группа Дата рождения Дом. Адрес
Иванов
Сидоров
Петров

Номер зачетки – атрибут и первичный ключ. 5 доменов

Отношения характеризуются следующими свойствами:

1. Каждое отношения представляет 1 объект (сущность) и состоит из картежей и атрибутов. Совокупность всех возможных значений атрибутов – домен.

2. Всем столбцам таблицы присвоены уникальные имена.

3. В отношении не может быть 2-ух одинаковых строк.

4. Столбцы и строки могут просматриваться в любом порядке.

5. Строки могут быть не упорядочены сверху вниз, а столбцы слева-направо.

6. Каждое отношение должно иметь первичный ключ – это один или несколько атрибутов, который единственным образом идентифицирует каждую строку таблицы. Удаление какого-либо атрибута из сложного ключа нарушает идентификацию.

Возможны случаи, когда отношение имеет несколько комбинаций атрибутов, каждый из которых однозначно определяет все кортежи отношений. Эти комбинации называются возможными ключами, и любой из них может быть выбран первичным.

Ключи используются для:

1. Исключения дублирования кортежей.

2. Для упорядочения кортежей и как следствие, ускорения обработки информации.

3. Для организации связей между таблицами.

Связывание таблиц

R2: Студент – ФИО| группа | специальность

R3: Предметы – название | количество часов

R1: Успеваемость – ФИО | дисциплина | оценка

Пусть в отношении R1 имеется не ключевой атрибут А, значение которого является значениями ключевого предмета отношения R2, тогда говорят, что атрибут А отношения R1 есть внешний ключ (foreign key).

В РБД должна обеспечиваться ссылочная целостность, то есть каждому значению внешнего ключа должна соответствовать строка в связываемых таблицах.

При связывании двух таблиц выделяют основную и подчиненную таблицу. Логическое связывание производится при помощи ключа связи – один или несколько атрибутов связи (могут быть ключевыми или обычными). Между двумя таблицами могут быть установлены связи: 1:1 1:M M:1 M:M

Контроль целостности

Одной строке таблицы соответствует несколько в другой: 1:M

1. Контроль целостности - каждой записи основной таблицы соответствует 0 или более записей подчиненной таблицы.

2. В подчиненной таблице нет записей, которые не имеют записей в основной таблице.

3. Каждая запись дополнительной таблицы имеет только одну запись родительской таблицы.

Правило перехода от инфологической модели к РБД

1. Каждой сущности ставится в соответствие отношение реляционной модели.

2. Каждый атрибут сущности становится атрибутом отношения, возможно с другим именем. Для каждого атрибута отношений при этом определяется тип данных допустимых для этой СУБД.

3. Первичный ключ сущности становится первичным ключом отношения

4. В каждом отношении подчиненной сущности добавляется набор атрибутов основной сущности, являющихся первичными ключом основной сущности (внешний ключ)

Главная Страница