Понятие о данных как о ресурсе Головчинер М.Н.
БАЗЫ ДАННЫХ
Основные понятия, модели данных, процесс проектирования
КУРС ЛЕКЦИЙ
Томск 2011
СОДЕРЖАНИЕ
1. ВВЕДЕНИЕ.. 4
1.1. Понятие о данных как о ресурсе. 4
1.2. Файловые системы и базы данных. 5
1.2.1. Численные и информационные прикладные системы.. 5
1.2.2. Файловые системы.. 6
1.2.3. Файлы и информационные системы. Общее понятие о базе данных. 7
КОНТРОЛЬНЫЕ ВОПРОСЫ ПО ПЕРВОМУ РАЗДЕЛУ.. 10
2.БАЗА ДАННЫХ КАК МОДЕЛЬ ПРЕДМЕТНОЙ ОБЛАСТИ.. 10
2.1. Понятие предметной области. 10
2.2. Понятие системы.. 12
2.3. Понятие модели. Структурная модель. 13
2.4. Модель предметной области и модель данных. 14
КОНТРОЛЬНЫЕ ВОПРОСЫ ПО ВТОРОМУ РАЗДЕЛУ.. 15
3.ПОНЯТИЕ О БАНКЕ ДАННЫХ.. 16
3.1. Структура банка данных. 16
3.2. Организационный аспект. 17
3.3. Уровни представления базы данных. 18
КОНТРОЛЬНЫЕ ВОПРОСЫ ПО ТРЕТЬЕМУ РАЗДЕЛУ.. 21
4.ВОПРОСЫ ПРОЕКТИРОВАНИЯ БАЗ ДАННЫХ.. 22
4.1. Жизненный цикл информационной системы.. 22
4.2. Процесс проектирования. 23
4.2.1. Организационный аспект. 23
4.2.2. Задачи и структура процесса проектирования. 24
4.2.3. Формулирование и анализ требований. Инфологическое проектирование. 26
4.2.4. Общая схема логического (концептуального) проектирования. 32
КОНТРОЛЬНЫЕ ВОПРОСЫ ПО ЧЕТВЕРТОМУ РАЗДЕЛУ.. 35
5.МОДЕЛИ ДАННЫХ.. 36
5.1. Реляционная модель данных. 37
5.1.1. Базовые понятия. 37
5.1.2. Принципы нормализации. 40
5.1.3. Целостность сущности и ссылок. 45
5.1.4. Манипулирование данными в реляционных моделях. 46
5.1.4.1. Операции реляционной алгебры.. 47
5.1.4.2. Реляционное исчисление. 56
5.1.5. Достоинства и недостатки реляционных моделей. 59
КОНТРОЛЬНЫЕ ВОПРОСЫ ПО РАЗДЕЛУ 5.1. 60
5.2.Навигационные модели данных. 60
5.2.1. Иерархическая модель. 60
5.2.2. Сетевые структуры.. 63
5.2.3. Особенности навигационных моделей. Достоинства и недостатки. 66
КОНТРОЛЬНЫЕ ВОПРОСЫ ПО РАЗДЕЛУ 5.2. 68
6.СИСТЕМА УПРАВЛЕНИЯ БАЗОЙ ДАННЫХ.. 68
6.1.Назначение и функции СУБД.. 68
6.2.Типовая организация СУБД и упрощенная схема работы.. 72
КОНТРОЛЬНЫЕ ВОПРОСЫ ПО ШЕСТОМУ РАЗДЕЛУ.. 74
7.ОСНОВЫ ФИЗИЧЕСКОГО ПРОЕКТИРОВАНИЯ.. 75
7.1.Файловые и страничные системы хранения информации. 75
7.2.Файловые структуры. Классификация методов доступа. 76
7.2.1. Способы последовательной организации. 76
7.2.2. Прямые методы доступа. Хеширование. 77
7.2.3. Прямые методы доступа. Классификация методов индексирования. 80
7.2.4. Доступ с полным (плотным) индексом.. 81
7.2.5. Доступ с неплотным индексом.. 82
7.2.6. Организация индексов в виде В-деревьев. 83
7.2.7. Инвертированный файл (доступ по неключевым атрибутам) 84
7.2.8. Использование битовых шкал. 85
7.2.9. Достоинства и недостатки основных методов доступа. 87
7.3.Бесфайловая организация внешней памяти. 88
7.3.1. Особенности реляционных СУБД.. 88
7.3.2. Базовые структуры памяти. 89
7.3.2.1. Структура и типы страниц. 89
7.3.2.2. Табличные пространства. 90
7.3.2.3. Понятие экстента и буферизация. 92
7.3.3. Проблемы и параметры управления внешней памятью.. 92
КОНТРОЛЬНЫЕ ВОПРОСЫ ПО СЕДЬМОМУ РАЗДЕЛУ.. 94
8.ОСОБЕННОСТИ ОБЪЕКТНО-ОРИЕНТИРОВАННЫХ СУБД.. 94
8.1.Основные понятия объектно-ориентированного подхода. 94
8.2.Предпосылки появления объектно-ориентированных СУБД.. 95
8.3.Объектная модель данных. ООСУБД.. 97
8.4Объектно-реляционные СУБД.. 100
8.4.1. Объектно-реляционное отображение. 101
8.5.Управление ресурсами. Сервер объектов и сервер страниц. 105
КОНТРОЛЬНЫЕ ВОПРОСЫ ПО ВОСЬМОМУ РАЗДЕЛУ.. 108
9.ВОПРОСЫ РАСПРЕДЕЛЕННЫХ БАЗ ДАННЫХ.. 108
9.1.Централизованные и децентрализованные СУБД.. 108
9.2.Стратегии хранения данных. Достоинства и недостатки. 109
9.3.Проблемы распределенных баз данных. 111
9.4.Одновременная работа. 111
9.5.Управление блокированием.. 113
9.6.Методы синхронизации распределенных обновлений. 114
9.7.Завершение транзакции. Журнал транзакций. 116
9.8.Свойства транзакций. 117
КОНТРОЛЬНЫЕ ВОПРОСЫ ПО ДЕВЯТОМУ РАЗДЕЛУ.. 118
ЗАКЛЮЧЕНИЕ.. 118
ЛИТЕРАТУРА.. 118
ВВЕДЕНИЕ
Понятие о данных как о ресурсе
Очевидно, что в большинстве областей человеческой деятельности, связанных с функционированием любой организации (предприятия, банка, учебного заведения и т.д.), принятие производственного решения основывается на анализе и использовании имеющихся ресурсов (например, финансовых, материальных, трудовых). Для того, чтобы использование ресурсов было оптимальным, ими нужно уметь эффективно управлять. Управление ресурсами в общем случае (вне зависимости от видов ресурсов) означает способность к выполнению над ними процедур планирования, распределения, поддержкии сохранения, экономного расходования, правильного потребленияи интеграции (возможности использования в различных целях). Для успешногорешения этих задач необходимо всесторонне изучить свойства ресурсов. Рассмотрим примеры наиболее известных ресурсов.
Финансовые ресурсы.Для реализации управленческих процедур необходима, по крайней мере, следующая информация о свойствах финансовых потоков:
· какие средства доступны,
· сколько израсходовано,
· откуда поступают,
· куда направляются.
Ответственным управляющим лицом является главный бухгалтер. Обычный инструмент для принятия решений (информационная среда, информационное хранилище) – бухгалтерская книга с информацией о денежных ресурсах и сметы, позволяющие определить, куда направлены средства, откуда они поступили, какое количество было израсходовано, сколько осталось.
Материальные ресурсы. Примером материальных ресурсов является сырье для производства изделий. Ответственный – допустим, коммерческий директор, отвечает за обеспечение производства требуемым количеством сырья нужного вида. Необходимая информация:
· какие материалы имеются в наличии,
· откуда поступают,
· куда направляются,
· сроки реализации заказов.
Примером хранилища информации о материальных ресурсах является инвентарная книга.
Трудовые (кадровые) ресурсы. Ответственный за управление – начальник отдела кадров. Хранилище – картотека личных дел, содержит следующую информацию:
· общее число сотрудников,
· о каждом сотруднике – его профессия, образование, стаж работы, должность, местонахождение рабочего места и т.д.
Просматривая картотеку, можно определить прошлые достижения сотрудников, их ценность для предприятия, возможность продвижения по службе и т.п.
Таким образом, для управления каждым из перечисленных видов ресурсов необходимо:
· определить свойства ресурса;
· выделить среду хранения;
· назначить ответственное управляющее лицо - администратора ресурса;
· реализовать вышеперечисленные процедуры управления.
Данные как ресурс. Очевидно, что информация, необходимая для управления любым из указанных ресурсов, извлекается из собранных, проанализированных и хранящихся данных о свойствах искомого ресурса. Возможность моделирования (представления) в памяти ЭВМ любого хранилища (бухгалтерской и инвентарной книги, картотеки и т.п.) позволяет рассматривать сами данные как один из видов ресурсов.
Очевидно, что использование данных как ресурса предполагает:
· представление самого понятия “данные”;
· умение их собирать и анализировать;
· определение природы и свойств данных, для чего необходимо знать, как и с какой целью они применяются, где находятся, откуда поступают и т.п.; таким образом, для управления данными необходимо иметь о них как можно больше сведений;
· наличие среды хранения полученных сведений, которые могут надежно сохраняться только при наличии четких процедур накопления, планирования и ведения данных;
· возможность после сбора и организации сведений получения доступа к ресурсу данных всюду, где нужна информация, требуемая для управления другими ресурсами, то есть интегрирование данных;
· наличие администратора данных.
Исторически рассмотрение данных как ресурса стало возможным с появлением внешних запоминающих устройств и размещением на них наборов данных, организованных в виде файлов.
|