Пиши Дома Нужные Работы

Обратная связь

Файлы и информационные системы. Общее понятие о базе данных

Информационные системы главным образом ориентированы на хранение, выбор и модификацию постоянно хранимой информации, как правило, очень сложной структуры.

На начальном этапе использования вычислительной техники проблемы структуризации данных решались индивидуально в каждой информационной системе путем создания необходимых надстроек (библиотек программ) над файловыми системами, учитывающими специфику структур файлов для конкретной предметной области, причем эти индивидуальные средства управления данными составляли существенную часть информационных систем

Однако, несмотря на то, что структуры данных различны в разных информационных системах, между ними часто бывает много общего. Разумным представлялось выделить общую часть информационных систем, ответственную за управление сложно структурированными данными, в виде некоторой библиотеки программ, доступной каждой информационной системе.

Но очень скоро стало понятно, что обойтись такой общей библиотекой программ, реализующей над стандартной базовой файловой системой более сложные методы хранения данными, невозможно.

Пример. Необходимо реализовать простую информационную систему, поддерживающую учет сотрудников некоторой организации. Система должна:

· выдавать списки сотрудников в соответствии с указанными номерами отделов,

· поддерживать регистрацию перевода сотрудника из одного отдела в другой, приема на работу новых сотрудников и увольнения работающих,

· для каждого отдела должна быть предусмотрена возможность получения имени руководителя этого отдела, общей численности отдела, общей суммы выплаченной в. последний раз зарплаты и т. д.,



· для каждого сотрудника должна поддерживаться возможность выдачи полного имени сотрудника по номеру удостоверения, получения информации о текущем соответствии занимаемой должности сотрудника и о размере зарплаты.

Предположим, что мы решили реализовать эту информационную систему на основе файловой системы и пользоваться при этом одним файлом, расширив базовые возможности файловой системы за счет специальной библиотеки функций. Поскольку минимальной информационной единицей в нашем случае является сотрудник, естественно потребовать, чтобы в этом файле содержалась одна запись для каждого сотрудника, включающая несколько полей:

· номер удостоверения (Сотр_номер),

· полное имя сотрудника (Сотр_имя),

· информация о соответствии занимаемой должности (Сотр_стат - для простоты, "да" или "нет"),

· размер зарплаты (Сотр_зарп),

· номер отдела (Сотр_отд_номер),

· имя руководителя отдела (Сотр_отд_рук), поскольку мы хотим ограничиться одним файлом.

Для выполнения функций нашей информационной системы требуется возможность:

· доступа к этому файлу по уникальному ключу – не дублируемому в разных записях значению поля Сотр_номер,

· доступа к файлу по значению (возможно, и не уникальному) поля Сотр_имя,

· выбора всех записей с общем заданным значением поля Сотр_отд_номер, то есть доступ по неуникальным ключам.

Очевидно, для того, чтобы получить численность отдела или общий размер зарплаты, информационная система должна будет каждый раз выбирать все записи о сотрудниках отдела и подсчитывать соответствующие общие значения.

Таким образом, для реализации даже такой простой системы на базе файловой системы, во-первых, требуется создание достаточно сложной надстройки, обеспечивающей многоключевой доступ к файлам, и, во-вторых, неизбежны существенная избыточность хранения (для каждого сотрудника данного отдела повторяется имя руководителя отдела) и выполнение массовой выборки и вычислений для получения сводной информации об отделах. Кроме того, если в ходе эксплуатации системы возникнет потребность, например, выдавать списки сотрудников, получающих заданную зарплату, то придется либо полностью просматривать файл, либо реструктуризовывать (менять структуру) его, объявляя ключевым поле Сотр_зарп и упорядочивая записи файла по значениям этого нового ключа.

Возможным путем повышения эффективности работы данной системы была бы поддержка двух многоключевых файлов СОТРУДНИКИ и ОТДЕЛЫ: первый файл должен содержать поля Сотр_имя, Сотр_номер, Сотр_стат, Сотр_зарп и Сотр_отд_номер, а второй - Отд_номер, Отд_рук(имя руководителя отдела), Сотр_зарп (общий размер зарплаты) и Отд_размер (общее число сотрудников в отделе). Тогда большая часть неудобств, перечисленных в предыдущем абзаце, будет преодолена. Каждый из файлов будет содержать только не дублируемую информацию, необходимость в динамических вычислениях сводной информации не возникнет.

Однако, теперь система должна знать, что она работает с двумя информационно связанными файлами, ей должны быть известны структура и смысл каждого поля (например, что Сотр_отд_номер в файле СОТРУДНИКИ и Отд_номер в файле ОТДЕЛЫ означают одно и то же), а также понимать, что в ряде случаев изменение информации в одном файле должно вызывать модификацию второго файла, чтобы общее содержимое файлов было согласованным. Например, если на работу принимается новый сотрудник, то необходимо добавить запись в файл СОТРУДНИКИ, а также соответствующим образом изменить поля Отд_зарп и Отд_размер в записи файла ОТДЕЛЫ, описывающей отдел этого сотрудника.

Но если информационная система поддерживает согласованное хранение информации в нескольких файлах, можно говорить о том, что она поддерживает базу данных. Если же некоторая вспомогательная система управления данными позволяет работать с несколькими файлами, обеспечивая их согласованность, можно назвать ее системой управления базами данных (СУБД). Вообще, согласованность данных является ключевым понятием баз данных. Заметим, что одно только требование поддержки согласованности данных в нескольких файлах не позволяет обойтись библиотекой функций: такая система должна обладать некоторыми собственными данными (мета-данными, данными о данных) и даже знаниями, определяющими целостность данных. Более подробно функции СУБД рассматриваются в разделе 6.

Таким образом, использование файловых систем для удовлетворения сложных интегрированных запросов, требующих обработки большого количества разнотипных данных, за приемлемое время практически невозможно. Возникает необходимость разделить программы и описания обрабатываемых ими данных, определить такую организацию хранения данных с учетом существующих связей между ними, которая позволяла бы использовать эти данные одновременно для многих приложений. Понятие база данных (БД) и явилось выражением этого подхода. При такой организации в состав прикладной программы включаются лишь запросы к базе данных, записанные на соответствующем языке. В запросе специфицируются (описываются) требования как о самих данных, так и о форме их представления. Искомый запрос воспринимается СУБД, которая и осуществляет поиск затребованных данных в базе и преобразование их представления. Структура прикладной программы при такой организации изображена на рис. 2.

Таким образом, БД может быть определена как:

Определение 1. Совокупность предназначенных для машинной обработки интегрированных данных, служащая для удовлетворения нужд многих пользователей.

 

 
 

 

 


Рис. 2. Структура программы при использовании технологии баз данных

В связи с концепцией баз данных еще раз подчеркнем два ключевых момента:

1. Информация уже не скрыта в сочетании “файл-программа”; она хранится явным образом в БД. БД ориентирована на интегрированные запросы, а не на одну задачу.

2. Возможность выделения по запросу из всех данных, хранящихся в БД, только необходимых и в требуемой форме (структуре и форматах).

Наиболее широко БД используются в управленческой деятельности благодаря следующим свойствам:

· Скорость.Возможныйдоступ к информации за требуемое время.

· Полная доступность. Вся информация, содержащаяся в БД, доступна для использования (с учетом, конечно, необходимости засекречивания и защиты).

· Гибкость. Легко вносимые изменения и дополнения в БД позволяют получать ответы на вопросы, которые ранее оставались без ответа.

· Целостность. Уменьшилась степень дублирования данных и ликвидирована их противоречивость; упорядочился процесс обновления и восстановления БД после сбоев; появилась возможность управления параллельного общения с БД нескольких прикладных программ.

Другими словами, под базой данных понимается некоторая унифицированная совокупность данных, совместно используемая персоналом/населением группы, предприятия, региона, страны, мира... Задача базы данных состоит в хранении всех представляющих интерес данных в одном или нескольких местах, причем таким способом, который заведомо исключает ненужную избыточность. В хорошо спроектированной базе данных избыточность данных исключается, и вероятность сохранения противоречивых данных минимизируется. Таким образом, создание баз данных преследует две основные цели: понизить избыточность данных и повысить их надежность.

Замечание. Таким образом, СУБД решают множество проблем, которые затруднительно или вообще невозможно решить при использовании файловых систем. При этом существуют приложения, для которых вполне достаточно файлов, и приложения, для которых безусловно нужны базы данных. Другими словами, современные системы управления файлами и управления базами данных представляют собой весьма совершенные инструменты, каждый из которых может быть успешно применен в соответствующей области деятельности. Но всегда необходимо помнить, что каждый инструмент приносит максимальную пользу именно в той области, для которой он создан.

КОНТРОЛЬНЫЕ ВОПРОСЫ ПО ПЕРВОМУ РАЗДЕЛУ

1. Перечислите набор общих процедур управления ресурсами.

2. Какие еще составляющие, кроме среды хранения, можно выделить в системе управления ресурсом.

3. Дайте общее определение информационной системы.

4. Какие дополнительные требования к вычислительной технике предъявляют информационные потребности по сравнению с вычислительными задачами.

5. Какова структура программы при использовании файловой системы управления информационными массивами.

6. Перечислите достоинства и недостатки файловой системы управления информационными массивами.

7. Какова структура программы при использовании технологии баз данных.

8. В чем основное функциональное отличие использования файловой системы управления информационными массивами и технологии баз данных.

9. Сформулируйте общее понятие о базе данных, как о хранилище информации. Перечислите основные преимущества в использовании баз данных.

10. Какие два ключевых момента следует отметить при переходе к технологии баз данных.






ТОП 5 статей:
Экономическая сущность инвестиций - Экономическая сущность инвестиций – долгосрочные вложения экономических ресурсов сроком более 1 года для получения прибыли путем...
Тема: Федеральный закон от 26.07.2006 N 135-ФЗ - На основании изучения ФЗ № 135, дайте максимально короткое определение следующих понятий с указанием статей и пунктов закона...
Сущность, функции и виды управления в телекоммуникациях - Цели достигаются с помощью различных принципов, функций и методов социально-экономического менеджмента...
Схема построения базисных индексов - Индекс (лат. INDEX – указатель, показатель) - относительная величина, показывающая, во сколько раз уровень изучаемого явления...
Тема 11. Международное космическое право - Правовой режим космического пространства и небесных тел. Принципы деятельности государств по исследованию...



©2015- 2024 pdnr.ru Все права принадлежат авторам размещенных материалов.