Фрагмент одноствольного алфавита
Как видно из примера в таком фрагменте содержится нулевой объем информации. Но это же доказывается строго с точки зрения алфавитного подхода.
Найдем информационный вес символа в таком алфавите из уравнения: 2k = 1.Но поскольку 1 = 20, то отсюда следует, что k = 0 бит.
Минимальная мощность алфавита, пригодного для передачи информации, равна 2. Такой алфавит называется двоичным алфавитом.
Информационный вес символа в двоичном алфавите легко определить. Поскольку 2k = 2, то k = 1 бит.
Итак,один символ двоичного алфавита несет 1 бит информации.1 бит – исходная единица измерения информации.
Зная информационный вес одного символа, мы можем измерить количество информации в тексте (символьном сообщении), составленном из символов некоторого алфавита. Конечно, к содержаниютекста такая мера информации отношения не имеет и поэтому такой подход можно назвать объективным, то есть не зависящим от воспринимающего его субъекта.
Такой алфавитный подход удобен при подсчете количества информации, хранимого, передаваемого и обрабатываемого техническими устройствами, поскольку устройствам нет дела до содержательной стороны сообщений. Компьютеры, принтеры, модемы работают не с самой информацией а с ее представлением в виде сообщений.
Итак, зная из формулы Хартли, что величина k– это информационный вес символа можно определить количество информации во всем тексте (I), состоящем из L символов, которое будет равно произведению информационного веса символа k на L:
I =k * L (2)
Величину Iможно назвать информационным объемом текста.
Примеры решения задач.
Задача №1
Книга, набранная с помощью компьютера, содержит 159 страниц. На каждой странице – 40 строк. В каждой строе – 60 символов. Каков объем информации в книге?
Решение:
Мощность компьютерного алфавита равна 256. Один символ несет 1 байт информации. Значит, страница содержит 40 * 60 * 1 = 2400 байт информации.
Объем всей информации в книге (в разных единицах):
2400 * 150 = 360 000 байт
360000/1024 = 351,5625 Кбайт
351,5625/1024 = 0,3433 Мбайт.
Задача №2
Для записи сообщения использовался 64-х символьный алфавит. Каждая страница содержит 30 строк. Все сообщение содержит 8775 байтов информации и занимает 6 страниц. Сколько символов в строке?
Решение:
Информационный вес символа 64-го символьного алфавита составляет 6 бит (26=64).
Для определения общего числа символов в сообщении разделим объем информации на информационный вес одного символа. Сначала переведем заданный объем информации из байтов в биты (8 775* 8=70 200)
Полученный результат разделим на информационный вес одного символа (6 бит). Получаем всего символов в сообщении 11 700 (70 200/6= 11 700).
Определим общее число строк в тексте 180 (30*6=180)
Для определения числа символов в строке следует разделить общее количество символов (11 700) на общее число строк (180). В результате получим 65 символов в строке (11 700/180=65).
Кодирование графической информации
В середине 50-х годов для больших ЭВМ, которые применялись в научных и военных исследованиях, впервые в графическом виде было реализовано представление данных, что связано со свойством человеческой психики: наглядность способствует более быстрому пониманию. Широкое применение получила специальная область информатики, которая изучает методы и средства создания и обработки изображений с помощью программно-аппаратных вычислительных комплексов – компьютерная графика. В качестве примера можно привести опытно-конструкторские разработки, медицину (компьютерная томография), научные исследования и др.
Особенно интенсивно технология обработки графической информации с помощью компьютера стала развиваться в 80-х годах. Графическую информацию можно представлять в двух формах: аналоговой или дискретной. Живописное полотно, цвет которого изменяется непрерывно – это пример аналогового представления, а изображение, напечатанное при помощи струйного принтера и состоящее из отдельных точек разного цвета – это дискретное представление. Путем разбиения графического изображения (дискредитации) происходит преобразование графической информации из аналоговой формы в дискретную. При этом производится кодирование – присвоение каждому элементу конкретного значения в форме кода.
При кодировании изображения происходит его пространственная дискредитация. Ее можно сравнить с построением изображения из большого количества маленьких цветных фрагментов (метод мозаики).
Все изображение разбивается на отдельные точки (пиксели), каждому элементу ставится в соответствие код его цвета. При этом качество кодирования будет зависеть от следующих параметров: размера пикселя и количества используемых цветов. Чем меньше размер пикселя (изображение составляется из большего количества точек) тем выше качество кодирования.
В основе кодирования цветных графических изображений – принцип декомпозиции цветов – т. е. разложение произвольного цвета на основные составляющие (например, по системе RGB: красный (Red), зеленый (Green) и синий (Blue)). Чем большее количество цветов используется (т.е. точка изображения может принимать больше возможных состояний), тем больше информации несет каждый пиксель, а, значит, увеличивается качество кодирования.
Глубина кодирования (глубина цвета) – количество бит (двоичных разрядов), используемых для кодирования цвета одной точки. От глубины цвета (k) зависит количество отображаемых цветов (N) – т. е. количество возможных состояний одной точки изображения: N=2k. Наиболее распространенные значения глубины цвета: 4, 8, 16, 24 бита на точку.
Разрешение – количество точек (пикселей) изображения, приходящихся на единицу длины. От разрешения зависит размер пикселя. Наиболее часто используемые экранные разрешения: 640x480, 800x600, 1024x768, 1280x1024 точек.
Глубина кодирования и разрешение влияют на качество кодирования изображения.
Объем видеопамяти (V), необходимый для формирования графического изображения на экране:
V = M * N * k (3)
где M – кол-во точек изображения по горизонтали,
N – кол-во точек изображения по вертикали,
k – глубина цвета (бит).
Создание и хранение графических объектов возможно в нескольких видах – в виде векторного, фрактального или растрового изображения. Отдельным предметом считается 3D (трехмерная) графика, в которой сочетаются векторный и растровый способы формирования изображений. Для каждого вида используется свой способ кодирования графической информации.
Растровое изображение
При помощи увеличительного стекла можно увидеть, что черно-белое графическое изображение, например, из газеты, состоит из мельчайших точек, составляющих определенный узор – растр. Этот метод издавна применяется в полиграфии для кодирования графической информации. Точность передачи рисунка зависит от количества точек и их размера. После разбиения рисунка на точки, начиная с левого угла, двигаясь по строкам слева направо, можно кодировать цвет каждой точки. Далее одну такую точку будем называть пикселем (происхождение этого слова связано с английской аббревиатурой "picture element" – элемент рисунка).
Объем растрового изображения определяется умножением количества пикселей на информационный объем одной точки, который зависит от количества возможных цветов. Качество изображения определяется разрешающей способностью монитора. Чем она выше, то есть больше количество строк растра и точек в строке, тем выше качество изображения. Так как яркость каждой точки и ее линейные координаты можно выразить с помощью целых чисел, то можно сказать, что этот метод кодирования позволяет использовать двоичный код для того чтобы обрабатывать графические данные.
Если говорить о черно-белых иллюстрациях (если не использовать полутона), то пиксель будет принимать одно из двух состояний: светится (белый) и не светится (черный). А так как информация о цвете пикселя называется кодом пикселя, то для его кодирования достаточно одного бита памяти: 0 – черный, 1 – белый.
Если же рассматриваются иллюстрации в виде комбинации точек с 256 градациями серого цвета (а именно такие в настоящее время общеприняты), то достаточно восьмиразрядного двоичного числа, для того чтобы закодировать яркость любой точки.
Цветовые модели
В компьютерной графике чрезвычайно важен цвет. Он выступает как средство усиления зрительного впечатления и повышения информационной насыщенности изображения. Ощущение цвета человеческим мозгом происходит в результате анализа светового потока, попадающего на сетчатку глаза от отражающих или излучающих объектов. Принято считать, что цветовые рецепторы человека (которые еще называют колбочками) подразделяются на три группы, причем каждая может воспринимать всего один цвет – или красный, или зеленый, или синий.
Если говорить о кодировании цветных графических изображений, то нужно рассмотреть принцип декомпозиции произвольного цвета на основные составляющие. Применяют несколько систем кодирования: HSB (удобна для человека), RGB (удобна для компьютера) и CMYK (удобна для типографий).
Использование этих цветовых моделей связано с тем, что световой поток может формироваться излучениями, представляющими собой комбинацию "чистых" спектральных цветов: красного, зеленого, синего или их производных. Различают аддитивное цветовоспроизведение (характерно для излучающих объектов) и субтрактивное цветовоспроизведение (характерно для отражающих объектов). В качестве примера объекта первого типа можно привести электронно-лучевую трубку монитора, второго типа – полиграфический отпечаток.
Модель HSB характеризуется тремя компонентами: оттенок цвета(Hue), насыщенность цвета (Saturation) и яркость цвета (Brightness). Можно получить большое количество произвольных цветов, регулируя эти компоненты. Эту цветовую модель лучше применять в тех графических редакторах, в которых изображения создают сами, а не обрабатывают уже готовые. Затем созданное свое произведение можно преобразовать в цветовую модель RGB, если ее планируется использовать в качестве экранной иллюстрации, или CMYK, если в качестве печатной, Значение цвета выбирается как вектор, выходящий из центра окружности. Направление вектора задается в угловых градусах и определяет цветовой оттенок. Насыщенность цвета определяется длиной вектора, а яркость цвета задается на отдельной оси, нулевая точка которой имеет черный цвет. Точка в центре соответствует белому (нейтральному) цвету, а точки по периметру – чистым цветам.
Принцип метода RGB заключается в следующем: известно, что любой цвет можно представить в виде комбинации трех цветов: красного (Red, R), зеленого (Green, G), синего (Blue, B). Другие цвета и их оттенки получаются за счет наличия или отсутствия этих составляющих.По первым буквам основных цветов система и получила свое название – RGB. Данная цветовая модель является аддитивной, то есть любой цвет можно получить сочетание основных цветов в различных пропорциях. При наложении одного компонента основного цвета на другой яркость суммарного излучения увеличивается. Если совместить все три компоненты, то получим ахроматический серый цвет, при увеличении яркости которого происходит приближение к белому цвету.
При 256 градациях тона (каждая точка кодируется 3 байтами) минимальные значения RGB (0,0,0) соответствуют черному цвету, а белому – максимальные с координатами (255, 255, 255). Чем больше значение байта цветовой составляющей, тем этот цвет ярче. Например, темно-синий кодируется тремя байтами (0, 0, 128), а ярко-синий (0, 0, 255).
Принцип метода CMYK. Эта цветовая модель используется при подготовке публикаций к печати. Каждому из основных цветов ставится в соответствие дополнительный цвет (дополняющий основной до белого). Получают дополнительный цвет за счет суммирования пары остальных основных цветов. Значит, дополнительными цветами для красного является голубой (Cyan,C) = зеленый + синий = белый – красный, для зеленого – пурпурный (Magenta, M) = красный + синий = белый – зеленый, для синего – желтый (Yellow, Y) = красный + зеленый = белый – синий. Причем принцип декомпозиции произвольного цвета на составляющие можно применять как для основных, так и для дополнительных, то есть любой цвет можно представить или в виде суммы красной, зеленой, синей составляющей или же в виде суммы голубой, пурупурной, желтой составляющей. В основном такой метод принят в полиграфии. Но там еще используют черный цвет (BlacК, так как буква В уже занята синим цветом, то обозначают буквой K). Это связано с тем, что наложение друг на друга дополнительных цветов не дает чистого черного цвета.
Различают несколько режимов представления цветной графики:
а) полноцветный (True Color);
б) High Color;
в) индексный.
При полноцветном режиме для кодирования яркости каждой из составляющих используют по 256 значений (восемь двоичных разрядов), т.е. на кодирование цвета одного пикселя (в системе RGB) надо затратить 8*3=24 разряда, что позволяет однозначно определять 16,5 млн. цветов. Это довольно близко к чувствительности человеческого глаза. При кодировании с помощью системы CMYK для представления цветной графики надо иметь 8*4=32 двоичных разряда.
Режим High Color – кодирование при помощи 16-разрядных двоичных чисел, т.е. уменьшается количество двоичных разрядов при кодировании каждой точки. Но при этом значительно уменьшается диапазон кодируемых цветов.
При индексном кодировании цвета можно передать всего лишь 256 цветовых оттенков. Каждый цвет кодируется при помощи восьми бит данных. Но так как 256 значений не передают весь диапазон цветов, доступный человеческому глазу, то подразумевается, что к графическим данным прилагается палитра (справочная таблица), без которой воспроизведение будет неадекватным: море может получиться красным, а листья – синими. Сам код точки растра в данном случае означает не сам по себе цвет, а только его номер (индекс) в палитре. Отсюда и название режима – индексный.
Соответствие между количеством отображаемых цветов (К) и количеством бит для их кодировки (а) находится по формуле:
К = 2а (4)
Таблица 4
|