Когда кодируется текстовая информация, то каждому из ее символов присваивается соответствующий его код - строка из восьми двоичных цифр. Соответствующая строка называется байтом (по-английски byte). Всего возможно 28 = 256 таких взаимно различных (неповторяющихся) строк.
Это позволяет осуществить представление больших и малых букв латинского алфавита, знаков, цифр, и т.д. Соответствие между символами и байтами определяется с помощью определенной таблицы, называемой таблицей кодирования или, проще говоря, кода.
С развитием вычислительной техники было разработано много кодов. В таблице 1.2 представлен код ASCII (American Standard Code for Information Interchange), применяемый в персональных компьютерах.
Коды 00100000, 00100001, 00100010, ..., 01111110 представляют собой символы английского (латинского) алфавита. Код 01111111 представляет собой непечатаемый (неотображаемый) символ Delete (Удаление). Коды 10000000,10000001, ..., 11111111 зарезервированы за символами национальных алфавитов, научными символами, графическими символами (их еще называют псевдографическими).
Кодирование текста осуществляется путем замены символов соответствующими байтами. Например, слово START осуществляется в коде ASCII следую щей последовательностью байтов:
01010011 01010100 0100001 01010010 01010100
Очевидно, что декодирование выполняется на оборот, в обратном порядке. Например, последовательность байтов
010100111 01010100 01001111 01010000 выводится в коде ASCII слово STOP