При регистрации в компьютерной системе для каждого пользователя заводится учетная запись. В учетной записи 3 поля – номер пользователя (число от 1 до 10000), ФИО (строка длиной 80 символов из строчных и заглавных букв русского алфавита, пробелов и дефисов) и пароль длиной 20 символов. В качестве символов в пароле могут быть 26 строчных латинских букв и спецсимволы из набора $%^&*#@. Пароль и ФИО кодируются отдельно, для кодирования каждого из этих полей используется посимвольное равномерное кодирование – каждый символ кодируется одинаковым и минимально возможным количеством бит. Каждое поле в учетной записи представлено минимально возможным целым количеством байт. Сколько байтов понадобится для хранения информации о 25 пользователях?
Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер - по их коду.
Удобство побайтового кодирования символов очевидно, поскольку байт - наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации.
Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу.
Понятно, что это дело условное, можно придумать множество кодировки.
Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.