Работа в системе LaTeX
de301fb4

Понятие кодировки. Пример: кодировка T1.


Система LaTeX пытается реализовать следующую простую идею: набор символов и форма символов (гарнитура) являются независимыми координатами. Скажем, можно говорить о русских и латинских шрифтах (два значения первой координаты), а также о шрифтах гарнитуры таймс и гельветика (два значения второй координаты), и двигаться по каждой координате независимо.

Несмотря на кажущуюся очевидность, этот принцип трудно реализовать буквально, и не только потому, что какие-то значения координат соответствуют отсутствующим в данном комплекте шрифтам, но и по более тонким причинам. Например, в какой-то гарнитуре может быть специальный символ { "fi"}, которым изображаются стоящие рядом буквы f и i (это называется " лигатурой", обратите внимание на отличие этого символа от набранных подряд букв:fi), а в другой гарнитуре соединять эти буквы не принято и такого символа нет.

Тем не менее в первом приближении можно считать, что в системе LaTeX есть два независимых параметра: кодировка (encoding) говорит, какие символы имеются, а семейство (font family) определяет внешний вид символов. Мы уже упоминали кодировку T1, используемую при работе с неанглийскими языками на латинской основе. Рисунок B.1 показывает символы кодировки T1, представленные шрифтами семейства Computer Modern.


Рис. B.1.  Кодировка T1

Та же самая кодировка T1, представленная шрифтами семейства Helvetica, показана на рисунке B.2


Рис. B.2.  Кодировка Т1:Helvetica

В теории эти две таблицы должны отличаться лишь формой символов, но на практике это не совсем так: в нынешней версии LaTeX'а некоторые позиции в кодировке T1 в шрифте типа Helvetica не заполнены соответствующими буквами.

Тем не менее кодировка T1 (ее еще называют Cork encoding, поскольку кодировка была утверждена на конференции TeXников в ирландском городе Корк) обеспечивает более или менее приемлемую основу для использования LaTeX'а с разными шрифтами и разными языками с латинской графикой.

Впрочем, до сих пор по умолчанию используется так называемая кодировка OT1, в которой всего

символов, представленных в оригинальных шрифтах Кнута.
Эта кодировка показана на рисунках B.3 и В.4. в двух видах (обычные шрифты и tt}-шрифты).


Рис. B.3.  Кодировка ОТ1


Рис. B.4.  Кодировка ОТ1:семейство cmtt

Читатель может заметить, что эти таблицы не соответствуют идее кодировки, объясненной выше: далеко не все символы в двух таблицах соответствуют друг другу. (А в курсивных шрифтах на месте доллара появляется фунт!) Причина этого понятна: шрифты разрабатывались Кнутом исходя из ограничения в
символов и до появления общей схемы переключения шрифтов.


Содержание раздела