Hello, World! Глубокое погружение в Терминалы

в 15:20, , рубрики: C, linux, pseudoterminal, terminal, Разработка под Linux

Hello, World! Глубокое погружение в Терминалы - 1

На написание данной статьи меня вдохновила статья об анализе Сишного printf. Однако, там был пропущен момент о том, какой путь проходят данные после того, как они попадают в терминальное устройство. В данной статье я хочу исправить этот недочет и проанализировать путь данных в терминале. Также мы разберемся, чем отличается Terminal от Shell, что такое Pseudoterminal, как работают эмуляторы терминалов и многое другое.

Основы

Давайте для начала разберемся, что такое Terminal, Shell, Console, чем отличается Terminal Emulator от обычного Terminal и почему он так назван. Информации об этом написано уже довольно много, поэтому ничего нового вы здесь не услышите. Почти вся информация здесь была взята из интернета, ссылки приведу в конце статьи. Кто уже знает, что все эти вещи обозначают, может смело пропускать данный раздел.


Terminal

Terminal (терминал) — это комбинация дисплея и клавиатуры, то есть физическое устройство. До того, как терминалы стали именно данной комбинацией, они являлись неким устройством под названием teleprinter (teletype, teletypewriter или TTY сокращенно), то есть комбинацией принтера и клавиатуры. Обычно несколько терминалов подключались к одному и тому же компьютеру. Таким образом возможно было работать нескольким пользователям за одним и тем же компьютером, причем каждому выделялась своя сессия, независимая от других. Терминал был назван так потому, что он находился на конце терминального кабеля (terminal end).

Это Teletype:

Teletype

А это Terminal:

Terminal


Console

Console (консоль) — терминал, который подключен напрямую к компьютеру. Дело в том, что большинство терминалов были соединены неявно, но хотя бы один был подключен напрямую к компьютеру. Консоль было разрешено использовать строго определенному кругу лиц, так как она позволяла настраивать компьютер.


Shell

Если предыдущие два представляют собой физические устройства, то данное определение относится исключительно к программному обеспечению.

Shell — это command line interpreter. Главное предназначение — запускать другие программы. Существует большое количество различных Shell'ов. Самым распространенным является Bash (что как подсказывает Википедия, является каламбуром для «Born again» Shell, то есть «возрождённый» Shell). Другие примеры: Dash (легковесный Shell, доступен, если запустить бинарник по адресу /bin/sh), Zsh.


Конечно же, и терминалы, и консоли не могли не найти своего отражения в современности. Поэтому далее мы рассмотрим такие вещи, как Terminal Emulator и Virtual Console.

Terminal Emulator

Terminal Emulator — эмулятор старого доброго терминала. Эмулятор терминала требуется для программ, которые не могут напрямую взаимодействовать с X Window System — Bash, Vim и прочие.

Давайте для начала установим обязанности терминала:
1) Передача ввода пользователя в компьютер
2) Доставка вывода компьютера на дисплей

Так и наш Terminal Emulator выполняет абсолютно то же самое: он доставляет ввод пользователя в запущенную программу, а также отображает вывод программы на дисплей. В любом случае, смысл сохраняется — между пользователем и запущенной программой, существует какой-то слой, отвечающий за ввод/вывод. Примеры Terminal Emulator: gnome-terminal, xterm, konsole.

Прошу не путать Shell и Terminal Emulator!
Terminal Emulator — GUI приложение, то есть окно в X Windows System. Shell — это command line interpreter, то есть просто исполнитель команд, он не имеет графической оболочки. Если говорить совсем правильно, вы не запускаете Bash, вы запускаете Terminal Emulator, который запускает внутри себя Bash. Terminal Emulator и Bash — абсолютно 2 различные программы. Первая отвечает исключительно за ввод/вывод, вторая — за обработку команд.

Далее в статье все упоминания терминала будут относиться к эмулятору терминала.


Virtual Console (Virtual Terminal)

Нажмите Ctrl+Alt+FN, где N, обычно, имеет значения от 1 до 6. То, что вы сейчас видели — называется Virtual Console (виртуальная консоль) или Virtual Terminal (виртуальный терминал). Помните, что я говорил ранее о терминалах? Множество терминалов были подсоединены к одному компьютеру и каждый терминал был отдельной сессией, независимой от других. Virtual Console повторяет эту идею: внутри вашего компьютера может быть несколько независимых сессий (однако, ресурсы компьютера все же, очевидно, общие).

Вы можете именовать данную сущность как Virtual Console, так и Virtual Terminal, так как по определению, консоль — это терминал, подключенный напрямую к компьютеру, но ведь все виртуальные терминалы в каком-то смысле подключены напрямую к компьютеру.


TTY устройства

Каждому терминалу назначается свое TTY устройство (терминальное устройство), которое обеспечивает работу консоли. Хотя телетайпы вы вряд ли уже найдете, но сокращение TTY дошло и до наших дней.

TTY устройство состоит из двух фундаментальных компонентов:

  1. Драйвер устройства. Он отвечает за доставку ввода с клавиатуры в программу и за отображение вывода программы на экран.
  2. TTY Line Discipline (рус. — дисциплина линии). Дисциплина линии — это интерфейс доступа к драйверу, который, однако, привносит немало в логики в TTY устройство. Можно сказать, что дисциплина линии проксирует вызовы к драйверу. Какова зона ответственности данного компонента, мы будем узнавать по ходу статьи.

Строение TTY устройства:

Hello, World! Глубокое погружение в Терминалы - 4

Существует 3 типа TTY устройств:

  1. Console device — обеспечивает работу Virtual Console. Ввод и вывод данного устройства управляется полностью ядром.
  2. PTY device (псевдотерминал) — обеспечивают работу терминала в оконном интерфейсе. Ввод и вывод данного устройства управляется эмулятором терминала, который работает в пользовательском пространстве.
  3. Serial device — общается напрямую с железом. Обычно не используется напрямую, а существует как самый нижний уровень в организации архитектуры терминального устройства.

В данной статье мы будем говорить именно о втором типе TTY устройств — псевдотерминалах.


TTY Line Discipline

Начнем рассматривать дисциплину линии TTY устройств.

Первой важной особенностью дисциплиной линии является то, что она отвечает за процессинг ввода/вывода. Это включает в себя, например, обработку управляющих символов (см Управляющие символы) и форматирование вывода. Например, вы вводите любой текст, но вдруг понимаете, что ошиблись в написании чего-то и хотите это стереть — именно тут в дело вступает дисциплина линии.

Разберем подробно, что именно происходит, когда мы работаем в Bash, запущенном в терминале. По умолчанию TTY устройство работает в каноничном режиме с включенным эхо (echoing). Эхо — это отображение введенных вами символов на экране.

Когда мы вводим, к примеру, символ a, данный символ посылается в TTY устройство, но перехватывается дисциплиной линии TTY устройства. Она читает символ в свой внутренний буфер, видит, что включен режим echo и выводит символ на экран. В это время еще ничего не доступно для чтения в программе, к которой прикреплено терминальное устройство. Пусть мы нажимаем backspace на клавиатуре. Символ ^? снова перехватывается дисциплиной линии, и последняя, понимая, что пользователь хочет стереть последний введенный символ, удаляет данный символ из своего внутреннего буфера и стирает этот символ также с экрана. Теперь, если мы нажмем Enter, TTY Line Discipline наконец пошлет в буфер чтения терминального устройства все, что было записано раннее в внутренний буфер дисциплины, включая LF. При этом, на экран выводятся символы CR и LF для того, чтобы перевести курсор на новую строку — это форматирование вывода.

Так работает каноничный режим — передает все введенные символы в устройство только после нажатия Enter, производит процессинг управляющих символов и форматирует вывод.

TTY Line Editing

TTY Line Editing — это тот компонент, который отвечает за процессинг ввода в дисциплине линии. Следует сказать, что Line Editing — это общее понятие и относится оно к процессингу ввода. Наппример, Bash и Vim имеют свой Line Editing.

Мы можем контролировать настройки дисциплины линии текущего TTY устройства с помощью программы stty. Давайте немного поэкспериментируем.

Откройте Bash или любой другой Shell и введите:

stty icanon -echo

Теперь попробуйте что-нибудь ввести — и вы не увидите вашего ввода (не беспокойтесь, вы все еще можете передавать ввод в программу). Вы только что отключили эхо — то есть отображение введенных символов на экране. Теперь введите:

stty raw echo

Попробуйте что-нибудь вводить. Вы видите, как нарушается вывод. Но для большего эффекта давайте зайдем в Dash — введите /bin/sh. Теперь попробуйте вводить специальные символы (клавиша Ctrl + любой символ на клавиатуре) или же просто нажать Enter. Вы недоумеваете — что это за странные символы на экране? Дело в том, что мы, зайдя в самый простой Shell, кроме Line Editing самой дисциплины отключили также Line Editing Bash, и теперь можем вовсю наблюдать эффект включения raw режима дисциплины линии. Данный режим совершенно не производит процессинг ввода и не форматирует вывод. Зачем raw режим нужен? Например, для Vim: он открывается во всё окно терминала и производит сам процессинг ввода, хотя бы для того, чтобы специальные символы дисциплины линии не пересекались с специальными символами самого Vim.

Для еще большего понимания давайте рассмотрим кастомизацию управляющих символов. В этом нам поможет команда stty <control-character> <string>.
Введите в Bash:

stty erase 0

Теперь управляющий символ erase будет назначен на символ 0. Кнопка backspace обычно имеет значение ^?, но теперь данный специальный символ будет передаваться в буфер чтения PTS устройства буквально — попробуйте сами. Стирать символы же теперь вы можете с помощью кнопки 0 на клавиатуре, ведь вы сами попросили tty line discipline распозновать введенный символ как управляющий символ erase. Вернуть обратно настройку вы можете с помощью команды stty erase ^? или просто закрытием терминала, ведь мы влияли только на текущее tty устройство.

Больше информации вы сможете найти в man stty.


Terminal Emulator и Pseudoterminal

Каждый раз, когда мы открываем новый терминал в X Window System, GNOME Terminal Server порождает новый процесс и запускает в нём выбранную по-умолчанию программу. Обычно, это какой-то Shell (например, Bash).

Общение с запущенной программой происходит через так называемый Pseudoterminal (псевдотерминал, PTY). Сам псевдотерминал существует в ядре, однако ввод получает из пользовательского пространства — из эмулятора терминала.

Псевдотерминал состоит из следующих двух виртуальных TTY устройств:
1) PTY master (PTM) — ведущая часть псевдотерминала. Используется GNOME Terminal Server для передачи ввода с клавиатуры в запущенную внутри терминала программу, а также для чтения вывода программы и отображения вывода на дисплей. GNOME Terminal Server в свою очередь общается с X Window System по X протоколу.
2) PTY slave (PTS) — ведомая часть псевдотерминала. Используется программой, запущенной внутри терминала, для чтения ввода с клавиатуры и отображения вывода на экран. По крайней мере, так думает сама программа (объясню, что это значит, чуть далее).

Любые данные, записанные в PTS устройство, являются вводом PTM устройства, то есть становятся доступны для чтения на PTM устройстве. И наоборот: любые данные, записанные в PTM устройство, являются вводом PTS устройства. Именно таким образом и происходит общение GNOME Terminal Server и запущенной внутри терминала программы. Каждому PTM устройству сопоставляется свое PTS устройство.

Процесс запуска нового терминала выглядит примерно следующим образом:
1) GNOME Terminal Server создает master и slave устройства с помощью вызова функции open() на специальном устройстве /dev/ptmx. Вызов open() возвращает файловый дескриптор созданного PTM устройства — master_fd.
2) GNOME Terminal Server создает новый процесс с помощью вызова функции fork(). Данный процесс и будет являться новым терминалом.
3) В терминале PTS устройство открывается на файловых дескрипторах 0, 1, 2 (stdin, stdout и stderr соответственно). Теперь стандартные потоки ввода/вывода терминала ведут на данное устройство.
4) В терминале запускается нужная программа с помощью вызова функции exec(). Обычно запускается какой-то Shell (например, Bash). Любая программа, запущенная впоследствии из Bash, будет иметь те же файловые дескрипторы, что и сам Bash, то есть потоки программы будут направлены на PTS устройство.

Вы можете сами посмотреть, куда направлены стандартные потоки вывода терминала, с помощью команды ls -la /proc/self/fd:
Hello, World! Глубокое погружение в Терминалы - 5

PTS устройство находится по пути /dev/pts/N, а путь к PTM устройству нас абсолютно не интересует. Дело в том, что GNOME Terminal Server уже имеет файловый дескриптор открытого PTM устройства и ему не требуется путь к нему, однако в дочернем процессе мы должны открыть PTS устройство на стандартных потоках вывода с помощью вызова функции open(), которая требует путь к файлу.

Помните, я сказал, что программа, использующая PTS устройство, только думает, что она общается напрямую с терминалом? Дело в том, что PTS также является терминальным устройством (TTY устройством), но разница между PTS устройством и действительным TTY устройством в том, что PTS устройство ввод получает не с клавиатуры, а с master устройства, а вывод идет не на дисплей, а на master устройство. Именно поэтому псевдотерминал назван так — псевдотерминал лишь имитирует (опять??) терминал. Разница между эмулятором терминала и псевдотерминалом в том, что эмулятор терминала — это лишь графическая программа, позволяющая запускать терминал прямо внутри оконного интерфейса, но реализована эта возможность с помощью псевдотерминала.

То, что PTS устройство является TTY устройством — это очень важно. Вот почему:

  1. Программе, к которой прикреплено терминальное устройство, доступны все возможности обычного терминала. Например: отключение эха, отключение/включение каноничного вида.
  2. Программа, зная, что к ней прикреплен терминальное устройство (говорится, что программа имеет управляющий терминал), может работать в интерактивном режиме и просить у пользователя ввода. Например, спрашивать логин и пароль.
  3. Здесь также существует TTY Line Discipline, поэтому мы имеем возможность обрабатывать управляющие символы до того, как они дойдут до программы, а также форматировать вывод программы.

PTM устройство также является TTY устройством, но это не играет никакой роли, так как оно не используется в роли управляющего терминала. Более того, дисциплина линии PTM устройства установлена в raw режим, поэтому процессинг при передаче данных от PTS к PTM устройству не производится. Однако, вызовы read() и write() из пользовательского пространства все равно сперва обслуживаются дисциплиной линии на обоих устройствах. Данный момент сыграет еще большую роль, как мы увидим позднее.

Процесс общения GNOME Terminal Server и запущенной внутри терминала программы выглядит следующим образом:

Hello, World! Глубокое погружение в Терминалы - 6

Здесь следует поподробнее рассмотреть роль, которую играет дисциплина линии при общении между обеими частями псевдотерминала. Здесь дисциплина линии отвечает за процессинг данных, переходящих от PTM к PTS устройству, а также за доставку данных из одной части псевдотерминала в другую. Когда мы находимся в драйвере PTS устройства, мы задействуем дисциплину линии PTM устройства, и наоборот.


Виртуальные устройства

Вы, наверное, могли подумать, что можете открыть файл по пути /dev/pts/N и писать или читать данные из него, как из обычного текстового файла? Да, все устройства в Unix-подобных системах являются файлами благодаря фундаментальному принципу Unix, который гласит, что все является файлом. Однако, никакие специальные файлы устройств (англ. — device file) не являются текстовыми файлами. Такие устройства называются виртуальными устройствами (virtual device) — то есть существуют исключительно в памяти, а не на диске.

Не стоит пытаться открывать данные файлы как обычные текстовые файлы. Однако, вы можете использовать эти устройства через операции write() и read(), вызов которых обслужит драйвер устройства. Давайте попробуем сделать это.

Откройте два окна терминала и введите в каждом команду tty. Данная команда покажет, какое TTY устройство обслуживает текущий активный терминал. Теперь введите echo "Hello, World!" > /dev/pts/N в первом окне терминала, где N — это индекс PTS устройства второго окна, переключитесь на второе окно — и вы увидите ваш ввод с первого окна. Сейчас вы записали данные в PTS устройство второго окна так, как будто бы это сделала программа, работающая в том терминале.

Hello, World! Глубокое погружение в Терминалы - 7


Устройство псевдотерминала

Мы все ближе приближаемся к заключительной части статьи, но перед этим заглянем "под капот" Linux — рассмотрим устройство псевдотерминала на уровне ядра. Будет много кода, но я постараюсь объяснять каждый приведенный блок кода максимально подробно, сокращать неважные детали и идти последовательно.

Перед началом введем так называемую "корзину компонентов". По мере продвижения по ядру, мы будет добавлять в нее всё больше компонентов и находить связь между ними. Надеюсь, это еще лучше поможет понять устройство псевдотерминала. Приступим.

Когда Linux запускается, он загружает необходимые драйверы устройств. Такой драйвер имеется и у нашего псевдотерминала. Его регистрация начинается с вызова данной функции:

static int __init pty_init(void)
{
    legacy_pty_init();
    unix98_pty_init(); // <- то, что нас интересует
    return 0;
}
device_initcall(pty_init); // сообщает, какую функцию вызывать при регистрации драйвера

Для всех современных систем будет вызвана функция unix98_pty_init():

static void __init unix98_pty_init(void)
{
    ptm_driver = tty_alloc_driver(NR_UNIX98_PTY_MAX,
            TTY_DRIVER_RESET_TERMIOS |
            TTY_DRIVER_REAL_RAW |
            TTY_DRIVER_DYNAMIC_DEV |
            TTY_DRIVER_DEVPTS_MEM |
            TTY_DRIVER_DYNAMIC_ALLOC);
    if (IS_ERR(ptm_driver))
        panic("Couldn't allocate Unix98 ptm driver");
    pts_driver = tty_alloc_driver(NR_UNIX98_PTY_MAX,
            TTY_DRIVER_RESET_TERMIOS |
            TTY_DRIVER_REAL_RAW |
            TTY_DRIVER_DYNAMIC_DEV |
            TTY_DRIVER_DEVPTS_MEM |
            TTY_DRIVER_DYNAMIC_ALLOC);
    if (IS_ERR(pts_driver))
        panic("Couldn't allocate Unix98 pts driver");

    ptm_driver->driver_name = "pty_master";
    ptm_driver->name = "ptm";
    ptm_driver->major = UNIX98_PTY_MASTER_MAJOR;
    ptm_driver->minor_start = 0;
    ptm_driver->type = TTY_DRIVER_TYPE_PTY;
    ptm_driver->subtype = PTY_TYPE_MASTER;
    ptm_driver->init_termios = tty_std_termios;
    ptm_driver->init_termios.c_iflag = 0;
    ptm_driver->init_termios.c_oflag = 0;
    ptm_driver->init_termios.c_cflag = B38400 | CS8 | CREAD;
    ptm_driver->init_termios.c_lflag = 0;
    ptm_driver->init_termios.c_ispeed = 38400;
    ptm_driver->init_termios.c_ospeed = 38400;
    ptm_driver->other = pts_driver;
    tty_set_operations(ptm_driver, &ptm_unix98_ops);

    pts_driver->driver_name = "pty_slave";
    pts_driver->name = "pts";
    pts_driver->major = UNIX98_PTY_SLAVE_MAJOR;
    pts_driver->minor_start = 0;
    pts_driver->type = TTY_DRIVER_TYPE_PTY;
    pts_driver->subtype = PTY_TYPE_SLAVE;
    pts_driver->init_termios = tty_std_termios;
    pts_driver->init_termios.c_cflag = B38400 | CS8 | CREAD;
    pts_driver->init_termios.c_ispeed = 38400;
    pts_driver->init_termios.c_ospeed = 38400;
    pts_driver->other = ptm_driver;
    tty_set_operations(pts_driver, &pty_unix98_ops);

    if (tty_register_driver(ptm_driver))
        panic("Couldn't register Unix98 ptm driver");
    if (tty_register_driver(pts_driver))
        panic("Couldn't register Unix98 pts driver");

    /* Now create the /dev/ptmx special device */
    tty_default_fops(&ptmx_fops);
    ptmx_fops.open = ptmx_open;

    cdev_init(&ptmx_cdev, &ptmx_fops);
    if (cdev_add(&ptmx_cdev, MKDEV(TTYAUX_MAJOR, 2), 1) ||
        register_chrdev_region(MKDEV(TTYAUX_MAJOR, 2), 1, "/dev/ptmx") < 0)
        panic("Couldn't register /dev/ptmx driver");
    device_create(tty_class, NULL, MKDEV(TTYAUX_MAJOR, 2), NULL, "ptmx");

Здесь нас интересует 3 вещи:

  1. Вызовы tty_set_operatons для драйвера pty master и pty slave устройств.
  2. Функция ptmx_open, которая отвечает за создание обоих частей псевдотерминала при открытии специального устройства /dev/ptmx. Важно: /dev/ptmx — это не PTM устройство, а всего лишь интерфейс для создания нового псевдотерминала.
  3. Регистрация драйвера PTM и PTS устройств.

Пойдем по порядку:

1. tty_set_operations

Функция tty_set_operations() всего лишь устанавливает таблицу функций для текущего драйвера:

void tty_set_operations(struct tty_driver *driver,
            const struct tty_operations *op)
{
    driver->ops = op;
};

Структура tty_operations — это таблица функций, которая используется для доступа к функциям драйвера TTY устройства.

Выделю самое главное в структурах pty_unix98_ops и ptm_unix98_ops, которые являются таблицей функций для соответствующих частей псевдотерминала:

static const struct tty_operations ptm_unix98_ops = {
    .install = pty_unix98_install,
    .remove = pty_unix98_remove,
    .open = pty_open,
    .close = pty_close,
    .write = pty_write,
    // ...
};

static const struct tty_operations pty_unix98_ops = {
    .install = pty_unix98_install,
    .remove = pty_unix98_remove,
    .open = pty_open,
    .close = pty_close,
    .write = pty_write,
    // ...
};

Здесь можете наблюдать уже знакомую по статье о Сишном printf функцию pty_write — к ней мы вернемся чуть позднее.

Давайте добавим данную структуру в нашу корзину компонентов:
Hello, World! Глубокое погружение в Терминалы - 8

Как видите, основные методы обоих драйверов совсем не отличаются. Кстати, заметьте, что отсутствует функция для read() операции — нет ничего похожего на pty_read(). Дело в том, что чтение будет обслуживаться исключительно дисциплиной линии. Таким образом, мы узнаём о второй важной особенности дисциплины линии — чтение данных с TTY утройства.


2. ptmx_open

Теперь перейдем к ptmx_open():

static int ptmx_open(struct inode *inode, struct file *filp)
{
    struct tty_struct *tty; // запомните эту структуру - она очень важна!
    fsi = devpts_acquire(filp); // получаем виртуальную файловую систему devpts

    index = devpts_new_index(fsi); // получаем индекс для нового устройства в /dev/pts
    // ...
    tty = tty_init_dev(ptm_driver, index);
    // ...
    devpts_pty_new(fsi, index, tty->link); // создаём новый файл в /dev/pts

    retval = ptm_driver->ops->open(tty, filp); // открываем PTM устройство, ничего особенного
}

Нас интересует функция tty_init_dev(), где первым аргументом является драйвер PTM устройства, а вторым — индекс устройства. Здесь мы покидаем зону ответственности PTY драйвера и переходим к файлу, который отвечает только за общие TTY устройства и ничего не знает о нашем псевдотерминале.

struct tty_struct *tty_init_dev(struct tty_driver *driver, int idx)
{
    struct tty_struct *tty;
    tty = alloc_tty_struct(driver, idx);

    retval = tty_driver_install_tty(driver, tty);

    /*
     * Structures all installed ... call the ldisc open routines.
     */
    retval = tty_ldisc_setup(tty, tty->link); // ничего необычного, просто открывает дисциплину линии обоих устройств

    return tty;
}

Сначала разберем функцию alloc_tty_struct():

struct tty_struct *alloc_tty_struct(struct tty_driver *driver, int idx)
{
    struct tty_struct *tty;

    tty = kzalloc(sizeof(*tty), GFP_KERNEL); // создаем tty_struct

    tty_ldisc_init(tty) // создает дисциплину линии для текущей tty_struct

    tty->driver = driver; // устанавливает ссылку на драйвер в текущей tty_struct
    tty->ops = driver->ops;  // устанавливает ссылку на операции драйвера в текущей tty_struct. Сделано просто для удобства
    tty->index = idx; // устанавливает индекс tty устройства

    return tty;
}

Единственное, что нас здесь интересует, это функция tty_ldisc_init():

int tty_ldisc_init(struct tty_struct *tty)
{
    struct tty_ldisc *ld = tty_ldisc_get(tty, N_TTY);
    if (IS_ERR(ld))
        return PTR_ERR(ld);
    tty->ldisc = ld; // устанавливает ссылку на дисциплину линии в текущей tty_struct
    return 0;
}

Которая вызывает tty_ldisc_get():

static struct tty_ldisc *tty_ldisc_get(struct tty_struct *tty, int disc)
{
    struct tty_ldisc *ld; // структура дисциплины линии
    struct tty_ldisc_ops *ldops; // таблица функций дисциплины линии

    ldops = get_ldops(disc); // получает операции для выбранной дисциплины линии. Дело в том, что дисциплины линии могут быть разного типа. Наш тип - N_TTY

    ld = kmalloc(sizeof(struct tty_ldisc), GFP_KERNEL | __GFP_NOFAIL);
    ld->ops = ldops; // устанавливает таблицу функций для текущей дисциплины
    ld->tty = tty; // устанавливает ссылку на tty_struct в текущей дисциплине. Это требуется для доступа к драйверу устройства из дисциплины

    return ld;
}

Итак, мы рассмотрели вызов функции alloc_tty_struct(), которая создает структуру tty_struct вместе с дисциплиной линии — структурой tty_ldisc. Обе структуры имеют ссылки друг на друга. Давайте познакомимся с данными структурами поближе.

  • tty_struct — это структура для доступа к драйверу TTY устройства и некоторым другим полям. Выглядит она следующим образом:

struct tty_struct {
    struct tty_driver *driver; // драйвер TTY устройства
    const struct tty_operations *ops; // операции драйвера. Это то же самое, что и driver->ops, то есть сделано просто для удобства
    int index; // индекс устройства
    struct tty_ldisc *ldisc; // указатель на дисциплину линии
    struct tty_struct *link; // указатель на другую часть PTY
    // ...
}

  • tty_ldisc — это структура для дисциплины линии TTY устройства. Состоит она всего из двух полей и выглядит следующим образом:

struct tty_ldisc {
    struct tty_ldisc_ops *ops; // таблица функций дисциплины
    struct tty_struct *tty; // указатель на tty_struct текущей дисциплины. Используется для доступа к драйверу устройства
};

Вроде бы ничего сложного? Давайте добавим все рассмотренные до этого момента структуры в нашу корзину и свяжем их таким же образом, как они связаны в коде:
Строение tty_struct

Но мы создали tty_struct всего лишь для PTM устройства. А что же о PTS устройстве? Для этого вернемся к функции tty_init_dev() и вспомним о том, что дальше нас ожидает вызов функции tty_driver_install_tty():

/**
 * This method is responsible
 * for ensuring any need additional structures are allocated and configured. 
*/
static int tty_driver_install_tty(struct tty_driver *driver,
                        struct tty_struct *tty)
{
    return driver->ops->install ? driver->ops->install(driver, tty) :
        tty_standard_install(driver, tty);
}

Комментарий подсказывает нам, что данный метод ответственен за создание различных дополнительных структур. PTS устройство и будет являться нашей дополнительной структурой. Признаюсь, это было для меня крайне удивительно, ибо это, черт возьми, целое устройство, а не просто какая-то дополнительная структура! Но мы то с вами понимаем, что все устройства — это всего лишь какие-то структуры, так что идем дальше. Хорошо, что такое здесь driver->ops->install? Для этого посмотрим на таблицу функций для PTM драйвера ещё раз:

static const struct tty_operations ptm_unix98_ops = {
    .install = pty_unix98_install,
    // ...

И поймем, что нас интересует функция pty_unix98_install():

static int pty_unix98_install(struct tty_driver *driver, struct tty_struct *tty)
{
    return pty_common_install(driver, tty, false);
}

Которая вызывает функцию pty_common_install():

static int pty_common_install(struct tty_driver *driver, struct tty_struct *tty,
        bool legacy)
{
    struct tty_struct *o_tty; // tty_struct для другой части PTY - то есть для PTS устройства

    // а здесь мы проверяем, для какого устройства была вызвана функция install. Дело в том, что для PTM устройства мы уже создали tty_struct, и нам не надо делать это снова
    if (driver->subtype != PTY_TYPE_MASTER) 
        return -EIO;

    o_tty = alloc_tty_struct(driver->other, idx);

    tty->link   = o_tty;
    o_tty->link = tty;
}

Мы видим, что для PTS устройства создается абсолютно такая же структура tty_struct за исключением того, что в ней будет находиться драйвер PTS устройства. Обе структуры хранят указатели друг на друга для общения между собой. Добавляем tty_struct для PTS устройства в нашу корзину.


Регистрация драйвера

Мы не будем рассматривать весь процесс регистрации драйвера, так как нас интересует только установка таблицы функций для файла TTY устройства (ведь мы должны как-то получить доступ к самому устройству при работе с файлом?).
Это — таблица функций, которая будет установлена для файла как PTM, так и PTS устройства:

static const struct file_operations tty_fops = {
    .llseek     = no_llseek,
    .read       = tty_read,
    .write      = tty_write,
    .poll       = tty_poll,
    .unlocked_ioctl = tty_ioctl,
    .compat_ioctl   = tty_compat_ioctl,
    .open       = tty_open,
    .release    = tty_release,
    .fasync     = tty_fasync,
    .show_fdinfo    = tty_show_fdinfo,
};

Мы не будем добавлять данную структуру в нашу корзину, ибо она в принципе то и не относится к устройству псевдотерминалов и служит лишь для доступа к TTY устройству.


Готово. Мы рассмотрели процесс создания обоих устройств, который будет произведен при открытии мультиплексора /dev/ptmx. Таким образом, включая второе PTS устройство, которое имеет точно такое же строение, как и PTM устройство, общая картина строения псевдотерминала складывается следующая:

Hello, World! Глубокое погружение в Терминалы - 10


Hello, World!

Ну вот мы и подошли к самому главному. В данной главе мы полностью разберем путь нашей строки "Hello, World!", отправленной из простой Си программы в терминальное устройство.

#include <stdio.h>

void main() {
    printf("Hello, World!n");
}

Итак, наша строка "Hello, World!" отправляется в увлекательное путешествие. На самом деле, программа не знает ничего, кроме того, что она пишет в стандартный поток вывода. Ей больше нет разницы, куда этот вывод пойдет. Направьте stdout в /dev/null — и вывод вообще не будет нигде отображаться. Здесь я не буду рассказывать о вызовах библиотечных Си функций, а начнем сразу с файловой системы Linux.

Так как каждое устройство в Unix является файлом с определенными для него функциями write(), read(), close() и прочими, то при вызове write() на /dev/pts/0 мы попадаем в общую для всех файлов функцию __vfs_write():

ssize_t __vfs_write(struct file *file, const char __user *buf, size_t count, loff_t *pos)
{
    ssize_t ret;

    //...
    ret = file->f_op->write(file, buf, count, pos);
    //...

  return ret;
}

Здесь мы вызываем операцию write() из таблицы функций для текущего файла. Как вы помните, таблица функций была установлена при регистрации драйвера и выглядела она следующим образом:

static const struct file_operations tty_fops = {
    // ...
    .write = tty_write,
    // ...

Функция tty_write():

static ssize_t tty_write(struct file *file, const char __user *buf,
                        size_t count, loff_t *ppos)
{
    struct tty_struct *tty = file_tty(file);
    struct tty_ldisc *ld;
    ssize_t ret;

    ld = tty_ldisc_ref_wait(tty);
    ret = do_tty_write(ld->ops->write, tty, file, buf, count);
    tty_ldisc_deref(ld);
    return ret;
}

Данная функция получает структуру tty_struct для текущего файла TTY устройства, а потом достает из нее дисциплину линии и вызывает функцию write() для нее. Таблица функций дисциплины линии выглядела следующим образом:

static struct tty_ldisc_ops n_tty_ops = {
    .write           = n_tty_write,
    // ...
};

Переходим к функции n_tty_write():

/**
 *  n_tty_write     -   write function for tty
 *  @tty: tty device
 *  @file: file object
 *  @buf: userspace buffer pointer
 *  @nr: size of I/O
 */
static ssize_t n_tty_write(struct tty_struct *tty, struct file *file,
               const unsigned char *buf, size_t nr)
{
    const unsigned char *b = buf; // b - буфер, в котором и содержится наша строка "Hello, World!". Это всего лишь указатель на буфер в пользовательском пространстве
    int c; // количество записанных символов

    // пишем все символы в PTS устройство, пока write() функция не вернет 0, обозначая то, что буфер записан полностью
    while (nr > 0) {
        c = tty->ops->write(tty, b, nr); // вызываем write() функцию из таблицы функций для драйвера TTY устройства
        if (!c)
            break;
        b += c; // двигаем указатель в буфере
        nr -= c; // вычисляем количество оставшихся для записи символов: общее кол-во символов - записанное кол-во символов
    }
}

Итак, строка "Hello, World!" наконец отправилась в write() функцию драйвера PTS устройства. Найдем эту функцию в таблице функций драйвера:

static const struct tty_operations pty_unix98_ops = {
    .write = pty_write,
        // ...
}

Функция pty_write():

static int pty_write(struct tty_struct *tty, const unsigned char *buf, int c)
{
  struct tty_struct *to = tty->link; // получаем ссылку на другую сторону PTY. В нашем случае - это PTM устройство

  if (c > 0) {
    // передаем данные на PTM устройство
    c = tty_insert_flip_string(to->port, buf, c);
    // уведомить другую сторону о том, что готовы новые данные для чтения
    if (c) { 
      tty_flip_buffer_push(to->port);
      tty_wakeup(tty);
    }
  }
  return c;
}

Давайте здесь остановимся и проследим наш путь до этого места:

        __vfs_write() -> // 1-й уровень: файловая система
                tty_write() ->
                        do_tty_write() ->
                                n_tty_write() -> // 2-й уровень: дисциплина линии
                                        pty_write() // 3-й уровень: драйвер

Вроде бы ничего не упустили. Итак, буфер передается в очередь ввода на PTM устройство. Разберемся, как именно это происходит.

Для начала, следует познакомить вас с новой структурой данных под названием flip buffer. Flip buffer — это структура данных, состоящая из двух массивов. Когда tty driver получает новые данные, он сохраняет их в первом массиве. Когда массив заполняется, ожидающая данных сторона будет об этом уведомлена и сможет прочитать данные из этого массива. Если в будущем появятся новые данные, они сохранятся уже во второй массив для того, чтобы не перезаписать читающиеся другой стороной данные. Когда и этот массив заполняется, ожидающая данных сторона снова будет уведомлена, а новые данные в следующий раз будут снова записываться в первый массив. Именно из-за такой логики данная структура данных и названа flip buffer — потому что данные перемещаются между массивами (наверное, здесь лучше подойдет какое-то другое слово, но я не знаю хорошего перевода для слова flip).

Не будем долго тянуть и снова идти по цепочке вызовов, так что сразу перейдем к нужной функции. Вызов tty_insert_flip_string() в итоге перетекает в вызов функции под названием tty_insert_flip_string_fixed_flag(), в которой и происходит основная работа по передаче данных в PTM устройство:

int tty_insert_flip_string_fixed_flag(struct tty_port *port,
        const unsigned char *chars, char flag, size_t size)
{
    int copied = 0;
    do {
        int goal = min_t(size_t, size - copied, TTY_BUFFER_PAGE); // сколько данных нам требуется записать
        int space = __tty_buffer_request_room(port, goal, flags); // сколько места в буфере
        struct tty_buffer *tb = port->buf.tail; // получаем указатель на текущий активный массив
        if (unlikely(space == 0))
            break;
        memcpy(char_buf_ptr(tb, tb->used), chars, space); // копируем данные в данный массив
        tb->used += space;
        copied += space;
        chars += space;
        /* There is a small chance that we need to split the data over
           several buffers. If this is the case we must loop */
    } while (unlikely(size > copied));
    return copied;
}

На самом деле, flip buffer был замёнен новой имплементацией в новых версиях ядра, однако поведение буфера осталось почти таким же, а все функции остались совместимы с раннее реализованными драйверами. Не стоит сильно вникать в устройство данного буфера, ясно одно — в конце концов данные будут перемещены в PTM устройство, а после окончания записи ожидающая сторона будет уведомлена о готовых для чтения данных.

Итак, наша строка "Hello, World!" оказалась в PTM устройстве. В это время GNOME Terminal Server заблокирован на вызове poll() (техника мультиплексирования I/O) и ожидает новых данных на любом из master устройств. Вы думаете, сейчас он проснется и прочитает новые данные на устройстве? Как бы не так. Когда я говорил об ожидающей стороне, я говорил о дисциплине линии, ведь это именно её задача — принимать ввод и производить его процессинг при необходимости.

Дисциплина линии будет уведомлена о новых данных с помощью вызова функции tty_flip_buffer_push() (в том же pty_write):

/**
 *  tty_flip_buffer_push    -   terminal
 *  @port: tty port to push
 *
 *  Queue a push of the terminal flip buffers to the line discipline.
 *  Can be called from IRQ/atomic context.
 *
 *  In the event of the queue being busy for flipping the work will be
 *  held off and retried later.
 */

void tty_flip_buffer_push(struct tty_port *port)
{
    tty_schedule_flip(port);
}

Функция tty_schedule_flip(), в свою очередь, планирует задачу по доставке данных в дисциплину линии:

/**
 *  tty_schedule_flip   -   push characters to ldisc
 *  @port: tty port to push from
 *
 *  Takes any pending buffers and transfers their ownership to the
 *  ldisc side of the queue. It then schedules those characters for
 *  processing by the line discipline.
 */

void tty_schedule_flip(struct tty_port *port)
{
    struct tty_bufhead *buf = &port->buf;

    /* paired w/ acquire in flush_to_ldisc(); ensures
     * flush_to_ldisc() sees buffer data.
     */
    smp_store_release(&buf->tail->commit, buf->tail->used);
    queue_work(system_unbound_wq, &buf->work);
}

Я не знаю, что здесь подразумевается под work (предположу, что это какая-то внутренняя структура ядра для планировки различных задач) и какой компонент ядра отвечает за планировку, но из комментариев ясно следующее — когда задача начнет выполняться, доставку организует функция flush_to_ldisc():

static void flush_to_ldisc(struct work_struct *work)
{
    struct tty_port *port = container_of(work, struct tty_port, buf.work); // получаем структуру tty_port PTM устройства. tty_port - это просто способ доступа к буферу TTY устройства
    struct tty_bufhead *buf = &port->buf;
    struct tty_buffer *head = buf->head;
    // ...
    receive_buf(port, head);
    // ...
}

Функция receive_buf() через цепочку вызовов в итоге перетекает в вызов функции __receive_buf(), которая диспатчит работу по процессингу ввода:

static void __receive_buf(struct tty_struct *tty, const unsigned char *cp,
              char *fp, int count)
{
    struct n_tty_data *ldata = tty->disc_data;
    bool preops = I_ISTRIP(tty) || (I_IUCLC(tty) && L_IEXTEN(tty));

    if (ldata->real_raw)
        n_tty_receive_buf_real_raw(tty, cp, fp, count);
    else if (ldata->raw || (L_EXTPROC(tty) && !preops))
        n_tty_receive_buf_raw(tty, cp, fp, count);
    else if (tty->closing && !L_EXTPROC(tty))
        n_tty_receive_buf_closing(tty, cp, fp, count);
    else {
        if (ldata->lnext) {
            char flag = TTY_NORMAL;

            if (fp)
                flag = *fp++;
            n_tty_receive_char_lnext(tty, *cp++, flag);
            count--;
        }

        if (!preops && !I_PARMRK(tty))
            n_tty_receive_buf_fast(tty, cp, fp, count);
        else
            n_tty_receive_buf_standard(tty, cp, fp, count);
    }

    if (read_cnt(ldata)) {
        kill_fasync(&tty->fasync, SIGIO, POLL_IN);
        wake_up_interruptible_poll(&tty->read_wait, EPOLLIN);
    }
}

Все функции, начинающиеся с n_tty_receive_buf (кроме тех, где есть суффикс _raw) производят процессинг данных и записывают данные в буфер под названием read_buf, который и является основным буфером для чтения с TTY устройства. Так как дисциплина линии для PTM устройства установлена в raw режим, то процессинг не будет произведен и данные сразу запишутся в read_buf. Однако, если бы мы разбирали доставку данных от PTM к PTS устройству, то процессинг был бы произведен.

Опишу полную цепочку вызовов до конечного вызова, включая пропущенные вызовы:

    ...
        pty_write() -> // 3-й уровень: драйвер PTS устройства
                tty_insert_flip_string + tty_flip_buffer_push() ->
                        tty_schedule_flip() ->
            --- // переходим в пространство PTM устройства
                flush_to_ldisc() -> // 2-й уровень: дисциплина линии PTM устройства
                        receive_buf() ->
                                n_tty_receive_buf ->
                                        n_tty_receive_buf_common ->
                                                __receive_buf()

Заметьте, никакая функция PTM драйвера при перемещении данных не была использована — вся работа произошла в дисциплине линии и драйвере PTS устройства.

Можете выдохнуть: данные наконец записаны в конечный буфер PTM устройства. Теперь GNOME Terminal Server просыпается и читает нашу строку "Hello, World!", вызывая read() на PTM устройстве. Вызов read() по аналогии с write() перехватывается дисциплиной линии — методом n_tty_read(). В этой функции нет ничего интересного, кроме того, что она просто переместит данные из буфера в ядре — read_buf — в пользовательский буфер. Далее GNOME Terminal Server передает строку в X Server, который отобразит её на дисплей.

Таким образом, наша строчка "Hello, World!" проходит следующий путь:

Программа -> 
        PTY slave -> 
                PTM master -> 
                        GNOME-TERMINAl-SERVER -> 
                                X Server ->
                                        -> Дисплей


Заключение

Подведем итог. В данной статье мы узнали:

  1. Как работают эмуляторы терминалов
  2. Что такое виртуальные устройства
  3. Что такое TTY устройства
  4. Как устроены псевдотерминалы
  5. Какой путь проходят данные, начиная с обычной Си программы и до дисплея

На этом все, спасибо за внимание! Если у вас возникли какие-нибудь вопросы — смело задавайте их в комментариях, буду рад ответить!

Источники

Автор: Дмитрий

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js