Як почати використовувати User Mode у Linux

Вступ від перекладача: На тлі масового входу в наше життя різноманітних контейнерів може бути досить цікаво та корисно дізнатися, з яких технологій це все починалося колись. Деякі з них можна з користю застосовувати і донині, але не всі про такі способи пам'ятають (або знають, якщо не застали під час бурхливого розвитку). Однією з таких технологій є User Mode Linux. Автор оригіналу добряче покопалася, розбираючись, що зі старих напрацювань ще працює, а що вже не дуже, і зібрала щось на кшталт покрокової інструкції про те, як собі завести доморощений UML в 2к19. І так, ми запросили на Хабр автора оригінального посту Cadey, Тож якщо є питання - задавайте англійською в коментарях.

Як почати використовувати User Mode у Linux

User Mode в Linux - це, фактично, порт ядра Linux на себе. Цей режим дозволяє запустити повноцінне ядро ​​Linux в якості процесу користувача і зазвичай використовується розробниками для тестування драйверів. Але також цей режим корисний і як інструмент загальної ізоляції, принцип якої схожий на роботу віртуальних машин. Цей режим забезпечує більшу ізоляцію, ніж Docker, але меншу, ніж повноцінна віртуальна машина на кшталт KVM або Virtual Box.

В цілому, User Mode може здатися дивним і складним у використанні інструментом, але в нього все ж таки є свої сфери застосування. Адже це повноцінне Linux-ядро, яке працює від непривілейованого користувача. Ця особливість дозволяє запускати потенційно ненадійний код без будь-яких загроз для хост-машини. А оскільки це повноцінне ядро, його процеси ізольовані від хост-машини, тобто процеси, що працюють усередині User Mode, не будуть видно для хоста. Це не схоже на звичний Docker-контейнер, у разі якого хост-машина завжди бачить процеси усередині сховища. Подивіться цей шматок pstree з одного з моїх серверів:

containerd─┬─containerd-shim─┬─tini─┬─dnsd───19*[{dnsd}]
           │                 │      └─s6-svscan───s6-supervise
           │                 └─10*[{containerd-shim}]
           ├─containerd-shim─┬─tini─┬─aerial───21*[{aerial}]
           │                 │      └─s6-svscan───s6-supervise
           │                 └─10*[{containerd-shim}]
           ├─containerd-shim─┬─tini─┬─s6-svscan───s6-supervise
           │                 │      └─surl
           │                 └─9*[{containerd-shim}]
           ├─containerd-shim─┬─tini─┬─h───13*[{h}]
           │                 │      └─s6-svscan───s6-supervise
           │                 └─10*[{containerd-shim}]
           ├─containerd-shim─┬─goproxy───14*[{goproxy}]
           │                 └─9*[{containerd-shim}]
           └─32*[{containerd}]

І порівняйте це з pstree ядра Linux у User Mode:

linux─┬─5*[linux]
      └─slirp

При роботі з Docker-контейнерами я можу бачити з хоста імена процесів, запущених у гостьовій системі. З Linux User Mode це неможливо. Що це означає? Це означає, що інструменти моніторингу, які працюють через підсистему аудиту Linux (Linux's auditing subsystem) не бачать процеси, що виконуються у гостьовій системі. Але в деяких ситуаціях ця особливість може стати ціпком про два кінці.

Взагалі весь пост нижче - це набір досліджень і грубих спроб досягти бажаного результату. Для цього мені доводилося використовувати різні стародавні інструменти, читати вихідні джерела ядра, займатися інтенсивним налагодженням коду, написаного в часи, коли я ще ходила до початкової школи, а також колупатися в збірках Heroku за допомогою спеціального бінара в пошуках потрібних мені інструментів. Вся ця робота призвела до того, що хлопці в моєму IRC почали називати мене чарівницею (magic). Я сподіваюся, що ця посада послужить комусь надійною документацією для того, щоб провернути все те саме, але вже з новішими ядрами та версіями ОС.

Налаштування

Налаштування Linux User Mode виконується в кілька етапів:

  • встановлення залежностей на хості;
  • скачування ядра Linux;
  • налаштування збирання ядра;
  • збирання ядра;
  • інсталяція бінарника;
  • налаштування гостьової файлової системи;
  • підбір параметрів запуску ядра;
  • налаштування гостьової мережі;
  • запуск гостьового ядра.

Я припускаю, що якщо ви вирішите самостійно це все провернути, швидше за все, робитимете все описане в будь-якій Ubuntu або Debian-подібній системі. Я намагалася реалізувати все вищеописане в моєму улюбленому дистрибутиві - Alpine, але нічого не вийшло, мабуть, тому, що ядро ​​Linux має жорстку прив'язку по glibc-isms для драйверів в User Mode. Планую повідомити це в апстрім після того, як остаточно розберуся в проблемі.

Встановлення залежностей на хості

Ubuntu вимагає, як мінімум, наступні пакети для збирання ядра Linux (за умови чистої установки):

- 'build-essential'
- 'flex'
- 'bison'
- 'xz-utils'
- 'wget'
- 'ca-certificates'
- 'bc'
- 'linux-headers'

Ви можете встановити їх за допомогою наступної команди (з правами root або sudo):

apt-get -y install build-essential flex bison xz-utils wget ca-certificates bc 
                   linux-headers-$(uname -r)

Зверніть увагу, що запуск програми налаштування меню для ядра Linux вимагатиме встановлення libncurses-dev. Будь ласка, переконайтеся, що його встановлено за допомогою наступної команди (з правами root або за допомогою sudo):

apt-get -y install libncurses-dev

Завантаження ядра

Визначте місце для завантаження та подальшого збирання ядра. Для цієї операції вам потрібно буде виділити близько 1,3 Гб простору на жорсткому диску, тому переконайтеся, що він є.

Після перейдіть на kernel.org і отримайте URL для завантаження останньої стабільної версії ядра. На момент написання посту це: https://cdn.kernel.org/pub/linux/kernel/v5.x/linux-5.1.16.tar.xz

Завантажте цей файл за допомогою 'wget':

wget https://cdn.kernel.org/pub/linux/kernel/v5.x/linux-5.1.16.tar.xz

І вийміть його за допомогою 'tar':

tar xJf linux-5.1.16.tar.xz

Тепер входимо в директорію, створену при розпакуванні tarball:

cd linux-5.1.16

Налаштування збирання ядра

Система збирання ядра - це набір Make-файлів с безліччю інструментів і скриптів для автоматизації процесу. Для початку відкрийте інтерактивну програму налаштування:

make ARCH=um menuconfig

Вона частково проведе збірку та виведе вам діалогове вікно. Коли внизу вікна висвітиться '[Select]', можна налаштувати за допомогою клавіш Пробіл або Введення. Навігація по вікну, як завжди, стрілками клавіатури "вгору" і "вниз", а виділення елементів - "ліворуч" або "вправо".

Вказівник виду -> означає, що ви знаходитесь у підменю, вхід до якого здійснюється клавішею Введення. Вихід із нього, очевидно, через '[Exit]».

Увімкніть такі параметри в '[Select]' і переконайтеся, що поруч із ними є символ '[*]':

UML-specific Options:
  - Host filesystem
Networking support (enable this to get the submenu to show up):
  - Networking options:
    - TCP/IP Networking
UML Network devices:
  - Virtual network device
  - SLiRP transport

Все з цього вікна можна виходити, послідовно вибираючи '[Exit]'. Тільки переконайтеся, що наприкінці вам запропонує зберегти конфігурацію та оберіть '[Yes]».

Я рекомендую вам погратися з параметрами збирання ядра після прочитання цієї посади. Завдяки цим експериментам ви зможете багато почерпнути в плані розуміння роботи низькорівневих механік ядра та впливу різних прапорів на його збирання.

Складання ядра

Ядро Linux - це велика програма, що займається безліччю речей. Навіть за такої мінімальної конфігурації на старому устаткуванні його складання може зайняти достатньо часу. Тому збирайте ядро ​​за допомогою наступної команди:

make ARCH=um -j$(nproc)

Навіщо? Ця команда скаже нашому збирачеві використовувати всі доступні ядра та потоки процесора в процесі збирання. Команда $(nproc) в кінці Build підставляє висновок команди nprocяка є частиною coreutils у стандартному складанні Ubuntu.

Через деякий час наше ядро ​​буде зібрано у виконуваний файл ./linux.

Інсталяція бінарника

Так як User Mode в Linux створює звичайний бінарник, ви можете встановити його, як будь-яку іншу утиліту. Ось як це робила я:

mkdir -p ~/bin
cp linux ~/bin/linux

Також варто переконатися, що ~/bin знаходиться у вашому $PATH:

export PATH=$PATH:$HOME/bin

Налаштування гостьової файлової системи

Створіть директорію для гостьової файлової системи:

mkdir -p $HOME/prefix/uml-demo
cd $HOME/prefix

Відкрийте alpinelinux.org і в розділі завантажень знайдіть актуальне посилання на скачування MINI ROOT FILESYSTEM. На момент написання публікації це було:

http://dl-cdn.alpinelinux.org/alpine/v3.10/releases/x86_64/alpine-minirootfs-3.10.0-x86_64.tar.gz

Завантажте цей tarball, використовуючи wget:

wget -O alpine-rootfs.tgz http://dl-cdn.alpinelinux.org/alpine/v3.10/releases/x86_64/alpine-minirootfs-3.10.0-x86_64.tar.gz

Тепер увійдіть до директорії гостьової файлової системи і розпакуйте архів:

cd uml-demo
tar xf ../alpine-rootfs.tgz

Описані дії створять невеликий шаблон файлової системи. Через особливості роботи системи встановлювати пакети через диспетчер apk Alpine буде дуже складно. Але цієї ФС буде достатньо оцінки загальної ідеї.

Також нам знадобиться інструмент TiNi для припинення споживання пам'яті зомбі-процесами нашого гостьового ядра.

wget -O tini https://github.com/krallin/tini/releases/download/v0.18.0/tini-static
chmod +x tini

Створення командного рядка ядра

У ядрі Linux, як і в більшості інших програм, є аргументи командного рядка, з якими можна ознайомитись, вказавши ключ --help.

Сам-help

linux --help
User Mode Linux v5.1.16
        available at http://user-mode-linux.sourceforge.net/

--showconfig
    Prints the config file that this UML binary was generated from.

iomem=<name>,<file>
    Configure <file> as an IO memory region named <name>.

mem=<Amount of desired ram>
    This controls how much "physical" memory the kernel allocates
    for the system. The size is specified as a number followed by
    one of 'k', 'K', 'm', 'M', which have the obvious meanings.
    This is not related to the amount of memory in the host.  It can
    be more, and the excess, if it's ever used, will just be swapped out.
        Example: mem=64M

--help
    Prints this message.

debug
    this flag is not needed to run gdb on UML in skas mode

root=<file containing the root fs>
    This is actually used by the generic kernel in exactly the same
    way as in any other kernel. If you configure a number of block
    devices and want to boot off something other than ubd0, you
    would use something like:
        root=/dev/ubd5

--version
    Prints the version number of the kernel.

umid=<name>
    This is used to assign a unique identity to this UML machine and
    is used for naming the pid file and management console socket.

con[0-9]*=<channel description>
    Attach a console or serial line to a host channel.  See
    http://user-mode-linux.sourceforge.net/old/input.html for a complete
    description of this switch.

eth[0-9]+=<transport>,<options>
    Configure a network device.
    
aio=2.4
    This is used to force UML to use 2.4-style AIO even when 2.6 AIO is
    available.  2.4 AIO is a single thread that handles one request at a
    time, synchronously.  2.6 AIO is a thread which uses the 2.6 AIO
    interface to handle an arbitrary number of pending requests.  2.6 AIO
    is not available in tt mode, on 2.4 hosts, or when UML is built with
    /usr/include/linux/aio_abi.h not available.  Many distributions don't
    include aio_abi.h, so you will need to copy it from a kernel tree to
    your /usr/include/linux in order to build an AIO-capable UML

nosysemu
    Turns off syscall emulation patch for ptrace (SYSEMU).
    SYSEMU is a performance-patch introduced by Laurent Vivier. It changes
    behaviour of ptrace() and helps reduce host context switch rates.
    To make it work, you need a kernel patch for your host, too.
    See http://perso.wanadoo.fr/laurent.vivier/UML/ for further
    information.

uml_dir=<directory>
    The location to place the pid and umid files.

quiet
    Turns off information messages during boot.

hostfs=<root dir>,<flags>,...
    This is used to set hostfs parameters.  The root directory argument
    is used to confine all hostfs mounts to within the specified directory
    tree on the host.  If this isn't specified, then a user inside UML can
    mount anything on the host that's accessible to the user that's running
    it.
    The only flag currently supported is 'append', which specifies that all
    files opened by hostfs will be opened in append mode.

Це полотнище висвітлює основні параметри запуску. Давайте запустимо ядро ​​з мінімальним необхідним набором опцій:

linux 
  root=/dev/root 
  rootfstype=hostfs 
  rootflags=$HOME/prefix/uml-demo 
  rw 
  mem=64M 
  init=/bin/sh

Рядки вище кажуть нашому ядру таке:

  • Припустимо, що коренева файлова система є псевдо-пристроєм. /dev/root.
  • Вибери hostfs як драйвер кореневої файлової системи.
  • Змонтуй гостьову файлову систему, яку ми створили у root-пристрої.
  • І так, у режимі читання-запису.
  • Використовуйте лише 64 мегабайти оперативної пам'яті (ви можете використовувати набагато менше, залежно від того, що ви плануєте робити, але 64 МБ здаються оптимальним обсягом).
  • Ядро автоматично запускає /bin/sh як init-процес.

Запустіть цю команду, і ви повинні отримати щось на зразок наступного:

Ще одне простирадло

Core dump limits :
        soft - 0
        hard - NONE
Checking that ptrace can change system call numbers...OK
Checking syscall emulation patch for ptrace...OK
Checking advanced syscall emulation patch for ptrace...OK
Checking environment variables for a tempdir...none found
Checking if /dev/shm is on tmpfs...OK
Checking PROT_EXEC mmap in /dev/shm...OK
Adding 32137216 bytes to physical memory to account for exec-shield gap
Linux version 5.1.16 (cadey@kahless) (gcc version 7.4.0 (Ubuntu 7.4.0-1ubuntu1~18.04.1)) #30 Sun Jul 7 18:57:19 UTC 2019
Built 1 zonelists, mobility grouping on.  Total pages: 23898
Kernel command line: root=/dev/root rootflags=/home/cadey/dl/uml/alpine rootfstype=hostfs rw mem=64M init=/bin/sh
Dentry cache hash table entries: 16384 (order: 5, 131072 bytes)
Inode-cache hash table entries: 8192 (order: 4, 65536 bytes)
Memory: 59584K/96920K available (2692K kernel code, 708K rwdata, 588K rodata, 104K init, 244K bss, 37336K reserved, 0K cma-reserved)
SLUB: HWalign=64, Order=0-3, MinObjects=0, CPUs=1, Nodes=1
NR_IRQS: 15
clocksource: timer: mask: 0xffffffffffffffff max_cycles: 0x1cd42e205, max_idle_ns: 881590404426 ns
Calibrating delay loop... 7479.29 BogoMIPS (lpj=37396480)
pid_max: default: 32768 minimum: 301
Mount-cache hash table entries: 512 (order: 0, 4096 bytes)
Mountpoint-cache hash table entries: 512 (order: 0, 4096 bytes)
Checking that host ptys support output SIGIO...Yes
Checking that host ptys support SIGIO on close...No, enabling workaround
devtmpfs: initialized
random: get_random_bytes called from setup_net+0x48/0x1e0 with crng_init=0
Using 2.6 host AIO
clocksource: jiffies: mask: 0xffffffff max_cycles: 0xffffffff, max_idle_ns: 19112604462750000 ns
futex hash table entries: 256 (order: 0, 6144 bytes)
NET: Registered protocol family 16
clocksource: Switched to clocksource timer
NET: Registered protocol family 2
tcp_listen_portaddr_hash hash table entries: 256 (order: 0, 4096 bytes)
TCP established hash table entries: 1024 (order: 1, 8192 bytes)
TCP bind hash table entries: 1024 (order: 1, 8192 bytes)
TCP: Hash tables configured (established 1024 bind 1024)
UDP hash table entries: 256 (order: 1, 8192 bytes)
UDP-Lite hash table entries: 256 (order: 1, 8192 bytes)
NET: Registered protocol family 1
console [stderr0] disabled
mconsole (version 2) initialized on /home/cadey/.uml/tEwIjm/mconsole
Checking host MADV_REMOVE support...OK
workingset: timestamp_bits=62 max_order=14 bucket_order=0
Block layer SCSI generic (bsg) driver version 0.4 loaded (major 254)
io scheduler noop registered (default)
io scheduler bfq registered
loop: module loaded
NET: Registered protocol family 17
Initialized stdio console driver
Using a channel type which is configured out of UML
setup_one_line failed for device 1 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 2 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 3 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 4 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 5 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 6 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 7 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 8 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 9 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 10 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 11 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 12 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 13 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 14 : Configuration failed
Using a channel type which is configured out of UML
setup_one_line failed for device 15 : Configuration failed
Console initialized on /dev/tty0
console [tty0] enabled
console [mc-1] enabled
Failed to initialize ubd device 0 :Couldn't determine size of device's file
VFS: Mounted root (hostfs filesystem) on device 0:11.
devtmpfs: mounted
This architecture does not have kernel memory protection.
Run /bin/sh as init process
/bin/sh: can't access tty; job control turned off
random: fast init done
/ # 

Маніпуляції вище дадуть нам гостьову систему на мінімалках, без таких речей, як /proc або наданий хостнейм. Наприклад, спробуйте виконати такі команди:

- uname -av
- cat /proc/self/pid
- hostname

Щоб вийти з системи, введіть exit або натисніть control-d. Це пристрелить оболонку з наступним kernel panic:

/ # exit
Kernel panic - not syncing: Attempted to kill init! exitcode=0x00000000
fish: “./linux root=/dev/root rootflag…” terminated by signal SIGABRT (Abort)

Ми отримали цей kernel panic через те, що ядро ​​Linux вважає, що процес ініціалізації завжди запущений. Без нього система більше не може функціонувати та завершує роботу. Але так як це процес режиму користувача, отриманий результат відправляє сам себе в SIGABRTщо призводить до виходу.

Налаштування гостьової мережі

А тут у нас все починає йти не за планом. Мережа в User Mode Linux - це те місце, де вся концепція обмеженого «користувацького режиму» починає розвалюватися. Адже зазвичай на системному рівні мережа обмежена привілейованими режимами виконання з усіх зрозумілих причин.

Прим. пер.: більше про різні варіанти роботи з мережею в UML можна почитати тут.

Подорож у slirp

Однак існує стародавній і практично непідтримуваний інструмент під назвою Проскочити, за допомогою якого User Mode Linux може взаємодіяти з мережею. Він працює приблизно як стек TCP/IP на рівні користувача і не вимагає жодних системних дозволів для запуску. Цей інструмент був випущений у 1995 році, а останнє оновлення датується 2006 роком. Slirp дуже старий. За час без підтримки та оновлення компілятори пішли настільки далеко, що тепер цей інструмент можна охарактеризувати тільки як «code rot».

Отже, давайте накотимо Slirp із репозиторіїв Ubuntu і спробуємо його запустити:

sudo apt-get install slirp
/usr/bin/slirp
Slirp v1.0.17 (BETA)

Copyright (c) 1995,1996 Danny Gasparovski and others.
All rights reserved.
This program is copyrighted, free software.
Please read the file COPYRIGHT that came with the Slirp
package for the terms and conditions of the copyright.

IP address of Slirp host: 127.0.0.1
IP address of your DNS(s): 1.1.1.1, 10.77.0.7
Your address is 10.0.2.15
(or anything else you want)

Type five zeroes (0) to exit.

[autodetect SLIP/CSLIP, MTU 1500, MRU 1500, 115200 baud]

SLiRP Ready ...
fish: “/usr/bin/slirp” terminated by signal SIGSEGV (Address boundary error)

Ох, божечко. Давайте встановимо відладчик для Slirp і подивимося, чи зможемо розібратися, що відбувається:

sudo apt-get install gdb slirp-dbgsym
gdb /usr/bin/slirp
GNU gdb (Ubuntu 8.1-0ubuntu3) 8.1.0.20180409-git
Copyright (C) 2018 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law.  Type "show copying"
and "show warranty" for details.
This GDB was configured as "x86_64-linux-gnu".
Type "show configuration" for configuration details.
For bug reporting instructions, please see:
<http://www.gnu.org/software/gdb/bugs/>.
Find the GDB manual and other documentation resources online at:
<http://www.gnu.org/software/gdb/documentation/>.
For help, type "help".
Type "apropos word" to search for commands related to "word"...
Reading symbols from /usr/bin/slirp...Reading symbols from /usr/lib/debug/.build-id/c6/2e75b69581a1ad85f72ac32c0d7af913d4861f.debug...done.
done.
(gdb) run
Starting program: /usr/bin/slirp
Slirp v1.0.17 (BETA)

Copyright (c) 1995,1996 Danny Gasparovski and others.
All rights reserved.
This program is copyrighted, free software.
Please read the file COPYRIGHT that came with the Slirp
package for the terms and conditions of the copyright.

IP address of Slirp host: 127.0.0.1
IP address of your DNS(s): 1.1.1.1, 10.77.0.7
Your address is 10.0.2.15
(or anything else you want)

Type five zeroes (0) to exit.

[autodetect SLIP/CSLIP, MTU 1500, MRU 1500, 115200 baud]

SLiRP Ready ...

Program received signal SIGSEGV, Segmentation fault.
                                                    ip_slowtimo () at ip_input.c:457
457     ip_input.c: No such file or directory.

Помилка б'ється у нас у цьому рядку. Давайте подивимося на stacktrace, може там нам щось допоможе:

(gdb) bt full
#0  ip_slowtimo () at ip_input.c:457
        fp = 0x55784a40
#1  0x000055555556a57c in main_loop () at ./main.c:980
        so = <optimized out>
        so_next = <optimized out>
        timeout = {tv_sec = 0, tv_usec = 0}
        ret = 0
        nfds = 0
        ttyp = <optimized out>
        ttyp2 = <optimized out>
        best_time = <optimized out>
        tmp_time = <optimized out>
#2  0x000055555555b116 in main (argc=1, argv=0x7fffffffdc58) at ./main.c:95
No locals.

Тут бачимо, що збій відбувається під час запуску основного циклу, коли slirp намагається перевірити тайм-аути. Ось у цей момент я мала відмовитися від спроб налагодження. Але давайте подивимося, чи працює Slirp, зібраний із сорців. Я повторно завантажила архів безпосередньо із сайту Sourceforgeтому що тягти щось звідти через командний рядок — біль:

cd ~/dl
wget https://xena.greedo.xeserv.us/files/slirp-1.0.16.tar.gz
tar xf slirp-1.0.16.tar.gz
cd slirp-1.0.16/src
./configure --prefix=$HOME/prefix/slirp
make

Тут ми бачимо алерти про невизначені вбудовані функції, тобто про неможливість з'єднати бінарний файл, що виходить у результаті. Схоже, у період між 2006 роком і цим моментом gcc припинив створювати символи, що використовуються в функціях будови проміжно скомпільованих файлів. Спробуємо замінити ключове слово inline на порожній коментар і подивимося на результат:

vi slirp.h
:6
a
<enter>
#define inline /**/
<escape>
:wq
make

Не-а. Це також не працює. Як і раніше, не вдається знайти символи цих функцій.

На цьому етапі я здалася та почала шукати на Github пакети збирання Heroku. Моя теорія базувалася на тому, що в якомусь складальному пакеті Heroku будуть міститися необхідні двійкові файли. В результаті пошуки привели мене ось сюди. Я скачала та розпакувала uml.tar.gz і знайшла таке:

total 6136
-rwxr-xr-x 1 cadey cadey   79744 Dec 10  2017 ifconfig*
-rwxr-xr-x 1 cadey cadey     373 Dec 13  2017 init*
-rwxr-xr-x 1 cadey cadey  149688 Dec 10  2017 insmod*
-rwxr-xr-x 1 cadey cadey   66600 Dec 10  2017 route*
-rwxr-xr-x 1 cadey cadey  181056 Jun 26  2015 slirp*
-rwxr-xr-x 1 cadey cadey 5786592 Dec 15  2017 uml*
-rwxr-xr-x 1 cadey cadey     211 Dec 13  2017 uml_run*

Це бінарний файл slirp! А чи він працює?

./slirp
Slirp v1.0.17 (BETA) FULL_BOLT

Copyright (c) 1995,1996 Danny Gasparovski and others.
All rights reserved.
This program is copyrighted, free software.
Please read the file COPYRIGHT that came with the Slirp
package for the terms and conditions of the copyright.

IP address of Slirp host: 127.0.0.1
IP address of your DNS(s): 1.1.1.1, 10.77.0.7
Your address is 10.0.2.15
(or anything else you want)

Type five zeroes (0) to exit.

[autodetect SLIP/CSLIP, MTU 1500, MRU 1500]

SLiRP Ready ...

Не падає — тож має спрацювати! Давайте підсадимо цей бінарник у ~/bin/slirp:

cp slirp ~/bin/slirp

На випадок, якщо творець пакета видалить його, я зробила дзеркало.

Налаштування мережі

Тепер давайте налаштуємо мережу на нашому гостьовому ядрі. Оновимо параметри запуску:

linux 
  root=/dev/root 
  rootfstype=hostfs 
  rootflags=$HOME/prefix/uml-demo 
  rw 
  mem=64M 
  eth0=slirp,,$HOME/bin/slirp 
  init=/bin/sh

Тепер давайте включимо мережу:

mount -t proc proc proc/
mount -t sysfs sys sys/

ifconfig eth0 10.0.2.14 netmask 255.255.255.240 broadcast 10.0.2.15
route add default gw 10.0.2.2

Перші дві команди налаштування /proc и /sys необхідні для роботи ifconfigяка встановлює мережний інтерфейс для зв'язку з Slirp. Команда route встановлює таблицю маршрутизації ядра для примусового надсилання всього трафіку через тунель Slirp. Давайте перевіримо це за допомогою DNS-запиту:

nslookup google.com 8.8.8.8
Server:    8.8.8.8
Address 1: 8.8.8.8 dns.google

Name:      google.com
Address 1: 172.217.12.206 lga25s63-in-f14.1e100.net
Address 2: 2607:f8b0:4006:81b::200e lga25s63-in-x0e.1e100.net

Працює!

Прим.пер.: Судячи з усього, початковий пост писався на десктопі з провідною мережевою картою, або якоюсь іншою конфігурацією, яка потребує додаткових драйверів. На ноутбуці з WiFi 8265 від Intel при піднятті мережі виникає помилка

/ # ifconfig eth0 10.0.2.14 netmask 255.255.255.240 broadcast 10.0.2.15
slirp_tramp failed - errno = 2
ifconfig: ioctl 0x8914 failed: No such file or directory
/ #

Мабуть, ядро ​​не може зв'язатися з драйвером сетевухи. Спроба вкласти firmware в ядро ​​ситуацію, на жаль, не виправила. На момент публікації саме в такій конфігурації рішення поки що знайти не вдалося. На більш простих конфігах (наприклад, Virtualbox) інтерфейс піднімається коректно.

Давайте автоматизуємо перенаправлення за допомогою наступного shell-скрипту:

#!/bin/sh
# init.sh

mount -t proc proc proc/
mount -t sysfs sys sys/
ifconfig eth0 10.0.2.14 netmask 255.255.255.240 broadcast 10.0.2.15
route add default gw 10.0.2.2

echo "networking set up"

exec /tini /bin/sh

І відзначимо його виконуваним:

chmod +x init.sh

А потім внесемо зміни до командного рядка ядра:

linux 
  root=/dev/root 
  rootfstype=hostfs 
  rootflags=$HOME/prefix/uml-demo 
  rw 
  mem=64M 
  eth0=slirp,,$HOME/bin/slirp 
  init=/init.sh

І повторимо:

SLiRP Ready ...
networking set up
/bin/sh: can't access tty; job control turned off

nslookup google.com 8.8.8.8
Server:    8.8.8.8
Address 1: 8.8.8.8 dns.google

Name:      google.com
Address 1: 172.217.12.206 lga25s63-in-f14.1e100.net
Address 2: 2607:f8b0:4004:800::200e iad30s09-in-x0e.1e100.net

Мережа працює стабільно!

Докер-файл

Щоб вам було простіше це перевірити, я зібрала Докер-файлякий автоматизує більшість описаних кроків і повинен забезпечити вам робочу конфігурацію. Ще в мене є готова конфігурація ядра, В якій є все, що описано в пості. Але важливо розуміти, що тут я виклала лише мінімальне налаштування.

Я сподіваюся, що цей пост допоміг вам зрозуміти, як підняти гостьове ядро. Вийшов якийсь монстр, але замислювалася публікація як всеосяжне керівництво на тему складання, встановлення та налаштування User Mode у Linux під сучасними версіями операційних систем цього сімейства. Наступні дії повинні включати установку сервісів та іншого програмного забезпечення вже всередині гостьової системи. Так як образи контейнерів Docker це просто розпіарені tar-архіви, ви повинні бути в змозі витягти образ через docker export, а потім визначити шлях його встановлення в корені файлової системи гостьового ядра. Ну а потім виконайте shell-скрипт.

Окреме спасибі Rkeene з #lobsters на Freenode. Без його допомоги у налагодженні Slirp я б не зайшла так далеко. Я гадки не маю, як його система Slackware коректно працює зі slirp, але мої системи Ubuntu та Alpine не прийняли slirp та запропонований мені Rkeene бінарник. Але мені достатньо й того, що в мене працює хоч щось.

Джерело: habr.com

Додати коментар або відгук