Stručný přehled a nastavení kontejnerů Kata

Stručný přehled a nastavení kontejnerů Kata
Tento článek bude diskutovat o tom, jak to funguje Kontejnery Kata, a nebude chybět ani praktická část s jejich propojením s Dockerem.

O běžných problémech s Dockerem a jejich řešení již bylo napsáno, dnes krátce popíšu implementaci z Kata Containers. Kata Containers je bezpečný kontejnerový runtime založený na odlehčených virtuálních strojích. Práce s nimi je stejná jako s jinými kontejnery, ale navíc je zde spolehlivější izolace pomocí technologie hardwarové virtualizace. Projekt začal v roce 2017, kdy stejnojmenná komunita dokončila spojení nejlepších nápadů z Intel Clear Containers a Hyper.sh RunV, poté pokračovaly práce na podpoře různých architektur, včetně AMD64, ARM, IBM p- a z -série. Navíc je podporována práce uvnitř hypervizorů QEMU, Firecracker a existuje také integrace s kontejnery. Kód je k dispozici na GitHub pod licencí MIT.

Klíčové vlastnosti

  • Při práci se samostatným jádrem, které poskytuje izolaci sítě, paměti a I/O, je možné vynutit si použití hardwarové izolace založené na virtualizačních rozšířeních
  • Podpora průmyslových standardů včetně OCI (kontejnerový formát), Kubernetes CRI
  • Konzistentní výkon běžných linuxových kontejnerů, zvýšená izolace bez režie výkonu běžných virtuálních počítačů
  • Odstraňte potřebu spouštět kontejnery uvnitř plnohodnotných virtuálních strojů, generická rozhraní zjednodušují integraci a spouštění

Instalace

K dispozici je mnoho možnosti instalace, zvážím instalaci z repozitářů, založených na operačním systému Centos 7.
Je to důležité,: Práce s kontejnery Kata je podporována pouze na hardwaru, předávání virtualizace také nefunguje vždy potřebují podporu sse4.1 z procesoru.

Instalace kontejnerů Kata je poměrně jednoduchá:

Nainstalujte nástroje pro práci s repozitáři:

# yum -y install yum-utils

Zakázat Selinux (je správnější nakonfigurovat, ale pro jednoduchost jej deaktivuji):

# setenforce 0
# sed -i 's/^SELINUX=enforcing$/SELINUX=permissive/' /etc/selinux/config

Připojíme úložiště a provedeme instalaci

# source /etc/os-release
# ARCH=$(arch)
# BRANCH="${BRANCH:-stable-1.10}"
# yum-config-manager --add-repo "http://download.opensuse.org/repositories/home:/katacontainers:/releases:/${ARCH}:/${BRANCH}/CentOS_${VERSION_ID}/home:katacontainers:releases:${ARCH}:${BRANCH}.repo"
# yum -y install kata-runtime kata-proxy kata-shim

Nastavení

Budu nastavovat pro práci s dockerem, jeho instalace je typická, nebudu ji blíže popisovat:

# rpm -qa | grep docker
docker-ce-cli-19.03.6-3.el7.x86_64
docker-ce-19.03.6-3.el7.x86_64
# docker -v
Docker version 19.03.6, build 369ce74a3c

Provádíme změny v souboru daemon.json:

# cat <<EOF > /etc/docker/daemon.json
{
  "default-runtime": "kata-runtime",
  "runtimes": {
    "kata-runtime": {
      "path": "/usr/bin/kata-runtime"
    }
  }
}
EOF

Restartujte docker:

# service docker restart

Funkční testování

Pokud spustíte kontejner před restartováním dockeru, můžete vidět, že uname poskytne verzi jádra běžícího na hlavním systému:

# docker run busybox uname -a
Linux 19efd7188d06 3.10.0-1062.12.1.el7.x86_64 #1 SMP Tue Feb 4 23:02:59 UTC 2020 x86_64 GNU/Linux

Po restartu vypadá verze jádra takto:

# docker run busybox uname -a
Linux 9dd1f30fe9d4 4.19.86-5.container #1 SMP Sat Feb 22 01:53:14 UTC 2020 x86_64 GNU/Linux

Více týmů!

# time docker run busybox mount
kataShared on / type 9p (rw,dirsync,nodev,relatime,mmap,access=client,trans=virtio)
proc on /proc type proc (rw,nosuid,nodev,noexec,relatime)
tmpfs on /dev type tmpfs (rw,nosuid,size=65536k,mode=755)
devpts on /dev/pts type devpts (rw,nosuid,noexec,relatime,gid=5,mode=620,ptmxmode=666)
sysfs on /sys type sysfs (ro,nosuid,nodev,noexec,relatime)
tmpfs on /sys/fs/cgroup type tmpfs (ro,nosuid,nodev,noexec,relatime,mode=755)
cgroup on /sys/fs/cgroup/systemd type cgroup (ro,nosuid,nodev,noexec,relatime,xattr,name=systemd)
cgroup on /sys/fs/cgroup/cpu,cpuacct type cgroup (ro,nosuid,nodev,noexec,relatime,cpu,cpuacct)
cgroup on /sys/fs/cgroup/blkio type cgroup (ro,nosuid,nodev,noexec,relatime,blkio)
cgroup on /sys/fs/cgroup/memory type cgroup (ro,nosuid,nodev,noexec,relatime,memory)
cgroup on /sys/fs/cgroup/devices type cgroup (ro,nosuid,nodev,noexec,relatime,devices)
cgroup on /sys/fs/cgroup/perf_event type cgroup (ro,nosuid,nodev,noexec,relatime,perf_event)
cgroup on /sys/fs/cgroup/net_cls,net_prio type cgroup (ro,nosuid,nodev,noexec,relatime,net_cls,net_prio)
cgroup on /sys/fs/cgroup/freezer type cgroup (ro,nosuid,nodev,noexec,relatime,freezer)
cgroup on /sys/fs/cgroup/pids type cgroup (ro,nosuid,nodev,noexec,relatime,pids)
cgroup on /sys/fs/cgroup/cpuset type cgroup (ro,nosuid,nodev,noexec,relatime,cpuset)
mqueue on /dev/mqueue type mqueue (rw,nosuid,nodev,noexec,relatime)
shm on /dev/shm type tmpfs (rw,nosuid,nodev,noexec,relatime,size=65536k)
kataShared on /etc/resolv.conf type 9p (rw,dirsync,nodev,relatime,mmap,access=client,trans=virtio)
kataShared on /etc/hostname type 9p (rw,dirsync,nodev,relatime,mmap,access=client,trans=virtio)
kataShared on /etc/hosts type 9p (rw,dirsync,nodev,relatime,mmap,access=client,trans=virtio)
proc on /proc/bus type proc (ro,relatime)
proc on /proc/fs type proc (ro,relatime)
proc on /proc/irq type proc (ro,relatime)
proc on /proc/sys type proc (ro,relatime)
tmpfs on /proc/acpi type tmpfs (ro,relatime)
tmpfs on /proc/timer_list type tmpfs (rw,nosuid,size=65536k,mode=755)
tmpfs on /sys/firmware type tmpfs (ro,relatime)

real    0m2.381s
user    0m0.066s
sys 0m0.039s

# time docker run busybox free -m
              total        used        free      shared  buff/cache   available
Mem:           1993          30        1962           0           1        1946
Swap:             0           0           0

real    0m3.297s
user    0m0.086s
sys 0m0.050s

Rychlé zátěžové testování

Pro posouzení ztrát z virtualizace - jako hlavní příklady spouštím sysbench vzít tuto možnost.

Spuštění sysbench pomocí Docker+containerd

Test procesoru

sysbench 1.0:  multi-threaded system evaluation benchmark

Running the test with following options:
Number of threads: 1
Initializing random number generator from current time

Prime numbers limit: 20000

Initializing worker threads...

Threads started!

General statistics:
    total time:                          36.7335s
    total number of events:              10000
    total time taken by event execution: 36.7173s
    response time:
         min:                                  3.43ms
         avg:                                  3.67ms
         max:                                  8.34ms
         approx.  95 percentile:               3.79ms

Threads fairness:
    events (avg/stddev):           10000.0000/0.00
    execution time (avg/stddev):   36.7173/0.00

test RAM

sysbench 1.0:  multi-threaded system evaluation benchmark

Running the test with following options:
Number of threads: 1
Initializing random number generator from current time

Initializing worker threads...

Threads started!

Operations performed: 104857600 (2172673.64 ops/sec)

102400.00 MiB transferred (2121.75 MiB/sec)

General statistics:
    total time:                          48.2620s
    total number of events:              104857600
    total time taken by event execution: 17.4161s
    response time:
         min:                                  0.00ms
         avg:                                  0.00ms
         max:                                  0.17ms
         approx.  95 percentile:               0.00ms

Threads fairness:
    events (avg/stddev):           104857600.0000/0.00
    execution time (avg/stddev):   17.4161/0.00

Spuštění sysbenche pomocí kontejnerů Docker+Kata

Test procesoru

sysbench 1.0:  multi-threaded system evaluation benchmark

Running the test with following options:
Number of threads: 1
Initializing random number generator from current time

Prime numbers limit: 20000

Initializing worker threads...

Threads started!

General statistics:
    total time:                          36.5747s
    total number of events:              10000
    total time taken by event execution: 36.5594s
    response time:
         min:                                  3.43ms
         avg:                                  3.66ms
         max:                                  4.93ms
         approx.  95 percentile:               3.77ms

Threads fairness:
    events (avg/stddev):           10000.0000/0.00
    execution time (avg/stddev):   36.5594/0.00

test RAM

sysbench 1.0:  multi-threaded system evaluation benchmark

Running the test with following options:
Number of threads: 1
Initializing random number generator from current time

Initializing worker threads...

Threads started!

Operations performed: 104857600 (2450366.94 ops/sec)

102400.00 MiB transferred (2392.94 MiB/sec)

General statistics:
    total time:                          42.7926s
    total number of events:              104857600
    total time taken by event execution: 16.1512s
    response time:
         min:                                  0.00ms
         avg:                                  0.00ms
         max:                                  0.43ms
         approx.  95 percentile:               0.00ms

Threads fairness:
    events (avg/stddev):           104857600.0000/0.00
    execution time (avg/stddev):   16.1512/0.00

V zásadě je situace již jasná, ale optimálnější je provést testy vícekrát, odstranit odlehlé hodnoty a zprůměrovat výsledky, takže další testy zatím nedělám.

Závěry

Navzdory skutečnosti, že spuštění takových kontejnerů trvá asi pětkrát až desetkrát déle (typická doba běhu podobných příkazů při použití kontejneru je méně než třetina sekundy), stále fungují poměrně rychle, pokud vezmeme absolutní čas spuštění (tam jsou příklady výše, příkazy provedené v průměru za tři sekundy). Výsledky rychlého testu CPU a RAM ukazují téměř stejné výsledky, což se nemůže jinak než radovat, zejména ve světle skutečnosti, že izolace je zajištěna pomocí tak dobře fungujícího mechanismu, jako je kvm.

Oznámení

Článek je recenzí, ale dává vám možnost pocítit alternativní běh. Mnoho oblastí použití není pokryto, například web popisuje možnost spouštět Kubernetes nad kontejnery Kata. Kromě toho můžete také spustit řadu testů zaměřených na hledání bezpečnostních problémů, nastavení omezení a další zajímavé věci.

Prosím všechny, kteří zde četli a převíjeli, aby se zúčastnili průzkumu, na kterém budou záviset budoucí publikace na toto téma.

Průzkumu se mohou zúčastnit pouze registrovaní uživatelé. Přihlásit se, prosím.

Mám pokračovat ve zveřejňování článků o kontejnerech Kata?

  • 80,0%Ano, pište více!28

  • 20,0%Ne, ne…7

Hlasovalo 35 uživatelů. 7 uživatelů se zdrželo hlasování.

Zdroj: www.habr.com

Přidat komentář