Alpine Python uchun Docker tuzilmalarini 50 baravar sekinroq kompilyatsiya qiladi va tasvirlar 2 baravar og'irroqdir

Alpine Python uchun Docker tuzilmalarini 50 baravar sekinroq kompilyatsiya qiladi va tasvirlar 2 baravar og'irroqdir

Alpine Linux ko'pincha Docker uchun asosiy tasvir sifatida tavsiya etiladi. Sizga aytilishicha, Alp tog'idan foydalanish qurilishlaringizni kichikroq qiladi va qurish jarayonini tezroq qiladi.

Ammo agar siz Python ilovalari uchun Alpine Linuxdan foydalansangiz, u:

  • Qurilishlaringizni ancha sekinlashtiradi
  • Tasvirlaringizni kattaroq qiladi
  • Vaqtingizni behuda sarflash
  • Va oxir-oqibat, bu ish vaqtida xatolarga olib kelishi mumkin


Keling, nima uchun Alp tog'lari tavsiya etilganini ko'rib chiqaylik, lekin nima uchun uni hali ham Python bilan ishlatmaslik kerak.

Nima uchun odamlar Alp tog'larini tavsiya qilishadi?

Tasavvurimizning bir qismi sifatida bizga gcc kerak deb faraz qilaylik va biz Alpine Linux va Ubuntu 18.04 ni qurish tezligi va yakuniy tasvir hajmi jihatidan solishtirmoqchimiz.

Birinchidan, ikkita rasmni yuklab oling va ularning o'lchamlarini taqqoslaylik:

$ docker pull --quiet ubuntu:18.04
docker.io/library/ubuntu:18.04
$ docker pull --quiet alpine
docker.io/library/alpine:latest
$ docker image ls ubuntu:18.04
REPOSITORY          TAG        IMAGE ID         SIZE
ubuntu              18.04      ccc6e87d482b     64.2MB
$ docker image ls alpine
REPOSITORY          TAG        IMAGE ID         SIZE
alpine              latest     e7d92cdc71fe     5.59MB

Ko'rib turganingizdek, Alp tog'lari uchun asosiy tasvir ancha kichikroq. Endi gcc ni o'rnatib, Ubuntu bilan boshlaylik:

FROM ubuntu:18.04
RUN apt-get update && 
    apt-get install --no-install-recommends -y gcc && 
    apt-get clean && rm -rf /var/lib/apt/lists/*

Mukammal Dockerfile-ni yozish ushbu maqola doirasidan tashqarida.

Keling, yig'ish tezligini o'lchaymiz:

$ time docker build -t ubuntu-gcc -f Dockerfile.ubuntu --quiet .
sha256:b6a3ee33acb83148cd273b0098f4c7eed01a82f47eeb8f5bec775c26d4fe4aae

real    0m29.251s
user    0m0.032s
sys     0m0.026s
$ docker image ls ubuntu-gcc
REPOSITORY   TAG      IMAGE ID      CREATED         SIZE
ubuntu-gcc   latest   b6a3ee33acb8  9 seconds ago   150MB

Alp (Dockerfile) uchun ham xuddi shunday takrorlaymiz:

FROM alpine
RUN apk add --update gcc

Biz yig'amiz, yig'ilish vaqti va hajmiga qaraymiz:

$ time docker build -t alpine-gcc -f Dockerfile.alpine --quiet .
sha256:efd626923c1478ccde67db28911ef90799710e5b8125cf4ebb2b2ca200ae1ac3

real    0m15.461s
user    0m0.026s
sys     0m0.024s
$ docker image ls alpine-gcc
REPOSITORY   TAG      IMAGE ID       CREATED         SIZE
alpine-gcc   latest   efd626923c14   7 seconds ago   105MB

Va'da qilinganidek, Alp tog'lariga asoslangan tasvirlar tezroq yig'iladi va kichikroq: 15 o'rniga 30 soniya va tasvir hajmi 105 MB va 150 MB. Bu juda yaxshi!

Ammo agar biz Python ilovasini yaratishga o'tsak, unda hamma narsa unchalik qizg'ish emas.

Python tasvir

Python ilovalari ko'pincha pandalar va matplotlibdan foydalanadi. Shuning uchun, bitta variant ushbu Dockerfile yordamida rasmiy Debian-ga asoslangan rasmni olishdir:

FROM python:3.8-slim
RUN pip install --no-cache-dir matplotlib pandas

Keling, uni yig'amiz:

$ docker build -f Dockerfile.slim -t python-matpan.
Sending build context to Docker daemon  3.072kB
Step 1/2 : FROM python:3.8-slim
 ---> 036ea1506a85
Step 2/2 : RUN pip install --no-cache-dir matplotlib pandas
 ---> Running in 13739b2a0917
Collecting matplotlib
  Downloading matplotlib-3.1.2-cp38-cp38-manylinux1_x86_64.whl (13.1 MB)
Collecting pandas
  Downloading pandas-0.25.3-cp38-cp38-manylinux1_x86_64.whl (10.4 MB)
...
Successfully built b98b5dc06690
Successfully tagged python-matpan:latest

real    0m30.297s
user    0m0.043s
sys     0m0.020s

Biz 363 MB hajmdagi tasvirni olamiz.
Alp tog'lari bilan yaxshiroq ishlaymizmi? Keling urinib koramiz:

FROM python:3.8-alpine
RUN pip install --no-cache-dir matplotlib pandas

$ docker build -t python-matpan-alpine -f Dockerfile.alpine .                                 
Sending build context to Docker daemon  3.072kB                                               
Step 1/2 : FROM python:3.8-alpine                                                             
 ---> a0ee0c90a0db                                                                            
Step 2/2 : RUN pip install --no-cache-dir matplotlib pandas                                                  
 ---> Running in 6740adad3729                                                                 
Collecting matplotlib                                                                         
  Downloading matplotlib-3.1.2.tar.gz (40.9 MB)                                               
    ERROR: Command errored out with exit status 1:                                            
     command: /usr/local/bin/python -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'/
tmp/pip-install-a3olrixa/matplotlib/setup.py'"'"'; __file__='"'"'/tmp/pip-install-a3olrixa/matplotlib/setup.py'"'"';f=getattr(tokenize, '"'"'open'"'"', open)(__file__);code=f.read().replace('"'"'rn'"'"', '"'"'n'"'"');f.close();exec(compile(code, __file__, '"'"'exec'"'"'))' egg_info --egg-base /tmp/pip-install-a3olrixa/matplotlib/pip-egg-info                              

...
ERROR: Command errored out with exit status 1: python setup.py egg_info Check the logs for full command output.
The command '/bin/sh -c pip install matplotlib pandas' returned a non-zero code: 1

Nima bo'lyapti?

Alp tog'lari g'ildiraklarni qo'llab-quvvatlamaydi

Agar siz Debian-ga asoslangan qurilishni ko'rsangiz, u matplotlib-3.1.2-cp38-cp38-manylinux1_x86_64 yuklab olishini ko'rasiz.whl.

Bu g'ildirak uchun ikkilikdir. Alpine matplotlib-3.1.2.tar manbalarini yuklab oladi.gz` chunki u standartni qo'llab-quvvatlamaydi g'ildiraklar.

Nega? Ko'pgina Linux distributivlari C standart kutubxonasining GNU versiyasidan (glibc) foydalanadi, bu aslida C tilida yozilgan har bir dastur, jumladan Python uchun talab qilinadi. Ammo Alp tog'lari "musl" dan foydalanadi va bu ikkilik fayllar "glibc" uchun mo'ljallanganligi sababli, ular shunchaki variant emas.

Shuning uchun, agar siz Alpine-dan foydalansangiz, har bir Python paketida C tilida yozilgan barcha kodlarni kompilyatsiya qilishingiz kerak.

Oh, ha, siz o'zingiz tuzishingiz kerak bo'lgan barcha bog'liqliklar ro'yxatini izlashingiz kerak bo'ladi.
Bunday holda biz quyidagilarni olamiz:

FROM python:3.8-alpine
RUN apk --update add gcc build-base freetype-dev libpng-dev openblas-dev
RUN pip install --no-cache-dir matplotlib pandas

Va qurilish vaqtini oladi ...

... 25 daqiqa 57 soniya! Rasm hajmi esa 851 MB.

Alp tog'lariga asoslangan tasvirlarni yaratish ancha uzoq davom etadi, ular kattaroq hajmga ega va siz hali ham barcha bog'liqliklarni qidirishingiz kerak. Siz, albatta, yordamida yig'ish hajmini kamaytirishingiz mumkin ko'p bosqichli qurilishlar lekin bu yanada ko'proq ish qilish kerakligini anglatadi.

Bu hali hammasi emas!

Alpine ish vaqtida kutilmagan xatolarga olib kelishi mumkin

  • Nazariy jihatdan, musl glibc bilan mos keladi, lekin amalda farqlar ko'p muammolarni keltirib chiqarishi mumkin. Va agar ular bo'lsa, ehtimol ular yoqimsiz bo'ladi. Bu erda yuzaga kelishi mumkin bo'lgan ba'zi muammolar:
  • Alp tog'ida sukut bo'yicha kichikroq iplar to'plami o'lchamiga ega, bu esa olib kelishi mumkin Pythondagi xatolar
  • Ba'zi foydalanuvchilar buni aniqladilar Python ilovalari sekinroq musl xotirani taqsimlash usuli tufayli (glibc dan farq qiladi).
  • Foydalanuvchilardan biri sanani formatlashda xatolik aniqlandi

Albatta, bu xatolar allaqachon tuzatilgan, ammo yana qancha bo'lishini kim biladi.

Python uchun Alp tog'lari tasvirlaridan foydalanmang

Agar siz katta va uzoq qurilishlar, bog'liqliklar va yuzaga kelishi mumkin bo'lgan xatolarni qidirish bilan bezovta qilishni xohlamasangiz, Alpine Linuxni asosiy tasvir sifatida ishlatmang. Yaxshi asosiy tasvirni tanlash.

Manba: www.habr.com

a Izoh qo'shish