Alpine Python үшін Docker құрастырады 50 есе баяу және кескіндер 2 есе ауыр

Alpine Python үшін Docker құрастырады 50 есе баяу және кескіндер 2 есе ауыр

Alpine Linux жиі Docker үшін негізгі кескін ретінде ұсынылады. Сізге Alpine пайдалану құрылыстарыңызды кішірейтеді және құрастыру процесін жылдамдатады деп айтылады.

Бірақ егер сіз Python қолданбаларына арналған Alpine Linux қолдансаңыз, онда ол:

  • Құрылымдарды әлдеқайда баяу етеді
  • Суреттеріңізді үлкейтеді
  • Уақытыңызды босқа өткізу
  • Нәтижесінде ол орындау уақытындағы қателерді тудыруы мүмкін


Неліктен Alpine ұсынылатынын қарастырайық, бірақ неге оны бәрібір Python-мен қолданбау керек.

Неліктен адамдар Альпі тауын ұсынады?

Кескіннің бір бөлігі ретінде бізге gcc қажет және құрастыру жылдамдығы мен соңғы кескін өлшемі бойынша Alpine Linux пен Ubuntu 18.04 салыстырғымыз келеді делік.

Алдымен екі суретті жүктеп алып, олардың өлшемін салыстырайық:

$ docker pull --quiet ubuntu:18.04
docker.io/library/ubuntu:18.04
$ docker pull --quiet alpine
docker.io/library/alpine:latest
$ docker image ls ubuntu:18.04
REPOSITORY          TAG        IMAGE ID         SIZE
ubuntu              18.04      ccc6e87d482b     64.2MB
$ docker image ls alpine
REPOSITORY          TAG        IMAGE ID         SIZE
alpine              latest     e7d92cdc71fe     5.59MB

Көріп отырғаныңыздай, Альпі үшін негізгі кескін әлдеқайда аз. Енді gcc орнатып, Ubuntu-дан бастайық:

FROM ubuntu:18.04
RUN apt-get update && 
    apt-get install --no-install-recommends -y gcc && 
    apt-get clean && rm -rf /var/lib/apt/lists/*

Керемет Dockerfile жазу бұл мақаланың ауқымынан тыс.

Құрастыру жылдамдығын өлшейік:

$ time docker build -t ubuntu-gcc -f Dockerfile.ubuntu --quiet .
sha256:b6a3ee33acb83148cd273b0098f4c7eed01a82f47eeb8f5bec775c26d4fe4aae

real    0m29.251s
user    0m0.032s
sys     0m0.026s
$ docker image ls ubuntu-gcc
REPOSITORY   TAG      IMAGE ID      CREATED         SIZE
ubuntu-gcc   latest   b6a3ee33acb8  9 seconds ago   150MB

Альпі (Dockerfile) үшін де солай қайталаймыз:

FROM alpine
RUN apk add --update gcc

Біз жинаймыз, құрастыру уақыты мен өлшемін қарастырамыз:

$ time docker build -t alpine-gcc -f Dockerfile.alpine --quiet .
sha256:efd626923c1478ccde67db28911ef90799710e5b8125cf4ebb2b2ca200ae1ac3

real    0m15.461s
user    0m0.026s
sys     0m0.024s
$ docker image ls alpine-gcc
REPOSITORY   TAG      IMAGE ID       CREATED         SIZE
alpine-gcc   latest   efd626923c14   7 seconds ago   105MB

Уәде етілгендей, Альпі негізіндегі кескіндер тезірек жасалады және өздігінен кішірек болады: 15 секундтың орнына 30 секунд және 105 МБ-қа қарсы 150 МБ кескін өлшемі. Бұл өте жақсы!

Бірақ егер біз Python қосымшасын құруға ауыссақ, онда бәрі қызғылт емес.

Python кескіні

Python қолданбалары жиі пандалар мен matplotlib пайдаланады. Сондықтан, бір нұсқа келесі Dockerfile арқылы ресми Debian негізіндегі кескінді алу болып табылады:

FROM python:3.8-slim
RUN pip install --no-cache-dir matplotlib pandas

Оны жинау:

$ docker build -f Dockerfile.slim -t python-matpan.
Sending build context to Docker daemon  3.072kB
Step 1/2 : FROM python:3.8-slim
 ---> 036ea1506a85
Step 2/2 : RUN pip install --no-cache-dir matplotlib pandas
 ---> Running in 13739b2a0917
Collecting matplotlib
  Downloading matplotlib-3.1.2-cp38-cp38-manylinux1_x86_64.whl (13.1 MB)
Collecting pandas
  Downloading pandas-0.25.3-cp38-cp38-manylinux1_x86_64.whl (10.4 MB)
...
Successfully built b98b5dc06690
Successfully tagged python-matpan:latest

real    0m30.297s
user    0m0.043s
sys     0m0.020s

Біз 363 МБ өлшемі бар суретті аламыз.
Альпімен жақсырақ жұмыс істей аламыз ба? Бәлкім байқап көрерміз:

FROM python:3.8-alpine
RUN pip install --no-cache-dir matplotlib pandas

$ docker build -t python-matpan-alpine -f Dockerfile.alpine .                                 
Sending build context to Docker daemon  3.072kB                                               
Step 1/2 : FROM python:3.8-alpine                                                             
 ---> a0ee0c90a0db                                                                            
Step 2/2 : RUN pip install --no-cache-dir matplotlib pandas                                                  
 ---> Running in 6740adad3729                                                                 
Collecting matplotlib                                                                         
  Downloading matplotlib-3.1.2.tar.gz (40.9 MB)                                               
    ERROR: Command errored out with exit status 1:                                            
     command: /usr/local/bin/python -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'/
tmp/pip-install-a3olrixa/matplotlib/setup.py'"'"'; __file__='"'"'/tmp/pip-install-a3olrixa/matplotlib/setup.py'"'"';f=getattr(tokenize, '"'"'open'"'"', open)(__file__);code=f.read().replace('"'"'rn'"'"', '"'"'n'"'"');f.close();exec(compile(code, __file__, '"'"'exec'"'"'))' egg_info --egg-base /tmp/pip-install-a3olrixa/matplotlib/pip-egg-info                              

...
ERROR: Command errored out with exit status 1: python setup.py egg_info Check the logs for full command output.
The command '/bin/sh -c pip install matplotlib pandas' returned a non-zero code: 1

Не болып жатыр?

Alpine доңғалақтарды қолдамайды

Егер сіз Debian негізіндегі құрылымды қарасаңыз, оның matplotlib-3.1.2-cp38-cp38-manylinux1_x86_64 жүктеп алатынын көресіз.whl.

Бұл дөңгелек үшін екілік. Alpine `matplotlib-3.1.2.tar көздерін жүктейді.gz` себебі ол стандартты қолдамайды дөңгелектер.

Неліктен? Көптеген Linux дистрибутивтері C стандартты кітапханасының GNU нұсқасын (glibc) пайдаланады, бұл шын мәнінде C тілінде жазылған әрбір бағдарлама, соның ішінде Python үшін қажет. Бірақ Alpine 'musl' пайдаланады және бұл екілік файлдар 'glibc' үшін болғандықтан, олар жай ғана опция емес.

Сондықтан, Alpine пайдалансаңыз, әрбір Python бумасында C тілінде жазылған барлық кодты құрастыру керек.

Иә, сіз құрастыруды қажет ететін барлық тәуелділіктердің тізімін іздеуге тура келеді.
Бұл жағдайда біз мынаны аламыз:

FROM python:3.8-alpine
RUN apk --update add gcc build-base freetype-dev libpng-dev openblas-dev
RUN pip install --no-cache-dir matplotlib pandas

Ал құрылыс уақытты алады...

… 25 минут 57 секунд! Ал суреттің өлшемі 851 МБ.

Альпі негізіндегі кескіндерді салу әлдеқайда ұзағырақ, олардың өлшемі үлкенірек және сіз әлі де барлық тәуелділіктерді іздеуіңіз керек. Сіз, әрине, көмегімен құрастыру өлшемін азайта аласыз көп сатылы құрылыстар бірақ бұл көп жұмыс істеу керек дегенді білдіреді.

Бұл бәрі емес!

Alpine жұмыс уақытында күтпеген қателерді тудыруы мүмкін

  • Теорияда musl glibc-пен үйлесімді, бірақ іс жүзінде айырмашылықтар көптеген мәселелерді тудыруы мүмкін. Ал егер олар болса, онда олар жағымсыз болуы мүмкін. Міне, кейбір мәселелер туындауы мүмкін:
  • Alpine әдепкі бойынша кішірек жіп стегі өлшеміне ие, бұл нәтижеге әкелуі мүмкін Python қателері
  • Кейбір пайдаланушылар мұны тапты Python қолданбалары баяу жұмыс істейді musl жадты қалай бөлетініне байланысты (glibc-тен өзгеше).
  • Пайдаланушылардың бірі күнді пішімдеу кезінде қате табылды

Әрине, бұл қателер түзетілді, бірақ әлі қанша екенін кім біледі.

Python үшін Альпі кескіндерін пайдаланбаңыз

Тәуелділіктер мен ықтимал қателерді іздеп, үлкен және ұзақ құрастырулармен айналысқыңыз келмесе, Alpine Linux қолданбасын негізгі кескін ретінде пайдаланбаңыз. Жақсы негізгі суретті таңдау.

Ақпарат көзі: www.habr.com

пікір қалдыру