الپائن مرتب کرتا ہے ڈاکر ازگر کے لیے 50 گنا سست، اور تصاویر 2 گنا زیادہ بھاری ہیں۔

الپائن مرتب کرتا ہے ڈاکر ازگر کے لیے 50 گنا سست، اور تصاویر 2 گنا زیادہ بھاری ہیں۔

الپائن لینکس کو اکثر ڈوکر کے لیے بنیادی تصویر کے طور پر تجویز کیا جاتا ہے۔ آپ کو بتایا گیا ہے کہ الپائن استعمال کرنے سے آپ کی تعمیرات چھوٹی ہو جائیں گی اور آپ کی تعمیر کا عمل تیز ہو جائے گا۔

لیکن اگر آپ Python ایپلی کیشنز کے لیے الپائن لینکس استعمال کرتے ہیں، تو یہ:

  • آپ کی تعمیرات کو بہت سست بناتا ہے۔
  • آپ کی تصاویر کو بڑا بناتا ہے۔
  • اپنا وقت ضائع کرنا
  • اور آخر میں یہ رن ٹائم میں غلطیوں کا سبب بن سکتا ہے۔


آئیے دیکھتے ہیں کہ الپائن کی سفارش کیوں کی جاتی ہے، لیکن پھر بھی آپ کو اسے ازگر کے ساتھ کیوں استعمال نہیں کرنا چاہیے۔

لوگ الپائن کی سفارش کیوں کرتے ہیں؟

آئیے فرض کریں کہ ہمیں اپنی تصویر کے حصے کے طور پر جی سی سی کی ضرورت ہے اور ہم تعمیر کی رفتار اور حتمی تصویر کے سائز کے لحاظ سے الپائن لینکس بمقابلہ اوبنٹو 18.04 کا موازنہ کرنا چاہتے ہیں۔

سب سے پہلے، آئیے دو تصاویر ڈاؤن لوڈ کریں اور ان کے سائز کا موازنہ کریں:

$ docker pull --quiet ubuntu:18.04
docker.io/library/ubuntu:18.04
$ docker pull --quiet alpine
docker.io/library/alpine:latest
$ docker image ls ubuntu:18.04
REPOSITORY          TAG        IMAGE ID         SIZE
ubuntu              18.04      ccc6e87d482b     64.2MB
$ docker image ls alpine
REPOSITORY          TAG        IMAGE ID         SIZE
alpine              latest     e7d92cdc71fe     5.59MB

جیسا کہ آپ دیکھ سکتے ہیں، الپائن کے لیے بنیادی تصویر بہت چھوٹی ہے۔ آئیے اب جی سی سی کو انسٹال کرنے کی کوشش کریں اور اوبنٹو کے ساتھ شروع کریں:

FROM ubuntu:18.04
RUN apt-get update && 
    apt-get install --no-install-recommends -y gcc && 
    apt-get clean && rm -rf /var/lib/apt/lists/*

کامل Dockerfile لکھنا اس مضمون کے دائرہ کار سے باہر ہے۔

آئیے اسمبلی کی رفتار کی پیمائش کریں:

$ time docker build -t ubuntu-gcc -f Dockerfile.ubuntu --quiet .
sha256:b6a3ee33acb83148cd273b0098f4c7eed01a82f47eeb8f5bec775c26d4fe4aae

real    0m29.251s
user    0m0.032s
sys     0m0.026s
$ docker image ls ubuntu-gcc
REPOSITORY   TAG      IMAGE ID      CREATED         SIZE
ubuntu-gcc   latest   b6a3ee33acb8  9 seconds ago   150MB

ہم الپائن (ڈاکرفائل) کے لیے اسی کو دہراتے ہیں:

FROM alpine
RUN apk add --update gcc

ہم جمع کرتے ہیں، اسمبلی کے وقت اور سائز کو دیکھیں:

$ time docker build -t alpine-gcc -f Dockerfile.alpine --quiet .
sha256:efd626923c1478ccde67db28911ef90799710e5b8125cf4ebb2b2ca200ae1ac3

real    0m15.461s
user    0m0.026s
sys     0m0.024s
$ docker image ls alpine-gcc
REPOSITORY   TAG      IMAGE ID       CREATED         SIZE
alpine-gcc   latest   efd626923c14   7 seconds ago   105MB

جیسا کہ وعدہ کیا گیا ہے، الپائن پر مبنی تصاویر تیزی سے جمع کی جاتی ہیں اور چھوٹی ہوتی ہیں: 15 کے بجائے 30 سیکنڈ اور تصویر کا سائز 105MB بمقابلہ 150MB ہے۔ یہ بہت اچھا ہے!

لیکن اگر ہم ازگر کی ایپلی کیشن بنانے پر سوئچ کرتے ہیں، تو سب کچھ اتنا گلابی نہیں ہوتا۔

ازگر کی تصویر

ازگر کی ایپلی کیشنز اکثر پانڈوں اور میٹپلوٹلیب کا استعمال کرتی ہیں۔ لہذا، ایک آپشن یہ ہے کہ اس ڈاکر فائل کا استعمال کرتے ہوئے سرکاری ڈیبین پر مبنی تصویر لیں:

FROM python:3.8-slim
RUN pip install --no-cache-dir matplotlib pandas

آئیے اسے جمع کریں:

$ docker build -f Dockerfile.slim -t python-matpan.
Sending build context to Docker daemon  3.072kB
Step 1/2 : FROM python:3.8-slim
 ---> 036ea1506a85
Step 2/2 : RUN pip install --no-cache-dir matplotlib pandas
 ---> Running in 13739b2a0917
Collecting matplotlib
  Downloading matplotlib-3.1.2-cp38-cp38-manylinux1_x86_64.whl (13.1 MB)
Collecting pandas
  Downloading pandas-0.25.3-cp38-cp38-manylinux1_x86_64.whl (10.4 MB)
...
Successfully built b98b5dc06690
Successfully tagged python-matpan:latest

real    0m30.297s
user    0m0.043s
sys     0m0.020s

ہمیں 363MB سائز کی تصویر ملتی ہے۔
کیا ہم الپائن کے ساتھ بہتر کریں گے؟ کوشش کرتے ہیں:

FROM python:3.8-alpine
RUN pip install --no-cache-dir matplotlib pandas

$ docker build -t python-matpan-alpine -f Dockerfile.alpine .                                 
Sending build context to Docker daemon  3.072kB                                               
Step 1/2 : FROM python:3.8-alpine                                                             
 ---> a0ee0c90a0db                                                                            
Step 2/2 : RUN pip install --no-cache-dir matplotlib pandas                                                  
 ---> Running in 6740adad3729                                                                 
Collecting matplotlib                                                                         
  Downloading matplotlib-3.1.2.tar.gz (40.9 MB)                                               
    ERROR: Command errored out with exit status 1:                                            
     command: /usr/local/bin/python -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'/
tmp/pip-install-a3olrixa/matplotlib/setup.py'"'"'; __file__='"'"'/tmp/pip-install-a3olrixa/matplotlib/setup.py'"'"';f=getattr(tokenize, '"'"'open'"'"', open)(__file__);code=f.read().replace('"'"'rn'"'"', '"'"'n'"'"');f.close();exec(compile(code, __file__, '"'"'exec'"'"'))' egg_info --egg-base /tmp/pip-install-a3olrixa/matplotlib/pip-egg-info                              

...
ERROR: Command errored out with exit status 1: python setup.py egg_info Check the logs for full command output.
The command '/bin/sh -c pip install matplotlib pandas' returned a non-zero code: 1

کیا ہو رہا ہے

الپائن پہیوں کو سہارا نہیں دیتا

اگر آپ اس تعمیر کو دیکھیں، جو ڈیبین پر مبنی ہے، تو آپ دیکھیں گے کہ یہ matplotlib-3.1.2-cp38-cp38-manylinux1_x86_64 ڈاؤن لوڈ کرتا ہے۔WHL.

یہ وہیل کے لیے بائنری ہے۔ الپائن ذرائع `matplotlib-3.1.2.tar کو ڈاؤن لوڈ کرتا ہے۔gz` چونکہ یہ معیار کی حمایت نہیں کرتا ہے۔ پہیوں.

کیوں؟ لینکس کی زیادہ تر تقسیمیں C معیاری لائبریری کے GNU ورژن (glibc) کا استعمال کرتی ہیں، جو درحقیقت C میں لکھے گئے ہر پروگرام کے لیے ضروری ہے، بشمول Python۔ لیکن الپائن `musl` کا استعمال کرتا ہے، اور چونکہ وہ بائنریز `glibc` کے لیے ڈیزائن کی گئی ہیں، اس لیے وہ ایک آپشن نہیں ہیں۔

لہذا، اگر آپ الپائن استعمال کرتے ہیں، تو آپ کو ہر Python پیکیج میں C میں لکھا ہوا تمام کوڈ مرتب کرنا ہوگا۔

اوہ، ہاں، آپ کو ایسے تمام انحصاروں کی فہرست تلاش کرنی ہوگی جنہیں خود مرتب کرنے کی ضرورت ہے۔
اس صورت میں ہمیں یہ ملتا ہے:

FROM python:3.8-alpine
RUN apk --update add gcc build-base freetype-dev libpng-dev openblas-dev
RUN pip install --no-cache-dir matplotlib pandas

اور تعمیر میں وقت لگتا ہے...

... 25 منٹ 57 سیکنڈ! اور تصویر کا سائز 851MB ہے۔

الپائن پر مبنی تصاویر کو بنانے میں زیادہ وقت لگتا ہے، وہ سائز میں بڑی ہوتی ہیں، اور آپ کو اب بھی تمام انحصارات کو تلاش کرنے کی ضرورت ہے۔ آپ بلاشبہ استعمال کرکے اسمبلی کے سائز کو کم کرسکتے ہیں۔ ملٹی اسٹیج بناتا ہے۔ لیکن اس کا مطلب ہے کہ مزید کام کرنے کی ضرورت ہے۔

یہ سب کچھ نہیں ہے!

الپائن رن ٹائم میں غیر متوقع کیڑے پیدا کر سکتا ہے۔

  • نظریہ میں، musl glibc کے ساتھ مطابقت رکھتا ہے، لیکن عملی طور پر اختلافات بہت سے مسائل کا سبب بن سکتے ہیں۔ اور اگر وہ ہیں، تو وہ شاید ناگوار ہوں گے۔ یہاں کچھ مسائل ہیں جو پیدا ہوسکتے ہیں:
  • الپائن میں ڈیفالٹ کے لحاظ سے دھاگے کے اسٹیک کا سائز چھوٹا ہوتا ہے، جس کی وجہ سے ہو سکتا ہے۔ Python میں غلطیاں
  • کچھ صارفین نے یہ پایا ہے۔ ازگر کی ایپلی کیشنز سست ہیں۔ جس طرح سے musl میموری کو مختص کرتا ہے (glibc سے مختلف)۔
  • صارفین میں سے ایک تاریخ کو فارمیٹ کرتے وقت ایک خرابی ملی

یقیناً یہ غلطیاں پہلے ہی درست ہو چکی ہیں، لیکن کون جانتا ہے کہ مزید کتنی ہوں گی۔

Python کے لیے الپائن امیجز کا استعمال نہ کریں۔

اگر آپ بڑی اور لمبی تعمیرات سے پریشان نہیں ہونا چاہتے، انحصار اور ممکنہ غلطیوں کی تلاش کرتے ہیں، تو الپائن لینکس کو بنیادی تصویر کے طور پر استعمال نہ کریں۔ ایک اچھی بیس امیج کا انتخاب کرنا.

ماخذ: www.habr.com

نیا تبصرہ شامل کریں