nginx का उपयोग करके Google Drive से फ़ाइलें वितरित करना

पृष्ठभूमि

ऐसा हुआ कि मुझे कहीं 1.5 टीबी से अधिक डेटा संग्रहीत करने की आवश्यकता थी, और सामान्य उपयोगकर्ताओं को सीधे लिंक के माध्यम से इसे डाउनलोड करने की क्षमता भी प्रदान करनी थी। चूंकि परंपरागत रूप से इतनी मात्रा में मेमोरी वीडीएस में जाती है, किराए की लागत जो "कुछ नहीं करने के लिए" श्रेणी से परियोजना बजट में बहुत अधिक शामिल नहीं है, और स्रोत डेटा से मेरे पास वीपीएस 400 जीबी एसएसडी था, जहां, भले ही मैं चाहता था, मैं दोषरहित संपीड़न के बिना 1.5टीबी छवियाँ नहीं डाल सका, यह सफल होगा।

और फिर मुझे याद आया कि अगर मैं Google ड्राइव से जंक हटा देता हूं, जैसे प्रोग्राम जो केवल Windows XP पर चलेंगे, और अन्य चीजें जो उन दिनों से एक डिवाइस से दूसरे डिवाइस पर जा रही हैं जब इंटरनेट इतना तेज़ नहीं था, असीमित नहीं था ( उदाहरण के लिए, वर्चुअल बॉक्स के उन 10-20 संस्करणों में उदासीन के अलावा कोई मूल्य होने की संभावना नहीं थी), तो सब कुछ बहुत अच्छी तरह से फिट होना चाहिए। आपने कहा हमने किया। और इसलिए, एपीआई के लिए अनुरोधों की संख्या की सीमा को तोड़ते हुए (वैसे, तकनीकी सहायता ने बिना किसी समस्या के प्रति उपयोगकर्ता अनुरोधों का कोटा 100 सेकंड में 10 तक बढ़ा दिया), डेटा जल्दी से अपनी आगे की तैनाती के स्थान पर प्रवाहित हो गया .

सब कुछ अच्छा लग रहा है, लेकिन अब इसे अंतिम उपयोगकर्ता तक पहुंचाने की जरूरत है। इसके अलावा, अन्य संसाधनों पर किसी भी रीडायरेक्ट के बिना, लेकिन एक व्यक्ति बस "डाउनलोड" बटन दबाता है और क़ीमती फ़ाइल का खुश मालिक बन जाता है।

यहाँ, भगवान द्वारा, मैं सभी प्रकार की परेशानियों में पड़ गया। सबसे पहले यह AmPHP में एक स्क्रिप्ट थी, लेकिन मैं इसके द्वारा बनाए गए लोड से संतुष्ट नहीं था (शुरुआत में 100% कोर खपत में तेज उछाल)। फिर ReactPHP के लिए कर्ल रैपर चलन में आया, जो खपत किए गए CPU चक्रों की संख्या के संदर्भ में मेरी इच्छाओं में काफी फिट बैठता है, लेकिन वह गति बिल्कुल नहीं देता जो मैं चाहता था (यह पता चला कि आप कॉलिंग के अंतराल को आसानी से कम कर सकते हैं) कर्ल_मल्टी_सेलेक्ट, लेकिन फिर हमारे पास पहले विकल्प के समान लोलुपता है)। मैंने रस्ट में एक छोटी सेवा लिखने की भी कोशिश की, और यह बहुत तेज़ी से काम करती थी (यह आश्चर्य की बात है कि यह काम करती थी, मेरी जानकारी को देखते हुए), लेकिन मैं और अधिक चाहता था, और इसे अनुकूलित करना किसी तरह मुश्किल था। इसके अलावा, इन सभी समाधानों ने किसी तरह अजीब तरह से प्रतिक्रिया को बफर कर दिया, और मैं उस क्षण को ट्रैक करना चाहता था जब फ़ाइल डाउनलोड सबसे बड़ी सटीकता के साथ समाप्त हुआ।

सामान्य तौर पर, यह थोड़ी देर के लिए टेढ़ा था, लेकिन इसने काम किया। एक दिन पहले तक मैं एक ऐसे विचार के साथ आया जो अपने पागलपन में उल्लेखनीय था: nginx, सिद्धांत रूप में, जो मैं चाहता हूं वह कर सकता है, जल्दी से काम कर सकता है, और कॉन्फ़िगरेशन के साथ सभी प्रकार की विकृतियों की अनुमति भी दे सकता है। हमें प्रयास करना होगा - यदि यह काम कर गया तो क्या होगा? और आधे दिन की लगातार खोज के बाद, एक समाधान सामने आया जो कई महीनों से स्थिर रूप से काम कर रहा था और मेरी सभी आवश्यकताओं को पूरा करता था।

एनजीआईएनएक्स की स्थापना

# Первым делом создадим в конфигах нашего сайта отдельную локацию.
location ~* ^/google_drive/(.+)$ {

    # И закроем её от посторонних глаз (рук, ног и прочих частей тела).
    internal;

    # Ограничим пользователям скорость до разумных пределов (я за равноправие).
    limit_rate 1m;

    # А чтоб nginx мог найти сервера google drive укажем ему адрес резолвера.
    resolver 8.8.8.8;

    # Cоберем путь к нашему файлу (мы потом передадим его заголовками).
    set $download_url https://www.googleapis.com/drive/v3/files/$upstream_http_file_id?alt=media;

    # А так же Content-Disposition заголовок, имя файла мы передадим опять же в заголовках.
    set $content_disposition 'attachment; filename="$upstream_http_filename"';

    # Запретим буфферизировать ответ на диск.
    proxy_max_temp_file_size 0;

    # И, что немаловажно, передадим заголовок с токеном (не знаю почему, но в заголовках из $http_upstream токен передать не получилось. Вернее передать получилось, но скорей всего его где-то нужно экранировать, потому что гугл отдает ошибку авторизации).
    proxy_set_header Authorization 'Bearer $1';

    # И все, осталось отправить запрос гуглу по ранее собранному нами адресу.
    proxy_pass $download_url;

    # А чтоб у пользователя при скачивании отобразилось правильное имя файла мы добавим соответствующий заголовок.
    add_header Content-Disposition $content_disposition;

    # Опционально можно поубирать ненужные нам заголовки от гугла.
    proxy_hide_header Content-Disposition;
    proxy_hide_header Alt-Svc;
    proxy_hide_header Expires;
    proxy_hide_header Cache-Control;
    proxy_hide_header Vary;
    proxy_hide_header X-Goog-Hash;
    proxy_hide_header X-GUploader-UploadID;
}

टिप्पणियों के बिना एक संक्षिप्त संस्करण स्पॉइलर के नीचे देखा जा सकता है

location ~* ^/google_drive/(.+)$ {
    internal;
    limit_rate 1m;
    resolver 8.8.8.8;
    
    set $download_url https://www.googleapis.com/drive/v3/files/$upstream_http_file_id?alt=media;
    set $content_disposition 'attachment; filename="$upstream_http_filename"';
    
    proxy_max_temp_file_size 0;
    proxy_set_header Authorization 'Bearer $1';
    proxy_pass $download_url;
    
    add_header Content-Disposition $content_disposition;
    
    proxy_hide_header Content-Disposition;
    proxy_hide_header Alt-Svc;
    proxy_hide_header Expires;
    proxy_hide_header Cache-Control;
    proxy_hide_header Vary;
    proxy_hide_header X-Goog-Hash;
    proxy_hide_header X-GUploader-UploadID;
}

हम इस सारी ख़ुशी को प्रबंधित करने के लिए एक स्क्रिप्ट लिख रहे हैं

उदाहरण PHP में होगा और जानबूझकर न्यूनतम किट के साथ लिखा जाएगा। मुझे लगता है कि जिस किसी को भी किसी अन्य भाषा का अनुभव है, वह मेरे उदाहरण का उपयोग करके इस अनुभाग को एकीकृत करने में सक्षम होगा।

<?php

# Токен для Google Drive Api.
define('TOKEN', '*****');

# ID файла на гугл диске
$fileId = 'abcdefghijklmnopqrstuvwxyz1234567890';

# Опционально, но так как мы не передаем никаких данных - почему бы и нет?
http_response_code(204);

# Зададим заголовок c ID файла (в конфигах nginx мы потом получим его как $upstream_http_file_id).
header('File-Id: ' . $fileId);
# И заголовок с именем файла (соответственно $upstream_http_filename).
header('Filename: ' . 'test.zip');
# Внутренний редирект. А еще в адресе мы передадим токен, тот самый, что мы получаем из $1 в nginx.
header('X-Accel-Redirect: ' . rawurlencode('/google_drive/' . TOKEN));

परिणाम

सामान्य तौर पर, यह विधि किसी भी क्लाउड स्टोरेज से उपयोगकर्ताओं को फ़ाइलों के वितरण को व्यवस्थित करना काफी आसान बनाती है। हाँ, टेलीग्राम या वीके से भी, (बशर्ते कि फ़ाइल का आकार इस भंडारण के अनुमेय आकार से अधिक न हो)। मेरे पास भी ऐसा ही एक विचार था यह, लेकिन दुर्भाग्य से मुझे 2 जीबी तक की फ़ाइलें मिलती हैं, और मुझे अभी तक अपस्ट्रीम से प्रतिक्रियाओं को जोड़ने के लिए कोई विधि या मॉड्यूल नहीं मिला है, और इस परियोजना के लिए कुछ प्रकार के रैपर लिखना अनुचित रूप से श्रम-गहन है।

आपके ध्यान देने के लिए धन्यवाद! मुझे आशा है कि मेरी कहानी आपके लिए कम से कम थोड़ी दिलचस्प या उपयोगी होगी।

स्रोत: www.habr.com

एक टिप्पणी जोड़ें