Προοίμιο: με τη θέληση της μοίρας, από τον κόσμο της ακαδημαϊκής επιστήμης (ιατρική), βρέθηκα στον κόσμο της πληροφορικής, όπου πρέπει να χρησιμοποιήσω τις γνώσεις μου για τη μεθοδολογία κατασκευής ενός πειράματος και στρατηγικές για την ανάλυση πειραματικών δεδομένων, ωστόσο, εφαρμόστε μια στοίβα τεχνολογίας που είναι νέα για μένα. Στη διαδικασία κατάκτησης αυτών των τεχνολογιών, συναντώ μια σειρά από δυσκολίες, οι οποίες, ευτυχώς, μέχρι στιγμής έχουν ξεπεραστεί. Ίσως αυτή η ανάρτηση να είναι χρήσιμη σε όσους επίσης μόλις αρχίζουν να εργάζονται με έργα Apache.
Έτσι, στο σημείο. Εμπνευσμένος
Επειδή οι συνήθεις οδηγίες για την εκτέλεση του Airflow δεν φαίνεται να ισχύουν σε περιβάλλον Windows, χρησιμοποιήστε το για να λύσετε αυτό το πρόβλημα
Ας περάσουμε από τα βήματα των οδηγιών (σπόιλερ - όλα πήγαν καλά στο 5ο βήμα):
1. Εγκατάσταση του υποσυστήματος Windows για Linux για επακόλουθη εγκατάσταση διανομών Linux
Αυτό είναι το μικρότερο από τα προβλήματα, όπως λένε:
Πίνακας ελέγχου → Προγράμματα → Προγράμματα και δυνατότητες → Ενεργοποίηση ή απενεργοποίηση λειτουργιών των Windows → Υποσύστημα Windows για Linux
2. Εγκαταστήστε τη διανομή Linux της επιλογής σας
Χρησιμοποίησα την εφαρμογή
3. Εγκατάσταση και ενημέρωση pip
sudo apt-get install software-properties-common
sudo apt-add-repository universe
sudo apt-get update
sudo apt-get install python-pip
4. Εγκατάσταση Apache Airflow
export SLUGIFY_USES_TEXT_UNIDECODE=yes
pip install apache-airflow
5. Αρχικοποίηση βάσης δεδομένων
Και εδώ ξεκίνησαν οι μικρές μου δυσκολίες. Οι οδηγίες απαιτούν να εισαγάγετε την εντολή airflow initdb
και προχωρήστε στο επόμενο βήμα. Ωστόσο, πάντα λάμβανα απάντηση airflow: command not found
. Είναι λογικό να υποθέσουμε ότι προέκυψαν δυσκολίες κατά την εγκατάσταση του Apache Airflow και τα απαραίτητα αρχεία απλά δεν είναι διαθέσιμα. Αφού βεβαιώθηκα ότι όλα ήταν εκεί που έπρεπε, αποφάσισα να προσπαθήσω να προσδιορίσω την πλήρη διαδρομή προς το αρχείο ροής αέρα (θα πρέπει να μοιάζει με αυτό: Полный/путь/до/файла/airflow initdb
). Όμως το θαύμα δεν έγινε και η απάντηση ήταν η ίδια airflow: command not found
. Προσπάθησα να χρησιμοποιήσω μια σχετική διαδρομή προς το αρχείο (./.local/bin/airflow initdb
), το οποίο οδήγησε σε νέο σφάλμα ModuleNotFoundError: No module named json'
που μπορεί να ξεπεραστεί με την ενημέρωση της βιβλιοθήκης εργαλείο (στην περίπτωσή μου μέχρι την έκδοση 0.15.4):
pip install werkzeug==0.15.4
Μπορείτε να διαβάσετε περισσότερα για το werkzeug
Μετά από αυτόν τον απλό χειρισμό η εντολή ./.local/bin/airflow initdb
ολοκληρώθηκε με επιτυχία.
6. Εκκίνηση του διακομιστή ροής αέρα
Αυτό δεν είναι το τέλος των δυσκολιών με την πρόσβαση στη ροή αέρα. Εκτέλεση εντολής ./.local/bin/airflow webserver -p 8080
οδήγησε σε σφάλμα No such file or directory
. Πιθανώς, ένας έμπειρος χρήστης του Ubuntu θα προσπαθούσε αμέσως να ξεπεράσει τέτοιες δυσκολίες με την πρόσβαση στο αρχείο χρησιμοποιώντας την εντολή export PATH=$PATH:~/.local/bin/
(δηλαδή, προσθήκη /.local/bin/ στην υπάρχουσα εκτελέσιμη διαδρομή αναζήτησης PATH), αλλά αυτή η ανάρτηση προορίζεται για όσους εργάζονται κυρίως με Windows και μπορεί να μην πιστεύουν ότι αυτή η λύση είναι προφανής.
Μετά τον χειρισμό που περιγράφεται παραπάνω, η εντολή ./.local/bin/airflow webserver -p 8080
ολοκληρώθηκε με επιτυχία.
7.URL:
Αν όλα πήγαν καλά στα προηγούμενα στάδια, τότε είστε έτοιμοι να κατακτήσετε αναλυτικές κορυφές.
Ελπίζω ότι η εμπειρία που περιγράφεται παραπάνω κατά την εγκατάσταση του Apache Airflow στα Windows 10 θα είναι χρήσιμη στους αρχάριους χρήστες και θα επιταχύνει την είσοδό τους στο σύμπαν των σύγχρονων εργαλείων ανάλυσης.
Την επόμενη φορά θα ήθελα να συνεχίσω το θέμα και να μιλήσω για την εμπειρία χρήσης του Apache Airflow στον τομέα της ανάλυσης της συμπεριφοράς των χρηστών εφαρμογών για κινητά.
Πηγή: www.habr.com