Microsoft
Παρά το γεγονός ότι η ιδέα της χρήσης αποθήκευσης φορέα στις μηχανές αναζήτησης έχει επιπλέει εδώ και πολύ καιρό, στην πράξη, η εφαρμογή τους παρεμποδίζεται από την υψηλή ένταση πόρων των εργασιών με τους φορείς και τους περιορισμούς της επεκτασιμότητας. Ο συνδυασμός μεθόδων βαθιάς μηχανικής μάθησης με κατά προσέγγιση αλγόριθμους αναζήτησης πλησιέστερου γείτονα κατέστησε δυνατή την επίτευξη της απόδοσης και της επεκτασιμότητας των διανυσματικών συστημάτων σε επίπεδο αποδεκτό για μεγάλες μηχανές αναζήτησης. Για παράδειγμα, στο Bing, για έναν διανυσματικό δείκτη άνω των 150 δισεκατομμυρίων διανυσμάτων, ο χρόνος για να ληφθούν τα πιο σχετικά αποτελέσματα είναι εντός 8 ms.
Η βιβλιοθήκη περιλαμβάνει εργαλεία για τη δημιουργία ευρετηρίου και την οργάνωση διανυσματικών αναζητήσεων, καθώς και ένα σύνολο εργαλείων για τη διατήρηση ενός κατανεμημένου διαδικτυακού συστήματος αναζήτησης που καλύπτει πολύ μεγάλες συλλογές διανυσμάτων.
Η βιβλιοθήκη υποδηλώνει ότι τα δεδομένα που υποβάλλονται σε επεξεργασία και παρουσιάζονται στη συλλογή μορφοποιούνται με τη μορφή σχετικών διανυσμάτων που μπορούν να συγκριθούν με βάση
Ταυτόχρονα, η διανυσματική αναζήτηση δεν περιορίζεται σε κείμενο και μπορεί να εφαρμοστεί σε πληροφορίες και εικόνες πολυμέσων, καθώς και σε συστήματα αυτόματης δημιουργίας προτάσεων. Για παράδειγμα, ένα από τα πρωτότυπα που βασίζονται στο πλαίσιο PyTorch εφάρμοσε ένα διανυσματικό σύστημα αναζήτησης με βάση την ομοιότητα των αντικειμένων στις εικόνες, που κατασκευάστηκε χρησιμοποιώντας δεδομένα από διάφορες συλλογές αναφοράς με εικόνες ζώων, γατών και σκύλων, οι οποίες μετατράπηκαν σε σύνολα διανυσμάτων . Όταν μια εισερχόμενη εικόνα λαμβάνεται για αναζήτηση, μετατρέπεται χρησιμοποιώντας ένα μοντέλο μηχανικής μάθησης σε διάνυσμα, βάσει του οποίου επιλέγονται τα πιο παρόμοια διανύσματα από το ευρετήριο χρησιμοποιώντας τον αλγόριθμο SPTAG και ως αποτέλεσμα επιστρέφονται οι σχετικές εικόνες.
Πηγή: opennet.ru