Microsoft
Obwohl die Idee, Vektorspeicher in Suchmaschinen zu verwenden, schon seit geraumer Zeit im Umlauf ist, wird ihre Umsetzung in der Praxis durch die hohe Ressourcenintensität von Operationen mit Vektoren und Einschränkungen der Skalierbarkeit erschwert. Durch die Kombination von Deep-Machine-Learning-Methoden mit Algorithmen für die Suche nach ungefähren nächsten Nachbarn ist es möglich, die Leistung und Skalierbarkeit von Vektorsystemen auf ein für große Suchmaschinen akzeptables Niveau zu bringen. In Bing beispielsweise liegt die Zeit zum Abrufen der relevantesten Ergebnisse bei einem Vektorindex von über 150 Milliarden Vektoren innerhalb von 8 ms.
Die Bibliothek umfasst Tools zum Erstellen eines Index und zum Organisieren von Vektorsuchen sowie eine Reihe von Tools zum Verwalten eines verteilten Online-Suchsystems, das sehr große Vektorsammlungen abdeckt.
Die Bibliothek impliziert, dass die verarbeiteten und in der Sammlung dargestellten Daten in Form verwandter Vektoren formatiert sind, die auf der Grundlage dieser verglichen werden können
Dabei ist die Vektorsuche nicht auf Text beschränkt und kann auf multimediale Informationen und Bilder sowie in Systemen zur automatischen Generierung von Empfehlungen angewendet werden. Einer der auf dem PyTorch-Framework basierenden Prototypen implementierte beispielsweise ein Vektorsystem für die Suche auf der Grundlage der Ähnlichkeit von Objekten in Bildern, das unter Verwendung von Daten aus mehreren Referenzsammlungen mit Bildern von Tieren, Katzen und Hunden erstellt und in Vektorsätze umgewandelt wurde . Wenn ein eingehendes Bild zur Suche empfangen wird, wird es mithilfe eines maschinellen Lernmodells in einen Vektor umgewandelt, auf dessen Grundlage mithilfe des SPTAG-Algorithmus die ähnlichsten Vektoren aus dem Index ausgewählt und als Ergebnis die zugehörigen Bilder zurückgegeben werden.
Source: opennet.ru