Microsoft
Arama motorlarında vektör depolamayı kullanma fikri uzun süredir ortalıkta dolaşıyor olmasına rağmen, pratikte bunların uygulanması, vektörler ve ölçeklenebilirlik sınırlamaları olan işlemlerin yüksek kaynak yoğunluğu nedeniyle engellenmektedir. Derin makine öğrenme yöntemlerinin yaklaşık en yakın komşu arama algoritmalarıyla birleştirilmesi, vektör sistemlerinin performansının ve ölçeklenebilirliğinin büyük arama motorları için kabul edilebilir bir düzeye getirilmesini mümkün kılmıştır. Örneğin Bing'de 150 milyardan fazla vektörden oluşan bir vektör dizini için en alakalı sonuçların getirilme süresi 8 ms'dir.
Kütüphane, bir dizin oluşturmaya ve vektör aramalarını organize etmeye yönelik araçların yanı sıra, çok geniş vektör koleksiyonlarını kapsayan dağıtılmış bir çevrimiçi arama sistemini sürdürmek için bir dizi araç içerir.
Kütüphane, koleksiyonda işlenen ve sunulan verilerin, aşağıdakilere dayalı olarak karşılaştırılabilecek ilgili vektörler biçiminde biçimlendirildiğini ima eder:
Aynı zamanda, vektör araması metinle sınırlı değildir ve multimedya bilgi ve görüntülerinin yanı sıra otomatik olarak öneriler üreten sistemlere de uygulanabilir. Örneğin, PyTorch çerçevesini temel alan prototiplerden biri, hayvanlar, kediler ve köpeklerin görüntülerinin vektör kümelerine dönüştürüldüğü çeşitli referans koleksiyonlarından elde edilen veriler kullanılarak oluşturulan, görüntülerdeki nesnelerin benzerliğine dayalı olarak arama yapmak için bir vektör sistemi uyguladı. . Arama için gelen bir görüntü alındığında, makine öğrenimi modeli kullanılarak bir vektöre dönüştürülür; buna göre en benzer vektörler SPTAG algoritması kullanılarak indeksten seçilir ve sonuç olarak ilişkili görüntüler döndürülür.
Kaynak: opennet.ru