مایکروسافت
علیرغم این واقعیت که ایده استفاده از ذخیره سازی برداری در موتورهای جستجو برای مدت طولانی مطرح بوده است، در عمل، اجرای آنها به دلیل شدت منابع بالای عملیات با بردارها و محدودیت های مقیاس پذیری با مشکل مواجه می شود. ترکیب روشهای یادگیری ماشین عمیق با الگوریتمهای تقریبی جستجوی نزدیکترین همسایه، این امکان را فراهم کرده است که عملکرد و مقیاسپذیری سیستمهای برداری را به سطح قابل قبولی برای موتورهای جستجوی بزرگ برساند. به عنوان مثال، در Bing، برای یک شاخص برداری بیش از 150 میلیارد بردار، زمان واکشی مرتبط ترین نتایج در 8 میلی ثانیه است.
این کتابخانه شامل ابزارهایی برای ایجاد فهرست و سازماندهی جستجوهای برداری، و همچنین مجموعه ای از ابزارها برای حفظ یک سیستم جستجوی آنلاین توزیع شده است که مجموعه های بسیار بزرگی از بردارها را پوشش می دهد.
کتابخانه دلالت بر این دارد که داده های پردازش شده و ارائه شده در مجموعه در قالب بردارهای مرتبط قالب بندی شده است که می توان بر اساس آن مقایسه کرد.
در عین حال، جستجوی برداری به متن محدود نمی شود و می تواند برای اطلاعات و تصاویر چند رسانه ای و همچنین در سیستم هایی برای تولید خودکار توصیه ها اعمال شود. به عنوان مثال، یکی از نمونههای اولیه مبتنی بر چارچوب PyTorch، یک سیستم برداری را برای جستجو بر اساس شباهت اشیاء در تصاویر پیادهسازی کرد که با استفاده از دادههای چندین مجموعه مرجع با تصاویر حیوانات، گربهها و سگها ساخته شد که به مجموعهای از بردارها تبدیل شدند. . هنگامی که یک تصویر دریافتی برای جستجو دریافت میشود، با استفاده از یک مدل یادگیری ماشینی به بردار تبدیل میشود که بر اساس آن مشابهترین بردارها با استفاده از الگوریتم SPTAG از فهرست انتخاب میشوند و در نتیجه تصاویر مرتبط برگردانده میشوند.
منبع: opennet.ru