Microsoft
Mặc dù thực tế là ý tưởng sử dụng lưu trữ vectơ trong các công cụ tìm kiếm đã xuất hiện từ khá lâu, nhưng trên thực tế, việc triển khai chúng bị cản trở bởi cường độ tài nguyên cao của các hoạt động với vectơ và các hạn chế về khả năng mở rộng. Việc kết hợp các phương pháp học máy sâu với các thuật toán tìm kiếm lân cận gần nhất đã giúp mang lại hiệu suất và khả năng mở rộng của hệ thống vectơ đến mức có thể chấp nhận được đối với các công cụ tìm kiếm lớn. Ví dụ: trong Bing, đối với chỉ mục vectơ có hơn 150 tỷ vectơ, thời gian tìm nạp kết quả phù hợp nhất là trong vòng 8 mili giây.
Thư viện bao gồm các công cụ để xây dựng chỉ mục và tổ chức tìm kiếm vectơ, cũng như một bộ công cụ để duy trì hệ thống tìm kiếm trực tuyến phân tán bao gồm các bộ sưu tập vectơ rất lớn.
Thư viện ngụ ý rằng dữ liệu được xử lý và trình bày trong bộ sưu tập được định dạng dưới dạng các vectơ liên quan có thể so sánh dựa trên
Đồng thời, tìm kiếm vectơ không giới hạn ở văn bản và có thể được áp dụng cho thông tin và hình ảnh đa phương tiện, cũng như trong các hệ thống tự động tạo đề xuất. Ví dụ: một trong những nguyên mẫu dựa trên khung PyTorch đã triển khai hệ thống vectơ để tìm kiếm dựa trên sự giống nhau của các đối tượng trong hình ảnh, được xây dựng bằng dữ liệu từ một số bộ sưu tập tham chiếu có hình ảnh động vật, mèo và chó, được chuyển đổi thành bộ vectơ . Khi một hình ảnh đến được nhận để tìm kiếm, nó sẽ được chuyển đổi bằng mô hình học máy thành một vectơ, dựa trên đó các vectơ giống nhau nhất được chọn từ chỉ mục bằng thuật toán SPTAG và kết quả là các hình ảnh liên quan sẽ được trả về.
Nguồn: opennet.ru