Microsoft
Walaupun pada hakikatnya idea menggunakan storan vektor dalam enjin carian telah berlegar-legar sejak sekian lama, pada praktiknya, pelaksanaannya dihalang oleh keamatan sumber yang tinggi bagi operasi dengan vektor dan had kebolehskalaan. Menggabungkan kaedah pembelajaran mesin mendalam dengan anggaran algoritma carian jiran terdekat telah memungkinkan untuk membawa prestasi dan kebolehskalaan sistem vektor ke tahap yang boleh diterima untuk enjin carian yang besar. Contohnya, dalam Bing, untuk indeks vektor lebih 150 bilion vektor, masa untuk mendapatkan hasil yang paling berkaitan ialah dalam masa 8 ms.
Perpustakaan termasuk alat untuk membina indeks dan mengatur carian vektor, serta satu set alat untuk mengekalkan sistem carian dalam talian teragih yang meliputi koleksi vektor yang sangat besar.
Perpustakaan membayangkan bahawa data yang diproses dan dipersembahkan dalam koleksi diformatkan dalam bentuk vektor berkaitan yang boleh dibandingkan berdasarkan
Pada masa yang sama, carian vektor tidak terhad kepada teks dan boleh digunakan pada maklumat dan imej multimedia, serta dalam sistem untuk menjana cadangan secara automatik. Sebagai contoh, salah satu prototaip berdasarkan rangka kerja PyTorch melaksanakan sistem vektor untuk mencari berdasarkan persamaan objek dalam imej, dibina menggunakan data daripada beberapa koleksi rujukan dengan imej haiwan, kucing dan anjing, yang ditukarkan kepada set vektor . Apabila imej masuk diterima untuk carian, ia ditukar menggunakan model pembelajaran mesin kepada vektor, berdasarkan vektor yang paling serupa dipilih daripada indeks menggunakan algoritma SPTAG dan imej yang berkaitan dikembalikan sebagai hasilnya.
Sumber: opennet.ru