Microsoft
Хайлтын системд вектор хадгалалтыг ашиглах санаа нэлээд удаан хугацаанд хөвж байсан ч практик дээр векторуудтай ажиллах нөөцийн өндөр эрчимжилт, өргөтгөх чадварын хязгаарлалт зэргээс шалтгаалан тэдгээрийг хэрэгжүүлэхэд саад болж байна. Гүнзгий машин сургалтын аргуудыг ойролцоох хөршийн хайлтын алгоритмтай хослуулсан нь вектор системийн гүйцэтгэл, өргөтгөх чадварыг томоохон хайлтын системд хүлээн зөвшөөрөгдөх түвшинд хүргэх боломжтой болсон. Жишээлбэл, Bing-д 150 тэрбум гаруй вектор бүхий вектор индексийн хувьд хамгийн хамааралтай үр дүнг авах хугацаа 8 мс дотор байна.
Номын сан нь индекс үүсгэх, вектор хайлтыг зохион байгуулах хэрэгсэл, мөн векторын маш том цуглуулгыг хамарсан тархсан онлайн хайлтын системийг хадгалах хэрэгслүүдийг агуулдаг.
Номын сан нь цуглуулгад боловсруулсан, танилцуулсан өгөгдлийг холбогдох вектор хэлбэрээр форматлаж, харьцуулж болно гэсэн үг юм.
Үүний зэрэгцээ вектор хайлт нь зөвхөн текстээр хязгаарлагдахгүй бөгөөд мультимедиа мэдээлэл, зураг, түүнчлэн зөвлөмжийг автоматаар үүсгэх системд ашиглах боломжтой. Жишээлбэл, PyTorch систем дээр суурилсан прототипүүдийн нэг нь амьтан, муур, нохойн дүрс бүхий хэд хэдэн лавлах цуглуулгаас авсан өгөгдлийг ашиглан бүтээсэн зураг дээрх объектуудын ижил төстэй байдалд үндэслэн хайлт хийх вектор системийг хэрэгжүүлсэн бөгөөд тэдгээрийг векторын багц болгон хувиргасан. . Хайлтын зориулалтаар ирж буй зургийг хүлээн авахдаа түүнийг машин сургалтын загвар ашиглан вектор болгон хувиргаж, үүний үндсэн дээр SPTAG алгоритмыг ашиглан индексээс хамгийн төстэй векторуудыг сонгож, үр дүнд нь холбогдох зургуудыг буцаана.
Эх сурвалж: opennet.ru