Nvidia мэдрэлийн сүлжээ нь энгийн тойм зургуудыг үзэсгэлэнтэй ландшафт болгон хувиргадаг

Nvidia мэдрэлийн сүлжээ нь энгийн тойм зургуудыг үзэсгэлэнтэй ландшафт болгон хувиргадаг
Тамхичин хүний ​​хүрхрээ, эрүүл хүний ​​хүрхрээ

Бид бүгд шар шувууг хэрхэн зурахаа мэддэг. Эхлээд та зууван, дараа нь өөр тойрог зурах хэрэгтэй, дараа нь - энэ нь гоёмсог шар шувуу болж хувирдаг. Мэдээжийн хэрэг, энэ бол хошигнол бөгөөд маш эртний зүйл боловч Nvidia-ийн инженерүүд уран зөгнөлийг бодит болгохыг хичээсэн.

Шинэ хөгжил, үүнийг GauGAN гэж нэрлэдэг бөгөөд маш энгийн ноорог зургуудаас (үнэхээр энгийн - тойрог, шугам гэх мэт) гоёмсог ландшафтуудыг бүтээдэг. Мэдээжийн хэрэг, энэхүү хөгжил нь орчин үеийн технологи, тухайлбал, үүсгэгч сөрөг мэдрэлийн сүлжээн дээр суурилдаг.

GauGAN нь өнгөлөг виртуал ертөнцийг бий болгох боломжийг олгодог - зөвхөн зугаацах төдийгүй ажлын зориулалтаар. Тиймээс, архитекторууд, ландшафтын дизайнерууд, тоглоом хөгжүүлэгчид - тэд бүгд хэрэгтэй зүйлийг сурч чадна. Хиймэл оюун ухаан нь хүний ​​юу хүсч байгааг шууд "ойлгож", анхны санааг асар их нарийн ширийн зүйлээр нөхдөг.

"Ухаалаг бийр нь чанартай зураг нэмснээр анхны ноорог зургийг нөхөж чаддаг тул GauGAN-ийн тусламжтайгаар дизайн боловсруулах тал дээр оюуны довтолгоо хийх нь илүү хялбар байдаг" гэж GauGAN-ийн нэг хөгжүүлэгч хэлэв.

Энэ хэрэгслийн хэрэглэгчид анхны санааг өөрчлөх, ландшафт эсвэл бусад зургийг өөрчлөх, тэнгэр, элс, далай гэх мэт зүйлсийг өөрчлөх боломжтой. Таны зүрх сэтгэлд хүссэн бүх зүйл, нэмэлт нь хэдхэн секунд болно.

Мэдрэлийн сүлжээг олон сая зургийн мэдээллийн санг ашиглан сургасан. Үүний ачаар систем нь хүн юу хүсч байгааг, хүссэн зүйлдээ хэрхэн хүрэхийг ойлгож чадна. Түүнээс гадна мэдрэлийн сүлжээ нь хамгийн жижиг нарийн ширийн зүйлийг мартдаггүй. Тиймээс, хэрэв та цөөрөм, түүний хажууд зарим модыг бүдүүвчээр зурвал ландшафтыг сэргээсний дараа ойролцоох бүх объектууд цөөрмийн усны толинд тусгагдах болно.

Та системд харагдахуйц гадаргуу нь ямар байх ёстойг хэлж болно - энэ нь өвс, цас, ус эсвэл элсээр бүрхэгдсэн байж болно. Энэ бүгдийг нэг секундын дотор өөрчлөх боломжтой бөгөөд ингэснээр цас элс болж, цаст зэлүүд газрын оронд зураач цөлийн ландшафтыг олж авдаг.

“Энэ бол модыг хаана байрлуулах, нар хаана, тэнгэр хаана байгааг бичсэн будгийн ном шиг. Дараа нь эхний даалгаврын дараа мэдрэлийн сүлжээ нь зургийг хөдөлгөж, шаардлагатай дэлгэрэнгүй мэдээлэл, бүтцийг нэмж, тусгалыг зурдаг. Энэ бүхэн бодит зураг дээр тулгуурладаг” гэж хөгжүүлэгчдийн нэг хэлэв.


Хэдийгээр систем нь бодит ертөнцийн талаар "ойлголтгүй" боловч систем нь гайхалтай ландшафтуудыг бий болгодог. Учир нь энд генератор ба ялгаварлагч гэсэн хоёр мэдрэлийн сүлжээ ашиглагддаг. Генератор нь дүрсийг үүсгэж, ялгагчдад харуулдаг. Тэрээр өмнө нь харсан сая сая зураг дээр үндэслэн хамгийн бодит хувилбаруудыг сонгодог.

Тийм ч учраас генератор тусгал хаана байх ёстойг "мэддэг". Энэ хэрэгсэл нь маш уян хатан бөгөөд олон тооны тохиргоогоор тоноглогдсон гэдгийг тэмдэглэх нь зүйтэй. Тиймээс, түүний тусламжтайгаар та тодорхой зураачийн хэв маягт тохируулан зурж болно, эсвэл нар мандах эсвэл жаргахыг хурдан нэмж тоглох боломжтой.

Систем нь хаа нэгтээгээс зүгээр л зураг авч, нэгтгэж, үр дүнг нь авдаг гэж хөгжүүлэгчид баталж байна. Үгүй ээ, бүх хүлээн авсан "зураг" үүсгэгдсэн. Өөрөөр хэлбэл, мэдрэлийн сүлжээ нь жинхэнэ зураач шиг (эсвэл бүр илүү сайн) "бүтээдэг".

Одоогоор уг програмыг чөлөөтэй ашиглах боломжгүй байгаа ч удахгүй ажил дээрээ турших боломжтой болно. Үүнийг Калифорнид болж буй GPU технологийн бага хурал 2019 дээр хийж болно. Үзэсгэлэнг үзэх боломжтой байсан азтанууд GauGAN-г туршиж үзэх боломжтой.

Мэдрэлийн сүлжээг бүтээлч үйл явцад оролцохыг эртнээс сургасаар ирсэн. Тухайлбал, өнгөрсөн жил тэдний зарим нь 3D загвар бүтээх боломжтой. Нэмж дурдахад DeepMind-ийн хөгжүүлэгчид зураг, гэрэл зураг, тойм зургуудаас гурван хэмжээст орон зай, объектыг сэргээхэд мэдрэлийн сүлжээг сургасан. Энгийн дүрсийг дахин бүтээхийн тулд мэдрэлийн сүлжээнд нэг зураг хэрэгтэй бөгөөд илүү төвөгтэй объектуудыг бий болгохын тулд "сургалт" хийхэд таван зураг шаардлагатай байдаг.

GauGAN-ийн хувьд энэ хэрэгсэл нь арилжааны зохистой хэрэглээг олох болно - бизнес, шинжлэх ухааны олон салбарт ийм үйлчилгээ шаардлагатай байдаг.

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх