Věděli jste, že od 15. října do 15. prosince se koná jedno z největších světových šampionátů v analýze seismických dat, Rosneft Seismic Challenge, s celkovým výherním fondem 1 milion rublů a finále 21. prosince v Moskvě?
Předpokládá se, že dostat se do ropného průmyslu, kde platy nejsou nižší než v IT průmyslu, je poměrně obtížné. Je na tom něco pravdy, protože obor je zcela specifický a neupřednostňuje lidi „nezapomenuté“. Tato událost si klade za cíl usnadnit mladým a talentovaným týmům pracujícím v oblasti rozpoznávání obrázků a strojového učení vstup do tohoto podzemního světa.
Toto téma zveřejňuji v sekci „I PR“, protože: a) chci pomoci svým spoluobyvatelům Ufy; b) Věřím ve vysokou kvalifikaci hackerů. A bude skvělé, když se někteří setkají s jinými. Zároveň strávím trochu času jako překladatel z technologického do lidského.
Jaká je tedy výzva?
Úkol zní takto: "Identifikace seismických horizontů v amplitudové krychli - segmentace dat pomocí rozpoznávání obrazu." Mistrovství
Překlad úkolu do ruštiny
Navzdory děsivému názvu je úkolem analýzy obrazu pomocí strojového učení. Ale jako obvykle existuje mnoho nuancí.
Seismický průzkum je hlavní metodou pro objevování ropy a plynu. Metoda je založena na buzení elastických vibrací a následném záznamu odezvy od hornin. Tyto vibrace se šíří tloušťkou země, lámou se a odrážejí na hranicích geologických vrstev s různými vlastnostmi. Odražené vlny se vracejí na povrch a jsou zaznamenány. Výstupem je tzv. seismická krychle, která je rozřezána na vrstvy vertikálně a horizontálně. Získáváme tyto druhy řezů (křížové čáry a mezičáry), které zobrazují horniny s různými vlastnostmi.
Úkolem účastníků je přesně určit a označit tyto vrstvy horizontu v celé seismické krychli na základě předběžného školení na 10 % krychle. Zatím to není těžké, že?
A nyní obecně uznávanými termíny:
„Korelace v seismickém průzkumu je chápána jako proces identifikace a sledování reflexních horizontů, různých seismických faciálních komplexů (útesy atd.) v čase, hloubce a prostoru, na seismogramech a celkových časových a hloubkových seismických datech.
V procesu sledování odrážejících horizonty se používá soubor kinematických a dynamických seismických atributů. V jejich komplexní analýze se korelace odrazných hranic vlnového pole v prostoru provádí sledováním nejvýraznějších extrémů (nebo přechodu přes 0) vlnového pole, přičemž se bere v úvahu především podobnost sousedních seismických stop.
Zároveň je zohledněna plynulost změny času registrace příchodu vlny. Čára spojující charakteristické rysy (extrémy) téže vlny na různých drahách se obvykle nazývá souběžná osa. Odražené vlny jsou obvykle korelovány podél nejvýraznějších extrémů (fází). V tomto případě se tlumočníci většinou drží zásady – od spolehlivějších k méně spolehlivým.
Nejprve budeme sledovat horizonty, které lze ve studijní oblasti práce s jistotou sledovat na velké ploše a mají správnou geologickou referenci. Takové odrážející horizonty se obvykle nazývají referenční nebo referenční horizonty. Jsou regionálními značkami. Jejich sledování a interpretace může významně zvýšit porozumění veškerému seismickému materiálu, tektonické historii a sedimentárním podmínkám.
Kirilov A.S., Zakrevsky K.E., Workshop o seismické interpretaci v PETREL. M.: NAKLADATELSTVÍ MAI-PRINT, 2014. - 288 s.
Potřebujete více informací?
Existuje velké množství referenčních informací o tomto problému v ruštině téměř v jakémkoli formátu. Včetně na Youtube. Můžete například uvést vynikající vizuální video o automatickém rozpoznávání seismických horizontů, které volně zpřístupnilo Kazaňské centrum pro další vzdělávání Ústavu geologických a geografických technologií KFU.
Zdá se mi, že poté by měl být úkol, který je součástí této výzvy, jasnější.
Dobře, co je potřeba udělat?
Na základě prvních 10 % seismické krychle, již označených profesionálním tlumočníkem, musíte označit zbývající řezy v testovacím datovém souboru podél hranic zadaných tříd s maximální metrickou hodnotou.
S čím pracovat?
Zdrojová datová sada je trojrozměrné pole seismických dat (souhrnná časová krychle seismických atributů). Jak bylo uvedeno výše, krychle může být reprezentována ve formě 2D vertikálních řezů: křížové čáry a vložené řádky.
Každý řez se skládá z jednorozměrných vektorů - stop o délce 2562 milisekund s krokem 2 ms. Počet řádků: 1896. Počet řádků: 2812.
Celkový počet stop > 5 milionů
Počet segmentačních tříd (tj. plemenných oddílů): 8.
Kdo se očekává na Seismic Challenge?
Organizátoři hledají k účasti odborníky z oblasti analýzy dat. Načasování je omezené a výzva je vhodná pro ty, kteří „již vědí, jak na to“. Soutěžního výběru se mohou zúčastnit jak jednotlivci, tak týmy až o pěti lidech.
Jak se zúčastnit?
Účastníci se registrují sami prostřednictvím webu
Termíny:
15.10.19 - 15.12.19 - pořádání soutěže
24.11.19 — konec možnosti kombinovat týmy
15.10.19 - 01.12.19 - první kolo soutěže
02.12.19 - 15.12.19 - druhé kolo soutěže pro nejlepších 30 týmů z prvního kola
21.12.19 - osobní sečtení a ocenění 10 týmů z druhého kola v Moskvě.
Zajímavá je organizace finále: odborná rada hodnotí závěrečné práce, ale neovlivňuje výběr vítězů. Rozdělení finalistů je určeno na základě výsledků korespondenční části soutěže na základě nejlepších metrik kvality segmentace (Dice Metrics). Účastníci zároveň mohou získat další bonus za nejlepší prezentaci svého řešení ve výši 50 000 rublů.
PS
Nejsem organizátorem této výzvy, takže je nepravděpodobné, že budu moci odpovědět na otázky podrobně v komentářích. Pokud budou mít Habráci dotazy/zájem, tak mohu pozvat zástupce organizátorů a kluky z boosterů, aby se vyjádřili.
Zdroj: www.habr.com