Billett til oljeindustrien eller Rosneft kaller for Seismic Challenge

Visste du at fra 15. oktober til 15. desember foregår et av verdens største mesterskap i seismisk dataanalyse, Rosneft Seismic Challenge, med en total premiefond på 1 million rubler og finalen 21. desember i Moskva?

Det antas at det er ganske vanskelig å komme inn i oljeindustrien, hvor lønningene ikke er dårligere enn IT-bransjen. Det er en viss sannhet i dette, fordi feltet er ganske spesifikt og favoriserer ikke folk «ut av løkken». Denne begivenheten har som mål å gjøre det lettere for unge og talentfulle team som jobber med bildegjenkjenning og maskinlæring å komme inn i denne underjordiske verdenen.

Billett til oljeindustrien eller Rosneft kaller for Seismic Challenge

Jeg legger ut dette emnet i "I PR"-delen fordi: a) jeg ønsker å hjelpe mine andre Ufa-beboere; b) Jeg tror på de høye kvalifikasjonene til hackerne. Og det vil være flott om noen møter andre. Samtidig skal jeg bruke litt tid som oversetter fra teknologisk til menneskelig.

Så hva er utfordringen?

Oppgaven høres slik ut: "Identifisering av seismiske horisonter i amplitudekuben - datasegmentering ved hjelp av bildegjenkjenning." Mesterskap lagt ut på Boosters.pro-plattformen. Arrangøren er bedriftsinstituttet BashNIPIneft LLC, en av lederne (merkelig nok) innen utvikling programvare for olje og gass. Et illustrerende eksempel på deres vellykkede arbeid er utviklingen og implementering av RN-GRID – proprietær industriell programvare for matematisk modellering og analyse av prosessen med å lage sprekker under hydraulisk frakturering.

Oversette oppgaven til russisk

Til tross for det skumle navnet, kommer oppgaven ned til bildeanalyse ved hjelp av maskinlæring. Men som vanlig er det mange nyanser.

Seismisk leting er hovedmetoden for å oppdage olje og gass. Metoden er basert på eksitering av elastiske vibrasjoner og påfølgende registrering av responsen fra bergarter. Disse vibrasjonene forplanter seg gjennom jordens tykkelse, blir brutt og reflektert ved grensene til geologiske lag med forskjellige egenskaper. De reflekterte bølgene går tilbake til overflaten og registreres. Utgangen er en såkalt seismisk kube, som kuttes i lag vertikalt og horisontalt. Vi får slike snitt (tverrlinjer og mellomlinjer), som viser bergarter med ulike egenskaper.

Billett til oljeindustrien eller Rosneft kaller for Seismic Challenge

Deltakernes oppgave er å nøyaktig bestemme og markere disse horisontlagene gjennom hele den seismiske kuben basert på foropplæring på 10 % av kuben. Det er ikke vanskelig foreløpig, ikke sant?

Og nå i allment aksepterte termer:

"Korrelasjon i seismisk leting forstås som prosessen med å identifisere og spore reflekterende horisonter, ulike seismiske fasieskomplekser (skjær osv.) i tid, dybde og rom, på seismogrammer og total seismiske data for tid og dybde.

I prosessen med å spore reflekterende horisonter, brukes et sett med kinematiske og dynamiske seismiske attributter. I deres komplekse analyse utføres korrelasjonen av de reflekterende grensene til bølgefeltet i rommet ved å spore de mest uttalte ekstrema (eller overgangen gjennom 0) av bølgefeltet, mens man hovedsakelig tar hensyn til likheten til nærliggende seismiske spor.

Samtidig tas det hensyn til jevnheten av endringen i tidspunktet for registrering av bølgeankomst. Linjen som forbinder de karakteristiske trekkene (ekstrema) til den samme bølgen på forskjellige baner kalles vanligvis i-fase-aksen. Reflekterte bølger er vanligvis korrelert langs de mest distinkte ytterpunktene (fasene). I dette tilfellet følger tolker vanligvis prinsippet - fra mer pålitelig til mindre pålitelig.

Først vil vi spore horisontene som i studieområdet kan spores trygt over et stort område og ha en skikkelig geologisk referanse. Slike reflekterende horisonter kalles vanligvis referanse- eller referansehorisonter. De er regionale markører. Sporingen og tolkningen deres kan øke forståelsen av alt seismisk materiale, tektonisk historie og sedimentære forhold betydelig."

Kirilov A.S., Zakrevsky K.E., Workshop on seismic interpretation in PETREL. M.: FORLAG MAI-PRINT, 2014. - 288 s.

Trenger du mer informasjon?

Det er en stor mengde referanseinformasjon om dette problemet på russisk i nesten alle formater. Inkludert på Youtube. For eksempel kan du sitere en utmerket visuell video om automatisk gjenkjennelse av seismiske horisonter, gjort fritt tilgjengelig av Kazan Center for Continuing Education ved Institute of Geological and Geographical Technologies of KFU.


For meg ser det ut til at etter dette bør oppgaven som ligger i utfordringen bli mer tydelig.

Ok, hva må gjøres?

Basert på de første 10 % av den seismiske kuben, som allerede er merket av en profesjonell tolk, må du merke de gjenværende skivene i testdatasettet langs grensene til de spesifiserte klassene med den maksimale metriske verdien.

Billett til oljeindustrien eller Rosneft kaller for Seismic Challenge

Hva skal man jobbe med?

Kildedatasettet er en tredimensjonal seismisk datamatrise (summert seismisk attributt-tidkube). Som nevnt ovenfor kan en kube representeres i form av 2D vertikale skiver: krysslinjer og inlines.

Billett til oljeindustrien eller Rosneft kaller for Seismic Challenge

Hver skive består av endimensjonale vektorer - spor med en lengde på 2562 millisekunder med et trinn på 2 ms. Antall krysslinjer: 1896. Antall innlinjer: 2812.
Totalt antall spor > 5 millioner

Antall segmenteringsklasser (dvs. raseinndelinger): 8.

Hvem forventes på Seismic Challenge?

Arrangørene søker eksperter fra dataanalysefeltet til å delta. Timingen er begrenset, og utfordringen passer for de som "allerede vet hvordan." Både enkeltpersoner og lag på inntil fem personer kan delta i konkurransen.

Hvordan delta?

Deltakerne melder seg på via nettsiden RN.DIGITAL. på nettstedet Boosters.pro. Ifølge statistikken var det per 4. november 402 lag registrert for å delta i konkurransen.

Datoer:

15.10.19 - 15.12.19 - holde en konkurranse
24.11.19 — slutten på muligheten til å kombinere lag
15.10.19 - 01.12.19 - første runde av konkurransen
02.12.19 - 15.12.19 - andre runde av konkurransen for de 30 beste lagene fra første runde
21.12.19 - personlig oppsummering og premiering av 10 lag fra andre runde i Moskva.

Organiseringen av finalen er interessant: et ekspertråd evaluerer de endelige arbeidene, men påvirker ikke valget av vinnere. Fordelingen av finalister bestemmes basert på resultatene fra korrespondansedelen av konkurransen basert på de beste segmenteringskvalitetsmålene (Dice Metrics). Samtidig kan deltakerne motta en ekstra bonus for den beste presentasjonen av løsningen deres i mengden 50 000 rubler.

PS

Jeg er ikke arrangøren av denne utfordringen, så det er usannsynlig at jeg kan svare på spørsmål i detalj i kommentarene. Hvis Habra-folket har spørsmål/interesse, så kan jeg invitere en representant for arrangørene og gutta fra boostere til å kommentere.

Kilde: www.habr.com

Legg til en kommentar