Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1

I løpet av de siste åtte årene har jeg flyttet denne boksen med videobånd til fire forskjellige leiligheter og ett hus. Familievideoer fra min barndom.

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1

Etter mer enn 600 timers arbeid digitaliserte og organiserte jeg dem endelig slik at kassettene kan kastes.

Часть 2


Slik ser opptakene ut nå:

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1
Alle familievideoer er digitalisert og tilgjengelig for visning fra en privat medieserver

Dette resulterte i 513 individuelle videoklipp. Hver har en tittel, beskrivelse, opptaksdato, tagger for alle deltakere, som indikerer alderen på opptakstidspunktet. Alt er på en privat medieserver som bare familiemedlemmer har tilgang til, og hosting koster mindre enn $1 i måneden.

Denne artikkelen snakker om alt jeg har gjort, hvorfor det tok åtte år, og hvordan du oppnår det samme resultatet mye enklere og raskere.

Første naive forsøk

Rundt 2010 kjøpte moren min en slags VHS til DVD-konverter og kjørte alle hjemmevideoene våre gjennom den.

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1
De originale DVD-ene mamma spilte inn (vet ikke hva som skjedde med de manglende bokstavene)

Problemet er at mamma bare lagde ett sett med DVDer. Alle slektninger bor i forskjellige stater, så det var upraktisk å sende rundt plater.

I 2012 ga søsteren min meg disse DVD-ene. Jeg kopierte videofilene og lastet opp alt til skylagringen. Problem løst!

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1
DVD-ripper av familievideoer i Google Cloud-lagring

Noen uker senere spurte jeg om noen hadde sett båndene. Det viste seg at ingen så på. Jeg så ikke engang. I YouTube-æraen er det dumt å laste ned tre-timers filer med ukjent innhold på jakt etter interessante opptak.

Bare moren min var glad: "Flott," sa hun, "kan vi nå endelig kaste bort alle disse kassettene?"

Åh åh. Dette er et forferdelig spørsmål. Hva om vi gikk glipp av noen oppføringer? Hva om bånd kunne digitaliseres med høyere kvalitet? Hva om etikettene inneholder viktig informasjon?

Jeg har alltid følt meg ukomfortabel med å kaste originaler til det er absolutt sikkerhet for at videoen er kopiert til høyest mulig kvalitet. Dermed måtte jeg begynne å jobbe.

Jeg visste ikke engang hva jeg gikk inn på.

Høres ikke så vanskelig ut

Hvis du ikke forstår hvorfor det tok meg åtte år og hundrevis av timer, klandrer jeg deg ikke. Jeg trodde også det ville være enkelt.

Slik ser digitaliseringsprosessen ut fra start til slutt:

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1

Mer presist er det slik det ser ut i teorien. Slik ble det i praksis:

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1

Mesteparten av tiden gikk med til å omarbeide det som allerede var gjort. Jeg fullførte en etappe, og så etter en eller to etapper fant jeg en slags feil i teknikken. Jeg måtte gå tilbake og gjøre det på nytt. Jeg tok for eksempel video fra 20 kassetter før jeg skjønte at lyden var litt usynkronisert. Eller etter uker med redigering, fant jeg meg selv i å eksportere en video i et format som ikke ville støtte strømming på nettet.

For å redde leserens fornuft legger jeg opp prosessen som om den går fremover på en systematisk måte for ikke å holde deg til stadig å hoppe tilbake og gjøre om alt, slik jeg måtte.

Trinn 1 Ta opp video

Ok, tilbake til 2012. Mamma hadde veldig lyst til å kaste kassettene hun hadde oppbevart i tjue år, så da vi møttes første gang, ga hun meg en diger pappeske umiddelbart. Dermed startet min søken etter digitalisering.

Den åpenbare beslutningen var å overlate arbeidet til fagfolk. Mange bedrifter driver med digitalisering, og noen spesialiserer seg spesielt på hjemmevideo.

Men jeg er ganske sensitiv når det gjelder personvern, og jeg ville ikke at fremmede skulle se familievideoen vår med intime øyeblikk av mitt personlige liv, inkludert pottetrening (i riktig alder; ikke noe rart!). Og jeg tenkte også at det ikke er noe komplisert i digitalisering.

Spoiler: det viste seg å være veldig vanskelig.

Første forsøk på å ta video

Faren min hadde fortsatt familiens gamle videospiller, så jeg ba ham grave den ut av kjelleren til neste familiemiddag. jeg kjøpte billig RCA til USB-adapter på Amazon og begynte å jobbe.

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1
TOTMC videoopptaksenhet, den første av mange A/V-enheter jeg kjøpte under et flerårig oppdrag

For å behandle video fra en USB-opptaksenhet brukte jeg VirtualDub-programmet, 2012-versjonen er litt utdatert, men ikke kritisk.

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1
Rammer i VirtualDub-programmet, da jeg leste en bok for faren min i en alder av fire

Angrep med lydforvrengning

Da jeg startet redigeringsprosessen, la jeg merke til en liten usynkronisering mellom lyd og video. Ok ikke noe problem. Jeg kan flytte litt på lyden.

Ti minutter senere var han ute av synkronisering igjen. Flyttet jeg ikke litt på den første gangen?

Det gikk etterhvert opp for meg at lyd og video ikke bare er ute av synkronisering, de blir faktisk tatt opp med forskjellige hastigheter. Gjennom båndet divergerer de mer og mer. For å synkronisere måtte jeg manuelt justere lyden med noen få minutters mellomrom.

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1
Hvis oppsettet ditt fanger opp lyd og video med forskjellige hastigheter, er den eneste løsningen å manuelt korrigere lyden med noen få minutters mellomrom

Kan du forestille deg hvor vanskelig det er å skille lyd 10 millisekunder tidligere eller 10 millisekunder senere? Det er veldig vanskelig! Døm selv.

I denne videoen leker jeg med min stakkars, tålmodige kattunge, som heter Black Magic. Lyden er litt usynkronisert. Finn ut om det er foran bildet eller er det sent?


Et eksempel på et videoklipp med lyd og bilde usynkronisert

På dette tidspunktet hopper Black Magic, et fragment med en femdobbel nedgang:


Lyd og bilde ute av synkronisering, fem ganger tregere

svar: Lyden kommer med en forsinkelse på noen få millisekunder.

Kanskje bruke en ekstra hundre dollar i stedet for hundrevis av timer med personlig tid?

Lydkorreksjonen alene krevde mange timer med langtekkelig, vanvittig arbeid. Etter hvert gikk det opp for meg at desynkronisering kunne unngås ved å bruke en bedre og dyrere videoopptaksenhet. Etter litt undersøkelser kjøpte jeg en ny på Amazon:

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1
Mitt andre forsøk på å kjøpe videoopptaksenhet

Selv med den nye enheten forsvant ikke desynkroniseringen noe sted.

Videospiller med prefikset "super"

Kanskje problemet er med videospilleren. På digitaliseringsfora det ble sagt at det ikke ville være noen desynkronisering på en videospiller med en "tidsbasert korrektor" (TBC), denne funksjonen er tilgjengelig på alle Super VHS (S-VHS) videospillere.

Selvfølgelig! Hvorfor rotet jeg med de dumme ordinære Videospiller når tilgjengelig супер-VCR som løser problemet?

Ingen lager S-VHS videospillere lenger, men de er fortsatt tilgjengelige på eBay. For $179 kjøpte jeg en JVC SR-V10U-modell, som ser ut til å være godt egnet for VHS-digitalisering:

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1
Vintage JVC SR-V10U videospiller jeg kjøpte på eBay for $179

"Super" videospiller kom i posten. Etter flere måneder med å slite med usynkronisert lyd, var jeg overlykkelig over at det fantes utstyr som ville løse alle problemene mine.

Jeg åpnet boksen, koblet til alt – men lyden ble fortsatt tatt opp med en annen hastighet. Eh.

Kjedelig søk, feilsøking og år med kamp

Jeg tok fatt på et patetisk forsøk på feilsøking. Det var vondt å se på. Hver gang trakk jeg alt utstyret ut av skapet, krøp på kne bak skrivebordet for å koble til alt, prøvde å ta video – og så igjen at ingenting fungerte.

Jeg kom over et tilfeldig foruminnlegg fra 2008 om å installere en merkelig usignert kinesisk driver... Det er en forferdelig idé, men jeg er desperat. Han hjalp imidlertid ikke.

Jeg prøvde forskjellige digitaliseringsprogrammer. Kjøpt spesiell VHS-kassettfor å rengjøre videospillerens magnethoder. Kjøpt tredje videoopptaksenhet. Ingenting hjalp.

Jeg ga alltid opp, koblet fra alt og gjemte utstyret i et skap i noen måneder til.

Overgi deg og gi kassetter til fagfolk

Året 2018 er kommet. Jeg flyttet videobånd og tonnevis med utstyr rundt i fire forskjellige leiligheter og skulle flytte fra New York til Massachusetts. Jeg kunne ikke finne styrken til å ta dem igjen, fordi jeg allerede innså at jeg aldri ville fullføre dette prosjektet på egenhånd.

Jeg spurte familien om de kunne donere kassettene til et digitaliseringsfirma. Heldigvis var det ingen som protesterte – alle ville se postene på nytt.

Я: Men det betyr at noen bedrifter vil ha tilgang til alle hjemmevideoene våre. Passer det deg?
søster: Ja, jeg bryr meg. Du alene er bekymret. Vent, så du kunne bare ha betalt noen i utgangspunktet?
Я: Eh-uh...

Digitalisering av alle 45 kassetter koster 750 dollar. Det virker dyrt, men da hadde jeg betalt hva som helst for å slippe å håndtere dette utstyret lenger.

Da de overleverte filene, var videokvaliteten definitivt bedre. På rammene mine var forvrengninger alltid synlige i kantene av rammen, men spesialistene digitaliserte alt uten noen forvrengning i det hele tatt. Det viktigste er at lyd og video er perfekt synkronisert.

Her er en video som sammenligner profesjonell digitalisering og mine hjemmelagde forsøk:


Sammenligning av profesjonell og hjemmelaget digitalisering i videoen hvor mamma filmer mitt første forsøk på programmering

Trinn 2. Redigering

I hjemmeopptak er omtrent 90 % av materialet kjedelig, 8 % er interessant og 2 % er fantastisk. Etter digitalisering har du fortsatt mye arbeid å gjøre.

Redigering i Adobe Premiere

På en VHS-kassett er en lang strøm av videoklipp ispedd tomme deler. For å redigere et bånd, må du bestemme hvor hvert klipp starter og slutter.

For redigering brukte jeg Adobe Premiere Elements, som koster mindre enn $100 for en livstidslisens. Den viktigste funksjonen er en skalerbar tidslinje. Den lar deg raskt finne kantene på en scene og deretter zoome inn for å finne den nøyaktige videorammen der klippet begynner eller slutter.

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1
Viktig zoomtidslinje i Adobe Premiere Elements

Problemet med Premiere er at prosessen krever konstante manuelle trinn, men det tar også lang tid å digitalisere og eksportere. Her er operasjonssekvensen min:

  1. Åpne en råfil som inneholder 30-120 minutter med video.
  2. Marker grensene for et enkelt klipp.
  3. Eksporter klipp.
  4. Vent 2-15 minutter til eksporten er fullført.
  5. Gjenta trinn 2-4 til tapen går tom.

Den lange ventetiden gjorde at jeg hele tiden byttet frem og tilbake mellom videoredigering og en annen oppgave, og flyttet oppmerksomheten frem og tilbake i timevis.

En annen ulempe var manglende reproduserbarhet. Å fikse en liten feil var nesten like vanskelig som å starte fra bunnen av. Det slo meg hardt når det kom til å legge ut en video. Først da innså jeg at for å streame på Internett, var det nødvendig å eksportere videoen til et format som nettlesere naturlig støtter. Jeg sto overfor et valg: Start den kjedelige prosessen med å eksportere hundrevis av klipp på nytt, eller omkode de eksporterte videoene til et annet format med dårligere kvalitet.

Redigeringsautomatisering

Etter mye tid brukt på manuelt arbeid, lurte jeg på om AI kunne brukes her på en eller annen måte. Å bestemme grensene for klipp ser ut til å være en passende oppgave for maskinlæring. Jeg visste at nøyaktigheten ikke ville være perfekt, men la ham gjøre minst 80 % av arbeidet, så fikser jeg de siste 20 %.

Jeg eksperimenterte med et verktøy som heter pyscenedetect, som analyserer videofiler og sender ut tidsstempler der sceneendringer skjer:

 $ docker run 
    --volume "/videos:/opt" 
    handflucht/pyscenedetect 
    --input /opt/test.mp4 
    --output /opt 
    detect-content --threshold 80 
    list-scenes
[PySceneDetect] Output directory set:
  /opt
[PySceneDetect] Loaded 1 video, framerate: 29.97 FPS, resolution: 720 x 480
[PySceneDetect] Downscale factor set to 3, effective resolution: 240 x 160
[PySceneDetect] Scene list CSV file name format:
  $VIDEO_NAME-Scenes.csv
[PySceneDetect] Detecting scenes...
[PySceneDetect] Processed 55135 frames in 117.6 seconds (average 468.96 FPS).
[PySceneDetect] Detected 33 scenes, average shot length 55.7 seconds.
[PySceneDetect] Writing scene list to CSV file:
  /opt/test-Scenes.csv
[PySceneDetect] Scene List:
-----------------------------------------------------------------------
 | Scene # | Start Frame |  Start Time  |  End Frame  |   End Time   |
-----------------------------------------------------------------------
 |      1  |           0 | 00:00:00.000 |        1011 | 00:00:33.734 |
 |      2  |        1011 | 00:00:33.734 |        1292 | 00:00:43.110 |
 |      3  |        1292 | 00:00:43.110 |        1878 | 00:01:02.663 |
 |      4  |        1878 | 00:01:02.663 |        2027 | 00:01:07.634 |
 ...

Verktøyet viste en nøyaktighet på omtrent 80 %, men å sjekke arbeidet tok mer tid enn det sparte. Imidlertid gjorde pyscenedetect en av de viktigste oppdagelsene for hele prosjektet: å definere scenegrenser og eksportere klipp er separate oppgaver.

Jeg husket at jeg er programmerer

Frem til dette punktet anså jeg alt jeg gjorde i Adobe Premiere for å være "redigering". Å kutte klipp fra rårammer så ut til å gå hånd i hånd med å finne grensene til et klipp, for det var slik Premiere så for seg oppgaven. Da pyscenedetect skrev ut metadatatabellen, fikk det meg til å innse at jeg kunne skille scenesøk fra videoeksport. Det var et gjennombrudd.

Grunnen til at redigeringen var så kjedelig og tidkrevende var fordi jeg måtte vente mens Premiere eksporterte hvert klipp. Hvis jeg skulle skrive metadataene inn i et regneark og skrive et skript som automatisk eksporterer videoen, ville redigeringsprosessen fly avgårde.

Dessuten har regneark utvidet omfanget av metadata kraftig. Til å begynne med stapper jeg metadata inn i filnavnet, men dette begrenser dem. Ved å ha et helt regneark kunne jeg katalogisere mye mer informasjon om klippet, for eksempel hvem som var i det, når det ble spilt inn og andre data jeg vil vise når videoen vises.

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1
Gigantisk regneark med metadata om hjemmevideoene mine

Senere kunne jeg bruke disse metadataene til å legge til informasjon til klippene, som hvor gamle vi alle var og en detaljert beskrivelse av hva som skjer i klippet.

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1
Regnearkfunksjonalitet lar deg registrere metadata som gir mer informasjon om klipp og gjør dem enklere å se

Suksess for den automatiserte løsningen

Å ha regneark, skrev jeg manus, som kuttet rå video i klipp basert på CSV-data.

Slik ser det ut i aksjon:

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1

Nå har jeg brukt hundrevis av timer, kjedelig å velge klippgrenser i Premiere, trykke på eksport, vente noen minutter på at den skal fullføres, og så begynne på nytt. Ikke bare det, prosessen ble gjentatt flere ganger på de samme klippene da kvalitetsproblemer senere ble oppdaget.

Så snart jeg automatiserte skjæredelen av klipsene, falt en enorm vekt av skuldrene mine. Jeg trengte ikke lenger å bekymre meg for at jeg skulle glemme metadataene eller velge feil utdataformat. Hvis det oppstår en feil senere, kan du ganske enkelt justere skriptet og gjenta alt.

Часть 2

Digitalisering og redigering av videoopptak er bare halve kampen. Vi må fortsatt finne et praktisk alternativ for publisering på Internett, slik at alle pårørende kan se familievideoen i et praktisk format med strømming som på YouTube.

I den andre delen av artikkelen vil jeg detaljere hvordan du setter opp en åpen kildekode medieserver med alle videoklipp, som koster meg bare 77 cent per måned.

Fortsettelse,

Часть 2

Mitt åtte år lange forsøk på å digitalisere 45 videokassetter. Del 1

Kilde: www.habr.com