Adierazi hitzek ezin dutena adierazi; sentimendu urakan batean nahastuta dauden hainbat emozio sentitzea; lurretik, zerutik eta baita Unibertsotik bertatik apurtu, maparik, errepiderik, seinalerik ez dagoen bidaia bat eginez; beti bakarra eta imitaezina izango den istorio oso bat asmatu, kontatu eta bizi. Hori guztia musikaren bidez egin daiteke, milaka urtez egon den eta gure belarriak eta bihotzak gozatzen dituen artea.
Dena den, musikak, edo hobeto esanda, musika-lanek, plazer estetikorako ez ezik, horietan kodetutako informazioa transmititzeko ere balio dezakete, gailu batzuetarako pentsatua eta entzulearentzat ikusezina. Gaur egun, oso ezohiko ikerketa bat ezagutuko dugu, zeinetan ETH Zuricheko graduondoko ikasleek, giza belarriak oharkabean, zenbait datu sartu musika-lanetan, eta, ondorioz, musika bera datu-transmisiorako kanal bihurtzen da. Zehazki nola inplementatu zuten beren teknologia, oso desberdinak al dira txertatutako datuekin eta gabe doinuak, eta zer erakutsi zuten proba praktikoek? Ikertzaileen txostenetik ezagutzen dugu horren berri. Zoaz.
Ikerketaren oinarria
Ikertzaileek euren teknologiari datuen transmisio akustikoko teknologia deitzen diote. Bozgorailu batek aldatutako melodia bat jotzen duenean, pertsona batek normaltzat hartzen du, baina, adibidez, telefono adimendun batek lerroen artean kodetutako informazioa irakur dezake, edo hobeto esanda, noten artean, nolabait esateko. Zientzialariek (mutil hauek oraindik graduondoko ikasleak izateak ez die zientzialari izatea eragozten) transmisioaren abiadurari eta fidagarritasunari deitzen diote parametro horien maila mantenduz, aukeratutako audio-fitxategia edozein dela ere, alderdi garrantzitsuena dela. datuak transferitzeko teknika hau. Psikoakustikak, gizakiak soinuen pertzepzioaren alderdi psikologiko eta fisiologikoak aztertzen dituena, zeregin horri aurre egiten laguntzen du.
Datu akustikoen transmisioaren muina OFDM (orthogonal frequency division multiplexing) dei daiteke, eta horrek, denboran zehar sorburuko musikara azpieramaileak egokitzearekin batera, transmititutako maiztasun-espektroa ahalik eta gehien aprobetxatzea ahalbidetu zuen informazioa transmititzeko. Horri esker, 412 bps-ko transmisio-abiadura lortu ahal izan zen 24 metroko distantzian (errore-tasa < % 10). 40 boluntariok parte hartu zuten esperimentu praktikoek baieztatu zuten ia ezinezkoa dela jatorrizko melodiaren eta informazioa txertatuta zegoenaren arteko aldea entzutea.
Non aplika daiteke teknologia hau praktikan? Ikertzaileek euren erantzuna dute: ia telefono adimendun, ordenagailu eramangarri eta eskuko gainerako gailu moderno guztiak mikrofonoz hornituta daude, eta leku publiko askotan (kafetegiak, jatetxeak, merkataritza zentroak...) bozgorailuak dituzte atzeko musikarekin. Atzeko planoko melodia honek, adibidez, Wi-Fi sare batera konektatzeko datuak sar ditzake ekintza gehigarririk egin beharrik gabe.
Datu akustikoen transmisioaren ezaugarri orokorrak argi geratu zaizkigu; orain sistema honen egituraren azterketa zehatza egitera pasa gaitezen.
Sistemaren deskribapena
Doinuan datuak sartzea maiztasunaren maskaratzearen ondorioz gertatzen da. Denbora-tarteetan, maskaratze-maiztasunak identifikatzen dira eta maskaratze-elementu horietatik hurbil dauden OFDM azpieramaileak datuz betetzen dira.
1. irudia: jatorrizko fitxategia bozgorailuetatik transmititutako seinale konposatu batean (melodia + datuak) bihurtzea.
Hasteko, jatorrizko audio-seinalea ondoz ondoko segmentutan banatzen da aztertzeko. Horrelako segmentu bakoitza (Hi) L = 8820 lagin, 200 ms-ren berdina, biderkatu egiten da. leihoa* muga-efektuak minimizatzeko.
Leihoa* estimazio espektraletan albo-loboen ondoriozko efektuak kontrolatzeko erabiltzen den haztapen-funtzioa da.
Jarraian, jatorrizko seinalearen maiztasun nagusiak detektatu ziren 500 Hz-tik 9.8 kHz bitarteko tartean, eta horrek fM,l maskaratze-maiztasunak lortu ahal izan zituen segmentu honetarako. Horrez gain, datuak 9.8 eta 10 kHz arteko tarte txikian transmititzen ziren hargailuaren azpieramaileen kokapena ezartzeko. Erabilitako maiztasun-barrutiaren goiko muga 10 kHz-en ezarri zen, maiztasun altuko telefonoetako mikrofonoen sentsibilitate baxua zela eta.
Aztertutako segmentu bakoitzeko maskaratze-maiztasunak banan-banan zehaztu ziren. HPS (Harmonic Product Spectrum) metodoa erabiliz, hiru maiztasun nagusi identifikatu eta gero eskala kromatiko harmonikoan hurbilen dauden notetara biribildu ziren. Horrela lortu ziren fF,i = 1β¦3 nota nagusiak, C0 (16.35 Hz) eta B0 (30.87 Hz) teklaren artean kokatuta. Oinarrizko notak datu-transmisioan erabiltzeko baxuegiak direla kontuan hartuta, 500kfF,i zortzidun altuenak 9.8 Hz ... 2 kHz tartean kalkulatu ziren. Maiztasun horietako asko (fO,l1) nabarmenagoak ziren HPSaren izaeragatik.
2. irudia: fO,l1 zortzidun kalkulatuak tonu indartsuenaren oinarrizko notetarako eta fH,l2 harmonikoetarako.
Ondorioz, zortzidunen eta harmonikoen multzoa maskaratze-maiztasun gisa erabili zen, eta bertatik OFDM azpieramailearen fSC,k eratorri ziren. Bi azpieramaile txertatu ziren maskaratze-maiztasun bakoitzaren azpian eta gainean.
Ondoren, Hi audio-segmentuaren espektroa fSC,k azpieramailearen maiztasunetan iragazi zen. Horren ostean, OFDM sinbolo bat sortu zen Bi-ko informazio-bitetan oinarrituta, eta horren ondorioz, Ci segmentu konposatua bozgorailutik transmititu zitekeen. Azpieramaileen magnitudeak eta faseak aukeratu behar dira, hartzaileak transmititutako datuak atera ditzan, entzuleak melodian aldaketarik nabaritzen ez duen bitartean.
3. irudia: jatorrizko melodiaren Hi segmentuaren espektroaren eta azpieramailearen maiztasunen zati bat.
Informazioa kodetuta duen audio-seinalea bozgorailuetatik erreproduzitzen denean, gailu hartzailearen mikrofonoak grabatzen du. Kapsulatutako OFDM sinboloen hasierako posizioak aurkitzeko, lehenik eta behin, erregistroak banda-pasa iragazi behar dira. Horrela, goiko maiztasun-tartea ateratzen da, non azpieramaileen artean musika-interferentzia-seinalerik ez dagoen. OFDM sinboloen hasiera aurrizki zikliko bat erabiliz aurki dezakezu.
OFDM sinboloen hasiera detektatu ondoren, hartzaileak ohar nagusienei buruzko informazioa lortzen du maiztasun handiko domeinu deskodetzearen bidez. Gainera, OFDM nahiko erresistentea da banda estuko interferentzia-iturriekiko, azpieramaile batzuei bakarrik eragiten baitiete.
Proba praktikoak
KRK Rokit 8 bozgorailuak aldatutako doinuen iturburu gisa jardun zuen, eta Nexus 5X telefonoak alderdi hartzailearen papera jokatu zuen.
4. irudia: bozgorailuaren eta mikrofonoaren artean 5 m-ra neurtutako benetako OFDM eta korrelazio gailurren arteko aldea.
OFDM puntu gehienak 0 eta 25 ms arteko tartean daude, beraz, baliozko hasiera bat aurki dezakezu 66.6 ms aurrizki ziklikoaren barruan. Ikertzaileek ohartarazi dute hartzaileak (esperimentu honetan, smartphone bat) kontuan hartzen duela OFDM sinboloak aldian-aldian erreproduzitzen direla, eta horrek detekzioa hobetzen du.
Egiaztatu beharreko lehen gauza distantziaren eragina bit errore-tasa (BER) izan zen. Horretarako, hiru proba egin ziren mota ezberdinetako geletan: alfonbradun korridore batean, lurrean linoleoa duen bulego bat eta egurrezko zorua duen auditorio batean.
Van Halenen "And The Cradle Will Rock" abestia aukeratu zuten proba gisa.
Soinuaren bolumena egokitu zen, telefonoak bozgorailutik 2 m-ko distantziara neurtutako soinu maila 63 dB-koa izan zedin.
5. irudia: BER adierazleak bozgorailuaren eta mikrofonoaren arteko distantziaren arabera (lerro urdina - audientzia, berdea - korridorea, laranja - bulegoa).
Pasilloan, 40 dB-ko soinua jaso zuen smartphone batek bozgorailutik 24 metrora arteko distantziara. Ikasgelan 15 m-ko distantzian soinua 55 dB zen, eta bulegoan 8 metroko distantzian telefonoak hautematen duen soinu maila 57 dB-ra iritsi zen.
Auditorioa eta bulegoa erreberberanteagoak direnez, OFDM sinboloen oihartzunek aurrizki ziklikoaren luzera gainditzen dute eta BER handitzen dute.
Erreberberazioa* - soinuaren intentsitatea pixkanaka murriztea bere isla anitzen ondorioz.
Ikertzaileek beren sistemaren aldakortasuna gehiago frogatu zuten hiru generotako 6 abesti ezberdinetan aplikatuz (beheko taula).
1. taula: probetan erabilitako abestiak.
Gainera, taulako datuen bidez, abesti bakoitzaren bit-tasa eta bit-errore-tasak ikus ditzakegu. Datu-tasa desberdinak dira, BPSK diferentzialak (phase shift keying) hobeto funtzionatzen duelako azpieramaile berdinak erabiltzen direnean. Eta hori posible da ondoko segmentuek maskaratze-elementu berdinak dituztenean. Etengabeko abesti ozenek datuak ezkutatzeko oinarri ezin hobea eskaintzen dute, maskaratze-maiztasunak indartsuago daudelako maiztasun-tarte zabal batean. Erritmo bizkorreko musikak OFDM sinboloak partzialki ezkuta ditzake analisi-leihoaren luzera finkoa dela eta.
Jarraian, jendea sistema probatzen hasi zen, zein melodia zen jatorrizkoa eta bertan txertatutako informazioaren arabera aldatu behar zen. Horretarako, 12. taulako abestien 1 segundoko zatiak jarri ziren webgune berezi batean.
Lehenengo esperimentuan (E1), parte-hartzaile bakoitzari zati aldatu edo original bat eman zitzaion entzuteko eta zatia jatorrizkoa edo aldatua zen erabaki behar izan zuen. Bigarren esperimentuan (E2), parte-hartzaileek bi bertsioak nahi adina aldiz entzun ahal izan zituzten, eta ondoren erabaki zein zen jatorrizkoa eta zein aldatu zen.
2. taula: E1 eta E2 esperimentuen emaitzak.
Lehenengo esperimentuaren emaitzek bi adierazle dituzte: p(O|O) - jatorrizko melodia behar bezala markatu duten parte-hartzaileen ehunekoa eta p(O|M) - melodiaren bertsio aldatua jatorrizko gisa markatu duten parte-hartzaileen ehunekoa.
Interesgarria da parte-hartzaile batzuek, ikertzaileen arabera, aldatutako zenbait doinu jatorrizkoa bera baino originalagotzat jo zituzten. Bi esperimentuen batez bestekoak iradokitzen du batez besteko entzuleak ez lukeela desberdintasunik nabarituko melodia arrunt baten eta datuak txertatuta zeuden baten artean.
Jakina, musika adituek eta musikariek aldatutako doinuetan zehaztasunik gabeko eta elementu susmagarri batzuk antzeman ahal izango dituzte, baina elementu horiek ez dira hain esanguratsuak ondoeza sortzeko.
Eta orain guk geuk parte har dezakegu esperimentuan. Jarraian, melodia beraren bi bertsio daude: jatorrizkoa eta aldatutakoa. Entzun al duzu aldea?
vs
Ikerketaren Γ±abardurak zehatzago ezagutzeko, begiratzea gomendatzen dut
Azterketan erabilitako jatorrizko eta aldatutako doinuen audio fitxategien ZIP artxiboa ere deskarga dezakezu hemen
Epilogoa
Lan honetan, ETH Zuricheko graduondoko ikasleek musikaren barruan datuen transmisio sistema harrigarria deskribatu zuten. Horretarako, maiztasunaren maskaraketa erabili zuten, eta horri esker, datuak hiztunak jotzen zuen doinuan txertatzeko aukera izan zuten. Melodia hau gailuaren mikrofonoak hautematen du, ezkutuko datuak ezagutu eta deskodetzen dituena, batez besteko entzuleak ez du aldea ere nabarituko. Etorkizunean, mutilek beren sistema garatzeko asmoa dute, datuak audioan sartzeko metodo aurreratuagoak hautatuz.
Norbaitek ezohiko zerbait etortzen duenean, eta garrantzitsuena, funtzionatzen duen zerbait, beti gaude pozik. Baina are poz handiagoa da asmakizun hau gazteek sortu izana. Zientziak ez du adin mugarik. Eta gazteei zientzia aspergarria iruditzen bazaie, okerreko ikuspegitik aurkezten ari da, nolabait esateko. Azken finean, dakigunez, zientzia txunditzeari uzten ez dion mundu harrigarria da.
Ostirala off-top:
Musikaz edo, hobeto esanda, rock musikaz ari garenez, hona hemen rockaren zabalguneetan zehar bidaia zoragarri bat.
Queen, "Radio Ga Ga" (1984).
Eskerrik asko irakurtzeagatik, egon jakin-mina eta ondo pasa asteburua lagunok! π
Eskerrik asko gurekin geratzeagatik. Gustuko dituzu gure artikuluak? Eduki interesgarri gehiago ikusi nahi? Lagun iezaguzu eskaera bat eginez edo lagunei gomendatuz, % 30eko deskontua Habr erabiltzaileentzat sarrera-mailako zerbitzarien analogo berezi batean, guk zuk asmatu duguna:
Dell R730xd 2 aldiz merkeagoa? Hemen bakarrik
Iturria: www.habr.com