Ohar arteko irakurketa: musikaren barneko datuen transmisio sistema

Ohar arteko irakurketa: musikaren barneko datuen transmisio sistema

Adierazi hitzek ezin dutena adierazi; sentimendu urakan batean nahastuta dauden hainbat emozio sentitzea; lurretik, zerutik eta baita Unibertsotik bertatik apurtu, maparik, errepiderik, seinalerik ez dagoen bidaia bat eginez; beti bakarra eta imitaezina izango den istorio oso bat asmatu, kontatu eta bizi. Hori guztia musikaren bidez egin daiteke, milaka urtez egon den eta gure belarriak eta bihotzak gozatzen dituen artea.

Dena den, musikak, edo hobeto esanda, musika-lanek, plazer estetikorako ez ezik, horietan kodetutako informazioa transmititzeko ere balio dezakete, gailu batzuetarako pentsatua eta entzulearentzat ikusezina. Gaur egun, oso ezohiko ikerketa bat ezagutuko dugu, zeinetan ETH Zuricheko graduondoko ikasleek, giza belarriak oharkabean, zenbait datu sartu musika-lanetan, eta, ondorioz, musika bera datu-transmisiorako kanal bihurtzen da. Zehazki nola inplementatu zuten beren teknologia, oso desberdinak al dira txertatutako datuekin eta gabe doinuak, eta zer erakutsi zuten proba praktikoek? Ikertzaileen txostenetik ezagutzen dugu horren berri. Zoaz.

Ikerketaren oinarria

Ikertzaileek euren teknologiari datuen transmisio akustikoko teknologia deitzen diote. Bozgorailu batek aldatutako melodia bat jotzen duenean, pertsona batek normaltzat hartzen du, baina, adibidez, telefono adimendun batek lerroen artean kodetutako informazioa irakur dezake, edo hobeto esanda, noten artean, nolabait esateko. Zientzialariek (mutil hauek oraindik graduondoko ikasleak izateak ez die zientzialari izatea eragozten) transmisioaren abiadurari eta fidagarritasunari deitzen diote parametro horien maila mantenduz, aukeratutako audio-fitxategia edozein dela ere, alderdi garrantzitsuena dela. datuak transferitzeko teknika hau. Psikoakustikak, gizakiak soinuen pertzepzioaren alderdi psikologiko eta fisiologikoak aztertzen dituena, zeregin horri aurre egiten laguntzen du.

Datu akustikoen transmisioaren muina OFDM (orthogonal frequency division multiplexing) dei daiteke, eta horrek, denboran zehar sorburuko musikara azpieramaileak egokitzearekin batera, transmititutako maiztasun-espektroa ahalik eta gehien aprobetxatzea ahalbidetu zuen informazioa transmititzeko. Horri esker, 412 bps-ko transmisio-abiadura lortu ahal izan zen 24 metroko distantzian (errore-tasa < % 10). 40 boluntariok parte hartu zuten esperimentu praktikoek baieztatu zuten ia ezinezkoa dela jatorrizko melodiaren eta informazioa txertatuta zegoenaren arteko aldea entzutea.

Non aplika daiteke teknologia hau praktikan? Ikertzaileek euren erantzuna dute: ia telefono adimendun, ordenagailu eramangarri eta eskuko gainerako gailu moderno guztiak mikrofonoz hornituta daude, eta leku publiko askotan (kafetegiak, jatetxeak, merkataritza zentroak...) bozgorailuak dituzte atzeko musikarekin. Atzeko planoko melodia honek, adibidez, Wi-Fi sare batera konektatzeko datuak sar ditzake ekintza gehigarririk egin beharrik gabe.

Datu akustikoen transmisioaren ezaugarri orokorrak argi geratu zaizkigu; orain sistema honen egituraren azterketa zehatza egitera pasa gaitezen.

Sistemaren deskribapena

Doinuan datuak sartzea maiztasunaren maskaratzearen ondorioz gertatzen da. Denbora-tarteetan, maskaratze-maiztasunak identifikatzen dira eta maskaratze-elementu horietatik hurbil dauden OFDM azpieramaileak datuz betetzen dira.

Ohar arteko irakurketa: musikaren barneko datuen transmisio sistema
1. irudia: jatorrizko fitxategia bozgorailuetatik transmititutako seinale konposatu batean (melodia + datuak) bihurtzea.

Hasteko, jatorrizko audio-seinalea ondoz ondoko segmentutan banatzen da aztertzeko. Horrelako segmentu bakoitza (Hi) L = 8820 lagin, 200 ms-ren berdina, biderkatu egiten da. leihoa* muga-efektuak minimizatzeko.

Leihoa* estimazio espektraletan albo-loboen ondoriozko efektuak kontrolatzeko erabiltzen den haztapen-funtzioa da.

Jarraian, jatorrizko seinalearen maiztasun nagusiak detektatu ziren 500 Hz-tik 9.8 kHz bitarteko tartean, eta horrek fM,l maskaratze-maiztasunak lortu ahal izan zituen segmentu honetarako. Horrez gain, datuak 9.8 eta 10 kHz arteko tarte txikian transmititzen ziren hargailuaren azpieramaileen kokapena ezartzeko. Erabilitako maiztasun-barrutiaren goiko muga 10 kHz-en ezarri zen, maiztasun altuko telefonoetako mikrofonoen sentsibilitate baxua zela eta.

Aztertutako segmentu bakoitzeko maskaratze-maiztasunak banan-banan zehaztu ziren. HPS (Harmonic Product Spectrum) metodoa erabiliz, hiru maiztasun nagusi identifikatu eta gero eskala kromatiko harmonikoan hurbilen dauden notetara biribildu ziren. Horrela lortu ziren fF,i = 1…3 nota nagusiak, C0 (16.35 Hz) eta B0 (30.87 Hz) teklaren artean kokatuta. Oinarrizko notak datu-transmisioan erabiltzeko baxuegiak direla kontuan hartuta, 500kfF,i zortzidun altuenak 9.8 Hz ... 2 kHz tartean kalkulatu ziren. Maiztasun horietako asko (fO,l1) nabarmenagoak ziren HPSaren izaeragatik.

Ohar arteko irakurketa: musikaren barneko datuen transmisio sistema
2. irudia: fO,l1 zortzidun kalkulatuak tonu indartsuenaren oinarrizko notetarako eta fH,l2 harmonikoetarako.

Ondorioz, zortzidunen eta harmonikoen multzoa maskaratze-maiztasun gisa erabili zen, eta bertatik OFDM azpieramailearen fSC,k eratorri ziren. Bi azpieramaile txertatu ziren maskaratze-maiztasun bakoitzaren azpian eta gainean.

Ondoren, Hi audio-segmentuaren espektroa fSC,k azpieramailearen maiztasunetan iragazi zen. Horren ostean, OFDM sinbolo bat sortu zen Bi-ko informazio-bitetan oinarrituta, eta horren ondorioz, Ci segmentu konposatua bozgorailutik transmititu zitekeen. Azpieramaileen magnitudeak eta faseak aukeratu behar dira, hartzaileak transmititutako datuak atera ditzan, entzuleak melodian aldaketarik nabaritzen ez duen bitartean.

Ohar arteko irakurketa: musikaren barneko datuen transmisio sistema
3. irudia: jatorrizko melodiaren Hi segmentuaren espektroaren eta azpieramailearen maiztasunen zati bat.

Informazioa kodetuta duen audio-seinalea bozgorailuetatik erreproduzitzen denean, gailu hartzailearen mikrofonoak grabatzen du. Kapsulatutako OFDM sinboloen hasierako posizioak aurkitzeko, lehenik eta behin, erregistroak banda-pasa iragazi behar dira. Horrela, goiko maiztasun-tartea ateratzen da, non azpieramaileen artean musika-interferentzia-seinalerik ez dagoen. OFDM sinboloen hasiera aurrizki zikliko bat erabiliz aurki dezakezu.

OFDM sinboloen hasiera detektatu ondoren, hartzaileak ohar nagusienei buruzko informazioa lortzen du maiztasun handiko domeinu deskodetzearen bidez. Gainera, OFDM nahiko erresistentea da banda estuko interferentzia-iturriekiko, azpieramaile batzuei bakarrik eragiten baitiete.

Proba praktikoak

KRK Rokit 8 bozgorailuak aldatutako doinuen iturburu gisa jardun zuen, eta Nexus 5X telefonoak alderdi hartzailearen papera jokatu zuen.

Ohar arteko irakurketa: musikaren barneko datuen transmisio sistema
4. irudia: bozgorailuaren eta mikrofonoaren artean 5 m-ra neurtutako benetako OFDM eta korrelazio gailurren arteko aldea.

OFDM puntu gehienak 0 eta 25 ms arteko tartean daude, beraz, baliozko hasiera bat aurki dezakezu 66.6 ms aurrizki ziklikoaren barruan. Ikertzaileek ohartarazi dute hartzaileak (esperimentu honetan, smartphone bat) kontuan hartzen duela OFDM sinboloak aldian-aldian erreproduzitzen direla, eta horrek detekzioa hobetzen du.

Egiaztatu beharreko lehen gauza distantziaren eragina bit errore-tasa (BER) izan zen. Horretarako, hiru proba egin ziren mota ezberdinetako geletan: alfonbradun korridore batean, lurrean linoleoa duen bulego bat eta egurrezko zorua duen auditorio batean.


Van Halenen "And The Cradle Will Rock" abestia aukeratu zuten proba gisa.

Soinuaren bolumena egokitu zen, telefonoak bozgorailutik 2 m-ko distantziara neurtutako soinu maila 63 dB-koa izan zedin.

Ohar arteko irakurketa: musikaren barneko datuen transmisio sistema
5. irudia: BER adierazleak bozgorailuaren eta mikrofonoaren arteko distantziaren arabera (lerro urdina - audientzia, berdea - korridorea, laranja - bulegoa).

Pasilloan, 40 dB-ko soinua jaso zuen smartphone batek bozgorailutik 24 metrora arteko distantziara. Ikasgelan 15 m-ko distantzian soinua 55 dB zen, eta bulegoan 8 metroko distantzian telefonoak hautematen duen soinu maila 57 dB-ra iritsi zen.

Auditorioa eta bulegoa erreberberanteagoak direnez, OFDM sinboloen oihartzunek aurrizki ziklikoaren luzera gainditzen dute eta BER handitzen dute.

Erreberberazioa* - soinuaren intentsitatea pixkanaka murriztea bere isla anitzen ondorioz.

Ikertzaileek beren sistemaren aldakortasuna gehiago frogatu zuten hiru generotako 6 abesti ezberdinetan aplikatuz (beheko taula).

Ohar arteko irakurketa: musikaren barneko datuen transmisio sistema
1. taula: probetan erabilitako abestiak.

Gainera, taulako datuen bidez, abesti bakoitzaren bit-tasa eta bit-errore-tasak ikus ditzakegu. Datu-tasa desberdinak dira, BPSK diferentzialak (phase shift keying) hobeto funtzionatzen duelako azpieramaile berdinak erabiltzen direnean. Eta hori posible da ondoko segmentuek maskaratze-elementu berdinak dituztenean. Etengabeko abesti ozenek datuak ezkutatzeko oinarri ezin hobea eskaintzen dute, maskaratze-maiztasunak indartsuago daudelako maiztasun-tarte zabal batean. Erritmo bizkorreko musikak OFDM sinboloak partzialki ezkuta ditzake analisi-leihoaren luzera finkoa dela eta.

Jarraian, jendea sistema probatzen hasi zen, zein melodia zen jatorrizkoa eta bertan txertatutako informazioaren arabera aldatu behar zen. Horretarako, 12. taulako abestien 1 segundoko zatiak jarri ziren webgune berezi batean.

Lehenengo esperimentuan (E1), parte-hartzaile bakoitzari zati aldatu edo original bat eman zitzaion entzuteko eta zatia jatorrizkoa edo aldatua zen erabaki behar izan zuen. Bigarren esperimentuan (E2), parte-hartzaileek bi bertsioak nahi adina aldiz entzun ahal izan zituzten, eta ondoren erabaki zein zen jatorrizkoa eta zein aldatu zen.

Ohar arteko irakurketa: musikaren barneko datuen transmisio sistema
2. taula: E1 eta E2 esperimentuen emaitzak.

Lehenengo esperimentuaren emaitzek bi adierazle dituzte: p(O|O) - jatorrizko melodia behar bezala markatu duten parte-hartzaileen ehunekoa eta p(O|M) - melodiaren bertsio aldatua jatorrizko gisa markatu duten parte-hartzaileen ehunekoa.

Interesgarria da parte-hartzaile batzuek, ikertzaileen arabera, aldatutako zenbait doinu jatorrizkoa bera baino originalagotzat jo zituzten. Bi esperimentuen batez bestekoak iradokitzen du batez besteko entzuleak ez lukeela desberdintasunik nabarituko melodia arrunt baten eta datuak txertatuta zeuden baten artean.

Jakina, musika adituek eta musikariek aldatutako doinuetan zehaztasunik gabeko eta elementu susmagarri batzuk antzeman ahal izango dituzte, baina elementu horiek ez dira hain esanguratsuak ondoeza sortzeko.

Eta orain guk geuk parte har dezakegu esperimentuan. Jarraian, melodia beraren bi bertsio daude: jatorrizkoa eta aldatutakoa. Entzun al duzu aldea?

Doinuaren jatorrizko bertsioa
vs
Doinuaren bertsio aldatua

Ikerketaren Γ±abardurak zehatzago ezagutzeko, begiratzea gomendatzen dut txostena ikerketa taldea.

Azterketan erabilitako jatorrizko eta aldatutako doinuen audio fitxategien ZIP artxiboa ere deskarga dezakezu hemen lotura hau.

Epilogoa

Lan honetan, ETH Zuricheko graduondoko ikasleek musikaren barruan datuen transmisio sistema harrigarria deskribatu zuten. Horretarako, maiztasunaren maskaraketa erabili zuten, eta horri esker, datuak hiztunak jotzen zuen doinuan txertatzeko aukera izan zuten. Melodia hau gailuaren mikrofonoak hautematen du, ezkutuko datuak ezagutu eta deskodetzen dituena, batez besteko entzuleak ez du aldea ere nabarituko. Etorkizunean, mutilek beren sistema garatzeko asmoa dute, datuak audioan sartzeko metodo aurreratuagoak hautatuz.

Norbaitek ezohiko zerbait etortzen duenean, eta garrantzitsuena, funtzionatzen duen zerbait, beti gaude pozik. Baina are poz handiagoa da asmakizun hau gazteek sortu izana. Zientziak ez du adin mugarik. Eta gazteei zientzia aspergarria iruditzen bazaie, okerreko ikuspegitik aurkezten ari da, nolabait esateko. Azken finean, dakigunez, zientzia txunditzeari uzten ez dion mundu harrigarria da.

Ostirala off-top:


Musikaz edo, hobeto esanda, rock musikaz ari garenez, hona hemen rockaren zabalguneetan zehar bidaia zoragarri bat.


Queen, "Radio Ga Ga" (1984).

Eskerrik asko irakurtzeagatik, egon jakin-mina eta ondo pasa asteburua lagunok! πŸ™‚

Eskerrik asko gurekin geratzeagatik. Gustuko dituzu gure artikuluak? Eduki interesgarri gehiago ikusi nahi? Lagun iezaguzu eskaera bat eginez edo lagunei gomendatuz, % 30eko deskontua Habr erabiltzaileentzat sarrera-mailako zerbitzarien analogo berezi batean, guk zuk asmatu duguna: VPS (KVM) E5-2650 v4 (6 Nukleoak) 10GB DDR4 240GB SSD 1Gbps 20Gbps-ri buruzko egia osoa XNUMX $-tik edo zerbitzari bat nola partekatu? (RAID1 eta RAID10-ekin erabilgarri, 24 nukleoraino eta 40 GB DDR4 arte).

Dell R730xd 2 aldiz merkeagoa? Hemen bakarrik 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 telebista 199 $-tik aurrera Herbehereetan! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - 99 $-tik aurrera! Irakurri buruz Nola eraiki azpiegitura korporazioa. klasea Dell R730xd E5-2650 v4 zerbitzarien erabilerarekin 9000 euroko balioa duten zentimo baten truke?

Iturria: www.habr.com

Gehitu iruzkin berria