LasÄ«Å”ana starp notÄ«m: datu pārraides sistēma mÅ«zikas iekÅ”ienē

LasÄ«Å”ana starp notÄ«m: datu pārraides sistēma mÅ«zikas iekÅ”ienē

Izteikt to, ko vārdi nevar izteikt; sajust visdažādākās emocijas, kas savijas jÅ«tu viesuļvētrā; atrauties no zemes, debesÄ«m un pat no paÅ”a Visuma, dodoties ceļojumā, kur nav ne karÅ”u, ne ceļu, ne zÄ«mju; izdomā, izstāsti un piedzÄ«vo veselu stāstu, kas vienmēr paliks unikāls un neatkārtojams. To visu var paveikt mÅ«zika ā€“ māksla, kas pastāv jau daudzus tÅ«kstoÅ”us gadu un priecē mÅ«su ausis un sirdis.

Taču mÅ«zika, pareizāk sakot, mÅ«zikas darbi var kalpot ne tikai estētiskajam baudÄ«jumam, bet arÄ« tajos iekodētas, kaut kādai ierÄ«cei paredzētas un klausÄ«tājam neredzamas informācijas pārraidei. Å odien iepazÄ«simies ar ļoti neparastu pētÄ«jumu, kurā ETH CÄ«rihes maÄ£istranti spēja, cilvēka ausij nemanot, mÅ«zikas darbos ieviest noteiktus datus, kuru dēļ pati mÅ«zika kļūst par datu pārraides kanālu. Kā tieÅ”i viņi ieviesa savu tehnoloÄ£iju, vai melodijas ar un bez iegultajiem datiem ļoti atŔķiras, un ko parādÄ«ja praktiskie testi? Mēs par to uzzinām no pētnieku ziņojuma. Aiziet.

Pētījuma bāze

Pētnieki savu tehnoloÄ£iju sauc par akustisko datu pārraides tehnoloÄ£iju. Kad skaļrunis atskaņo modificētu melodiju, cilvēks to uztver kā normālu, bet, piemēram, viedtālrunis var nolasÄ«t kodētu informāciju starp rindām vai, tā sakot, starp notÄ«m. Zinātnieki (tas, ka Å”ie puiÅ”i joprojām ir maÄ£istranti, neliedz viņiem bÅ«t zinātniekiem) par svarÄ«gāko aspektu ievieÅ”anā sauc pārraides ātrumu un uzticamÄ«bu, vienlaikus saglabājot Å”o parametru lÄ«meni neatkarÄ«gi no izvēlētā audio faila. Ŕī datu pārsÅ«tÄ«Å”anas tehnika. Ar Å”o uzdevumu palÄ«dz tikt galā psihoakustika, kas pēta cilvēka skaņu uztveres psiholoÄ£iskos un fizioloÄ£iskos aspektus.

Akustisko datu pārraides kodolu var saukt par OFDM (ortogonālo frekvenču dalÄ«Å”anas multipleksÄ“Å”anu), kas lÄ«dz ar apakÅ”nesēju pielāgoÅ”anos avota mÅ«zikai laika gaitā ļāva maksimāli izmantot pārraidÄ«to frekvenču spektru informācijas pārraidei. Pateicoties tam, bija iespējams sasniegt pārraides ātrumu 412 bps attālumā lÄ«dz 24 metriem (kļūdu biežums < 10%). Praktiski eksperimenti, kuros piedalÄ«jās 40 brÄ«vprātÄ«gie, apstiprināja faktu, ka ir gandrÄ«z neiespējami sadzirdēt atŔķirÄ«bu starp oriÄ£inālo melodiju un to, kurā informācija tika iegulta.

Kur Å”o tehnoloÄ£iju var pielietot praksē? Pētniekiem ir sava atbilde: gandrÄ«z visi mÅ«sdienu viedtālruņi, klēpjdatori un citas rokas ierÄ«ces ir aprÄ«kotas ar mikrofoniem, un daudzās sabiedriskās vietās (kafejnÄ«cās, restorānos, tirdzniecÄ«bas centros utt.) ir skaļruņi ar fona mÅ«ziku. Å Ä« fona melodija, piemēram, var ietvert datus savienojuma izveidei ar Wi-Fi tÄ«klu bez nepiecieÅ”amÄ«bas veikt papildu darbÄ«bas.

Mums ir kļuvuÅ”as skaidras akustiskās datu pārraides vispārÄ«gās iezÄ«mes, tagad pāriesim pie Ŕīs sistēmas struktÅ«ras detalizētas izpētes.

Sistēmas apraksts

Datu ievadÄ«Å”ana melodijā notiek frekvenču maskÄ“Å”anas dēļ. Laika spraugās tiek identificētas maskÄ“Å”anas frekvences, un OFDM apakÅ”nesēji, kas atrodas tuvu Å”iem maskÄ“Å”anas elementiem, tiek aizpildÄ«ti ar datiem.

LasÄ«Å”ana starp notÄ«m: datu pārraides sistēma mÅ«zikas iekÅ”ienē
1. attēls: sākotnējā faila konvertÄ“Å”ana saliktā signālā (melodija + dati), kas tiek pārraidÄ«ts pa skaļruņiem.

Sākumā sākotnējais audio signāls tiek sadalÄ«ts secÄ«gos segmentos analÄ«zei. Katrs Ŕāds segments (Hi) no L = 8820 paraugiem, kas vienāds ar 200 ms, tiek reizināts ar logs* lai samazinātu robežu ietekmi.

Logs* ir svērÅ”anas funkcija, ko izmanto, lai kontrolētu efektus, ko rada sānu lāpstiņas spektrālos aprēķinos.

Tālāk tika noteiktas sākotnējā signāla dominējoŔās frekvences diapazonā no 500 Hz lÄ«dz 9.8 kHz, kas ļāva Å”im segmentam iegÅ«t maskÄ“Å”anas frekvences fM,l. Turklāt dati tika pārsÅ«tÄ«ti nelielā diapazonā no 9.8 lÄ«dz 10 kHz, lai noteiktu apakÅ”nesēju atraÅ”anās vietu uztvērējā. Izmantotā frekvenču diapazona augŔējā robeža tika iestatÄ«ta uz 10 kHz viedtālruņu mikrofonu zemās jutÄ«bas dēļ augstās frekvencēs.

MaskÄ“Å”anas frekvences tika noteiktas katram analizētajam segmentam atseviŔķi. Izmantojot HPS (Harmonic Product Spectrum) metodi, tika identificētas trÄ«s dominējoŔās frekvences un pēc tam noapaļotas lÄ«dz tuvākajām harmonikas hromatiskās skalas notÄ«m. Tādā veidā tika iegÅ«tas galvenās notis fF,i = 1ā€¦3, kas atrodas starp taustiņiem C0 (16.35 Hz) un B0 (30.87 Hz). Pamatojoties uz to, ka pamata notis ir pārāk zemas izmantoÅ”anai datu pārraidē, to augstākās oktāvas 500kfF,i tika aprēķinātas diapazonā 9.8 Hz ... 2 kHz. Daudzas no Ŕīm frekvencēm (fO,l1) bija izteiktākas HPS rakstura dēļ.

LasÄ«Å”ana starp notÄ«m: datu pārraides sistēma mÅ«zikas iekÅ”ienē
Attēls #2: Aprēķinātās oktāvas fO,l1 spēcīgākā toņa pamatnotīm un harmonikām fH,l2.

IegÅ«tais oktāvu un harmoniku kopums tika izmantots kā maskÄ“Å”anas frekvences, no kurām tika iegÅ«tas OFDM apakÅ”nesēja frekvences fSC,k. Zem un virs katras maskÄ“Å”anas frekvences tika ievietoti divi apakÅ”nesēji.

Pēc tam Hi audio segmenta spektrs tika filtrēts apakÅ”nesēja frekvencēs fSC,k. Pēc tam, pamatojoties uz Bi informācijas bitiem, tika izveidots OFDM simbols, kura dēļ caur skaļruni varēja pārraidÄ«t salikto segmentu Ci. ApakÅ”nesēju lielumi un fāzes ir jāizvēlas tā, lai uztvērējs varētu iegÅ«t pārraidÄ«tos datus, kamēr klausÄ«tājs nepamana izmaiņas melodijā.

LasÄ«Å”ana starp notÄ«m: datu pārraides sistēma mÅ«zikas iekÅ”ienē
Attēls Nr. 3: oriÄ£inālās melodijas Hi segmenta spektra daļa un apakÅ”nesēja frekvences.

Kad caur skaļruņiem tiek atskaņots audio signāls ar tajā kodētu informāciju, uztveroŔās ierÄ«ces mikrofons to ieraksta. Lai atrastu iegulto OFDM simbolu sākuma pozÄ«cijas, ierakstiem vispirms ir jāfiltrē joslas caurlaide. Tādā veidā tiek iegÅ«ts augŔējais frekvenču diapazons, kur starp apakÅ”nesējiem nav mÅ«zikas traucējumu signālu. OFDM simbolu sākumu var atrast, izmantojot ciklisku prefiksu.

Pēc OFDM simbolu sākuma noteikÅ”anas uztvērējs iegÅ«st informāciju par dominējoŔākajām notÄ«m, izmantojot augstfrekvences domēna dekodÄ“Å”anu. Turklāt OFDM ir diezgan izturÄ«gs pret Å”aurjoslas traucējumu avotiem, jo ā€‹ā€‹tie ietekmē tikai dažus apakÅ”nesējus.

Praktiskie testi

KRK Rokit 8 skaļrunis darbojās kā modificēto melodiju avots, un viedtālrunis Nexus 5X spēlēja saņēmēja lomu.

LasÄ«Å”ana starp notÄ«m: datu pārraides sistēma mÅ«zikas iekÅ”ienē
4. attēls: atŔķirÄ«ba starp faktiskajiem OFDM un korelācijas maksimumiem, kas mērÄ«ti telpās 5 m attālumā starp skaļruni un mikrofonu.

Lielākā daļa OFDM punktu atrodas diapazonā no 0 lÄ«dz 25 ms, tāpēc derÄ«gu sākumu varat atrast 66.6 ms cikliskā prefiksā. Pētnieki atzÄ«mē, ka uztvērējs (Å”ajā eksperimentā viedtālrunis) ņem vērā, ka OFDM simboli tiek atskaņoti periodiski, kas uzlabo to noteikÅ”anu.

Pirmā lieta, kas jāpārbauda, ā€‹ā€‹bija attāluma ietekme uz bitu kļūdu lÄ«meni (BER). Lai to paveiktu, tika veikti trÄ«s testi dažāda veida telpās: koridorā ar paklāju, birojā ar linoleju uz grÄ«das un auditorijā ar koka grÄ«du.


Par testa priekÅ”metu tika izvēlēta Van Halena dziesma ā€œAnd The Cradle Will Rockā€.

Skaņas skaļums tika noregulēts tā, lai viedtālruņa izmērītais skaņas līmenis 2 m attālumā no skaļruņa būtu 63 dB.

LasÄ«Å”ana starp notÄ«m: datu pārraides sistēma mÅ«zikas iekÅ”ienē
Attēls Nr.5: BER indikatori atkarībā no attāluma starp skaļruni un mikrofonu (zila līnija - auditorija, zaļa - koridors, oranža - birojs).

Gaitenī 40 dB skaņu uztvēra viedtālrunis līdz 24 metru attālumā no skaļruņa. Klasē 15 m attālumā skaņa bija 55 dB, savukārt birojā 8 metru attālumā viedtālruņa uztvertais skaņas līmenis sasniedza 57 dB.

Tā kā auditorija un birojs ir vairāk atbalsojuÅ”ies, vēlÄ«nās OFDM simbolu atbalsis pārsniedz cikliskā prefiksa garumu un palielina BER.

Reverberācija* - pakāpeniska skaņas intensitātes samazināŔanās tās daudzkārtējo atstarojumu dēļ.

Pētnieki arī demonstrēja savas sistēmas daudzpusību, piemērojot to 6 dažādām dziesmām no trīs žanriem (tabula zemāk).

LasÄ«Å”ana starp notÄ«m: datu pārraides sistēma mÅ«zikas iekÅ”ienē
Tabula Nr.1: testos izmantotās dziesmas.

Turklāt, izmantojot tabulas datus, mēs varam redzēt katras dziesmas bitu pārraides ātrumu un bitu kļūdu lÄ«meni. Datu pārraides ātrumi ir atŔķirÄ«gi, jo diferenciālā BPSK (fāzes maiņas atslēga) darbojas labāk, ja tiek izmantoti tie paÅ”i apakÅ”nesēji. Un tas ir iespējams, ja blakus esoÅ”ie segmenti satur vienādus maskÄ“Å”anas elementus. Nepārtraukti skaļas dziesmas nodroÅ”ina optimālu pamatu datu slēpÅ”anai, jo maskÄ“Å”anas frekvences ir spēcÄ«gākas plaŔā frekvenču diapazonā. Ātra ritma mÅ«zika var tikai daļēji maskēt OFDM simbolus analÄ«zes loga fiksētā garuma dēļ.

Pēc tam cilvēki sāka testēt sistēmu, kuriem bija jānosaka, kura melodija ir oriÄ£ināla un kura modificēta ar tajā iegultās informācijas palÄ«dzÄ«bu. Å im nolÅ«kam Ä«paŔā vietnē tika ievietoti 12 sekunžu gari dziesmu fragmenti no tabulas Nr.1.

Pirmajā eksperimentā (E1) katram dalībniekam tika dots vai nu modificēts, vai oriģināls fragments, ko klausīties, un viņam bija jāizlemj, vai fragments ir oriģināls vai modificēts. Otrajā eksperimentā (E2) dalībnieki varēja klausīties abas versijas tik reižu, cik vēlējās, un pēc tam izlemt, kura no tām bija oriģināla un kura modificēta.

LasÄ«Å”ana starp notÄ«m: datu pārraides sistēma mÅ«zikas iekÅ”ienē
Tabula Nr.2: eksperimentu E1 un E2 rezultāti.

Pirmā eksperimenta rezultātiem ir divi rādÄ«tāji: p(O|O) - to dalÄ«bnieku procentuālais daudzums, kuri pareizi atzÄ«mējuÅ”i oriÄ£inālo melodiju un p(O|M) - dalÄ«bnieku procentuālais daudzums, kuri atzÄ«mējuÅ”i melodijas modificēto versiju kā oriÄ£inālu.

Interesanti, ka daži dalÄ«bnieki, pēc pētnieku domām, uzskatÄ«ja, ka noteiktas pārveidotas melodijas ir oriÄ£inālākas par paÅ”u oriÄ£inālu. Abu eksperimentu vidējais rādÄ«tājs liecina, ka vidusmēra klausÄ«tājs nepamanÄ«s atŔķirÄ«bu starp parastu melodiju un melodiju, kurā ir iegulti dati.

LikumsakarÄ«gi, ka mÅ«zikas eksperti un mÅ«ziÄ·i izmainÄ«tajās melodijās varēs konstatēt dažas neprecizitātes un aizdomÄ«gus elementus, taču Å”ie elementi nav tik bÅ«tiski, lai radÄ«tu diskomfortu.

Un tagad mēs paÅ”i varam piedalÄ«ties eksperimentā. Zemāk ir divas vienas un tās paÅ”as melodijas versijas ā€“ oriÄ£inālā un modificētā. Vai dzirdat atŔķirÄ«bu?

Melodijas oriģinālā versija
vs
Melodijas modificēta versija

Detalizētākai iepazÄ«Å”anai ar pētÄ«juma niansēm iesaku aplÅ«kot Ziņot pētniecÄ«bas grupa.

Varat arÄ« lejupielādēt pētÄ«jumā izmantoto oriÄ£inālo un modificēto melodiju audio failu ZIP arhÄ«vu vietnē Å”o saiti.

Epilogs

Å ajā darbā ETH CÄ«rihes absolventi aprakstÄ«ja pārsteidzoÅ”u datu pārraides sistēmu mÅ«zikā. Lai to izdarÄ«tu, viņi izmantoja frekvenču maskÄ“Å”anu, kas ļāva iegult datus skaļruņa atskaņotajā melodijā. Å o melodiju uztver ierÄ«ces mikrofons, kas atpazÄ«st slēptos datus un tos atkodē, savukārt vidusmēra klausÄ«tājs atŔķirÄ«bu pat nepamanÄ«s. Nākotnē puiÅ”i plāno attÄ«stÄ«t savu sistēmu, izvēloties progresÄ«vākas metodes datu ievadÄ«Å”anai audio.

Kad kāds izdomā kaut ko neparastu un, pats galvenais, kaut ko, kas darbojas, mēs vienmēr esam priecÄ«gi. Taču vēl lielāks prieks ir par to, ka Å”o izgudrojumu radÄ«juÅ”i jaunieÅ”i. Zinātnei nav vecuma ierobežojumu. Un, ja jaunieÅ”iem zinātne Ŕķiet garlaicÄ«ga, tad tā tiek pasniegta, tā teikt, no nepareizā rakursa. Galu galā, kā mēs zinām, zinātne ir pārsteidzoÅ”a pasaule, kas nebeidz pārsteigt.

Piektdienas izlaidums:


Tā kā mēs runājam par mÅ«ziku vai drÄ«zāk rokmÅ«ziku, tad Å”eit ir brÄ«niŔķīgs ceļojums pa roka plaÅ”umiem.


Queen, "Radio Ga Ga" (1984).

Paldies, ka lasÄ«jāt, esiet zinātkārs un lai jums lieliska nedēļas nogale! šŸ™‚

Paldies, ka palikāt kopā ar mums. Vai jums patīk mūsu raksti? Vai vēlaties redzēt interesantāku saturu? Atbalsti mūs, pasūtot vai iesakot draugiem, 30% atlaide Habr lietotājiem unikālam sākuma līmeņa serveru analogam, ko mēs jums izgudrojām: Visa patiesība par VPS (KVM) E5-2650 v4 (6 kodoli) 10GB DDR4 240GB SSD 1Gbps no 20$ vai kā koplietot serveri? (pieejams ar RAID1 un RAID10, līdz 24 kodoliem un līdz 40 GB DDR4).

Dell R730xd 2 reizes lētāk? Tikai Å”eit 2x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV no 199$ NÄ«derlandē! Dell R420 ā€” 2x E5-2430 2.2 GHz 6C 128 GB DDR3 2x960 GB SSD 1 Gbps 100 TB ā€” no 99 USD! LasÄ«t par Kā izveidot infrastruktÅ«ras uzņēmumu klase ar Dell R730xd E5-2650 v4 serveru izmantoÅ”anu 9000 eiro par santÄ«mu?

Avots: www.habr.com

Pievieno komentāru