Branje med notami: sistem prenosa podatkov znotraj glasbe

Branje med notami: sistem prenosa podatkov znotraj glasbe

Izrazite, česar besede ne morejo prenesti; občutite najrazličnejše čustva, ki se prepletajo v orkan občutkov; odtrgati se od zemlje, neba in celo vesolja samega, se podati na potovanje, kjer ni zemljevidov, cest, znakov; izumite, povejte in doživite celotno zgodbo, ki bo vedno ostala edinstvena in neponovljiva. Vse to zmore glasba - umetnost, ki obstaja že več tisoč let in razveseljuje naša ušesa in srca.

Vendar pa glasba ali bolje rečeno glasbena dela lahko služijo ne le za estetski užitek, temveč tudi za prenos informacij, ki so v njih kodirane, namenjene neki napravi in ​​poslušalcu nevidne. Danes se bomo seznanili z zelo nenavadno študijo, v kateri so podiplomski študenti ETH Zurich uspeli neopazno za človeško uho v glasbena dela vnesti določene podatke, zaradi katerih glasba sama postane kanal za prenos podatkov. Kako natančno so implementirali svojo tehnologijo, ali se melodije z in brez vgrajenih podatkov zelo razlikujejo in kaj so pokazali praktični preizkusi? O tem izvemo iz poročila raziskovalcev. pojdi

Raziskovalna osnova

Raziskovalci svojo tehnologijo imenujejo akustična tehnologija prenosa podatkov. Ko zvočnik predvaja spremenjeno melodijo, jo človek zazna kot običajno, pametni telefon pa lahko na primer prebere kodirane informacije med vrsticami oziroma tako rekoč med notami. Znanstveniki (dejstvo, da so ti fantje še vedno podiplomski študenti, jim ne preprečuje, da bi bili znanstveniki) imenujejo hitrost in zanesljivost prenosa ob ohranjanju ravni teh parametrov, ne glede na izbrano zvočno datoteko, kot najpomembnejši vidik pri izvajanju to tehniko prenosa podatkov. Psihoakustika, ki preučuje psihološke in fiziološke vidike človeškega zaznavanja zvokov, pomaga pri obvladovanju te naloge.

Jedro akustičnega prenosa podatkov lahko poimenujemo OFDM (ortogonalno frekvenčno multipleksiranje), ki je ob časovnem prilagajanju podnosilcev izvorni glasbi omogočil maksimalno izrabo oddanega frekvenčnega spektra za prenos informacij. Zahvaljujoč temu je bilo mogoče doseči hitrost prenosa 412 bps na razdalji do 24 metrov (stopnja napak < 10 %). Praktični poskusi, v katerih je sodelovalo 40 prostovoljcev, so potrdili dejstvo, da je skoraj nemogoče slišati razliko med originalno melodijo in tisto, v katero so bile informacije vgrajene.

Kje se lahko ta tehnologija uporablja v praksi? Raziskovalci imajo svoj odgovor: skoraj vsi sodobni pametni telefoni, prenosni računalniki in druge ročne naprave so opremljeni z mikrofoni, številni javni prostori (kavarne, restavracije, nakupovalni centri itd.) pa imajo zvočnike z glasbo v ozadju. Ta melodija v ozadju lahko na primer vključuje podatke za povezavo z omrežjem Wi-Fi brez dodatnih dejanj.

Splošne značilnosti akustičnega prenosa podatkov so nam postale jasne, zdaj pa preidimo na podrobno študijo strukture tega sistema.

Opis sistema

Vnos podatkov v melodijo nastane zaradi maskiranja frekvence. V časovnih režah se maskirne frekvence identificirajo in podnosilci OFDM blizu teh maskirnih elementov se napolnijo s podatki.

Branje med notami: sistem prenosa podatkov znotraj glasbe
Slika #1: Pretvorba izvirne datoteke v sestavljeni signal (melodija + podatki), ki se prenaša skozi zvočnike.

Za začetek je izvirni zvočni signal razdeljen na zaporedne segmente za analizo. Vsak tak segment (Hi) L = 8820 vzorcev, kar je enako 200 ms, se pomnoži z okno* za zmanjšanje mejnih učinkov.

okno* je utežna funkcija, ki se uporablja za nadzor učinkov zaradi stranskih režnjev v spektralnih ocenah.

Nato so bile zaznane prevladujoče frekvence izvirnega signala v območju od 500 Hz do 9.8 kHz, kar je omogočilo pridobitev maskirnih frekvenc fM,l za ta segment. Poleg tega so bili podatki poslani v majhnem območju od 9.8 do 10 kHz, da se določi lokacija podnosilcev na sprejemniku. Zgornja meja uporabljenega frekvenčnega območja je bila nastavljena na 10 kHz zaradi nizke občutljivosti mikrofonov pametnega telefona pri visokih frekvencah.

Frekvence maskiranja so bile določene za vsak analizirani segment posebej. Z uporabo metode HPS (Harmonic Product Spectrum) so bile identificirane tri dominantne frekvence in nato zaokrožene na najbližje note na harmonični kromatski lestvici. Tako so bile pridobljene glavne note fF,i = 1…3, ki ležijo med tipkama C0 (16.35 Hz) in B0 (30.87 Hz). Na podlagi dejstva, da so osnovne note prenizke za uporabo pri prenosu podatkov, so bile njihove višje oktave 500kfF,i izračunane v območju 9.8 Hz ... 2 kHz. Mnoge od teh frekvenc (fO,l1) so bile bolj izrazite zaradi narave HPS.

Branje med notami: sistem prenosa podatkov znotraj glasbe
Slika #2: Izračunane oktave fO,l1 za osnovne note in harmonike fH,l2 najmočnejšega tona.

Nastali nabor oktav in harmonikov je bil uporabljen kot maskirne frekvence, iz katerih so bile izpeljane podnosilne frekvence OFDM fSC,k. Pod vsako maskirno frekvenco sta bila vstavljena dva podnosilca.

Nato je bil spekter zvočnega segmenta Hi filtriran na frekvencah podnosilca fSC,k. Nato je bil na podlagi informacijskih bitov v Bi ustvarjen simbol OFDM, zaradi katerega je bilo mogoče sestavljeni segment Ci prenašati skozi zvočnik. Magnitude in faze podnosilcev morajo biti izbrane tako, da lahko sprejemnik izloči prenesene podatke, medtem ko poslušalec ne opazi sprememb v melodiji.

Branje med notami: sistem prenosa podatkov znotraj glasbe
Slika št. 3: del spektra in podnosilne frekvence Hi segmenta originalne melodije.

Ko se zvočni signal z zakodirano informacijo predvaja prek zvočnikov, ga mikrofon sprejemne naprave posname. Če želite najti začetne položaje vdelanih simbolov OFDM, je treba zapise najprej pasovno filtrirati. Na ta način se izloči zgornje frekvenčno območje, kjer ni glasbenih interferenčnih signalov med podnosilci. Začetek simbolov OFDM lahko najdete s ciklično predpono.

Po zaznavanju začetka simbolov OFDM sprejemnik z dekodiranjem visokofrekvenčne domene pridobi informacije o najbolj dominantnih notah. Poleg tega je OFDM precej odporen na ozkopasovne vire motenj, saj vplivajo le na nekatere od nosilcev.

Praktični preizkusi

Zvočnik KRK Rokit 8 je nastopal kot vir spremenjenih melodij, pametni telefon Nexus 5X pa je imel vlogo prejemnika.

Branje med notami: sistem prenosa podatkov znotraj glasbe
Slika #4: Razlika med dejanskim OFDM in korelacijskimi vrhovi, izmerjenimi v zaprtih prostorih na 5 m med zvočnikom in mikrofonom.

Večina točk OFDM leži v območju od 0 do 25 ms, tako da lahko najdete veljaven začetek znotraj ciklične predpone 66.6 ms. Raziskovalci ugotavljajo, da sprejemnik (v tem poskusu pametni telefon) upošteva, da se simboli OFDM predvajajo občasno, kar izboljša njihovo zaznavanje.

Najprej je bilo treba preveriti učinek razdalje na stopnjo bitnih napak (BER). Za to so bili izvedeni trije testi v različnih vrstah prostorov: hodnik s preprogo, pisarna z linolejem na tleh in avditorij z lesenim podom.


Za testni subjekt je bila izbrana pesem And The Cradle Will Rock Van Halena.

Glasnost zvoka je bila prilagojena tako, da je raven zvoka, ki jo je izmeril pametni telefon na razdalji 2 m od zvočnika, znašala 63 dB.

Branje med notami: sistem prenosa podatkov znotraj glasbe
Slika št. 5: Indikatorji BER glede na razdaljo med zvočnikom in mikrofonom (modra črta - občinstvo, zelena - hodnik, oranžna - pisarna).

Na hodniku je zvok 40 dB zajel pametni telefon na razdalji do 24 metrov od zvočnika. V učilnici na razdalji 15 m je bil zvok 55 dB, v pisarni na razdalji 8 metrov pa je raven zvoka, ki ga je zaznal pametni telefon, dosegla 57 dB.

Ker sta dvorana in pisarna bolj odmevna, pozni odmevi simbolov OFDM presegajo dolžino ciklične predpone in povečajo BER.

Odmev* - postopno zmanjševanje jakosti zvoka zaradi njegovih večkratnih odbojev.

Raziskovalci so nadalje pokazali vsestranskost svojega sistema, tako da so ga uporabili za 6 različnih pesmi iz treh žanrov (tabela spodaj).

Branje med notami: sistem prenosa podatkov znotraj glasbe
Tabela št. 1: pesmi, uporabljene v testih.

Prav tako lahko prek podatkov tabele vidimo bitno hitrost in stopnje bitnih napak za vsako skladbo. Hitrosti prenosa podatkov so različne, ker diferencialni BPSK (fazni zamik) deluje bolje, če se uporabljajo isti podnosilci. In to je mogoče, če sosednji segmenti vsebujejo enake maskirne elemente. Nenehno glasne pesmi zagotavljajo optimalno osnovo za skrivanje podatkov, ker so maskirne frekvence močneje prisotne v širokem frekvenčnem območju. Glasba s hitrim tempom lahko zaradi fiksne dolžine okna za analizo samo delno prikrije simbole OFDM.

Nato so ljudje začeli preizkušati sistem, ki je moral ugotoviti, katera melodija je izvirna in katera je bila spremenjena z informacijami, vgrajenimi vanjo. V ta namen so bili na posebni spletni strani objavljeni 12-sekundni odlomki pesmi iz tabele št.

V prvem poskusu (E1) je vsak udeleženec dobil spremenjen ali izviren fragment za poslušanje in se je moral odločiti, ali je fragment izviren ali spremenjen. V drugem poskusu (E2) so udeleženci lahko poslušali obe različici tolikokrat, kot so želeli, in se nato odločili, katera je izvirna in katera spremenjena.

Branje med notami: sistem prenosa podatkov znotraj glasbe
Tabela št. 2: rezultati poskusov E1 in E2.

Rezultati prvega eksperimenta imajo dva indikatorja: p(O|O) - odstotek udeležencev, ki so pravilno označili originalno melodijo in p(O|M) - odstotek udeležencev, ki so spremenjeno verzijo melodije označili kot izvirno.

Zanimivo je, da so nekateri udeleženci po besedah ​​raziskovalcev menili, da so določene spremenjene melodije bolj izvirne od izvirnika samega. Povprečje obeh poskusov kaže, da povprečni poslušalec ne bi opazil razlike med navadno melodijo in tisto, v katero so bili vdelani podatki.

Seveda bodo glasbeni strokovnjaki in glasbeniki v spremenjenih melodijah lahko odkrili nekaj netočnosti in sumljivih elementov, vendar ti elementi niso tako pomembni, da bi povzročali nelagodje.

In zdaj lahko tudi sami sodelujemo v poskusu. Spodaj sta dve različici iste melodije - izvirna in spremenjena. Ali slišite razliko?

Originalna različica melodije
vs
Spremenjena različica melodije

Za podrobnejšo seznanitev z odtenki študije priporočam ogled poročilo raziskovalna skupina.

Prav tako lahko prenesete ZIP arhiv zvočnih datotek izvirnih in spremenjenih melodij, uporabljenih v študiji, na ta povezava.

Epilog

V tem delu so podiplomski študenti ETH Zurich opisali neverjeten sistem prenosa podatkov v glasbi. Za to so uporabili frekvenčno maskiranje, ki je omogočilo vdelavo podatkov v melodijo, ki jo predvaja zvočnik. To melodijo zazna mikrofon naprave, ki prepozna skrite podatke in jih dekodira, medtem ko povprečen poslušalec razlike sploh ne bo opazil. V prihodnosti fantje načrtujejo razvoj svojega sistema in izbiro naprednejših metod za vnos podatkov v zvok.

Ko se kdo domisli nenavadnega, predvsem pa nečesa kar deluje, smo vedno veseli. A še večje veselje je, da so ta izum ustvarili mladi. Znanost nima starostnih omejitev. In če se mladim zdi znanost dolgočasna, potem je predstavljena tako rekoč z napačnega zornega kota. Konec koncev, kot vemo, je znanost neverjeten svet, ki nikoli ne neha presenečati.

petek off-top:


Ker smo že pri glasbi, bolje rečeno rocku, je tukaj čudovito popotovanje po prostranstvih rocka.


Queen, "Radio Ga Ga" (1984).

Hvala za branje, ostanite radovedni in lep vikend, fantje! 🙂

Hvala, ker ste ostali z nami. So vam všeč naši članki? Želite videti več zanimivih vsebin? Podprite nas tako, da oddate naročilo ali priporočite prijateljem, 30% popust za uporabnike Habr na edinstvenem analogu začetnih strežnikov, ki smo ga izumili za vas: Vsa resnica o VPS (KVM) E5-2650 v4 (6 jeder) 10 GB DDR4 240 GB SSD 1 Gbps od 20 USD ali kako deliti strežnik? (na voljo z RAID1 in RAID10, do 24 jeder in do 40 GB DDR4).

Dell R730xd 2-krat cenejši? Samo tukaj 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6 GHz 14C 64 GB DDR4 4 x 960 GB SSD 1 Gbps 100 TV od 199 $ na Nizozemskem! Dell R420 - 2x E5-2430 2.2 Ghz 6C 128 GB DDR3 2x960 GB SSD 1 Gbps 100 TB - od 99 $! Preberite o Kako zgraditi infrastrukturo Corp. razreda z uporabo strežnikov Dell R730xd E5-2650 v4 v vrednosti 9000 evrov za drobiž?

Vir: www.habr.com

Dodaj komentar