Čitanje između nota: sustav prijenosa podataka unutar glazbe

Čitanje između nota: sustav prijenosa podataka unutar glazbe

Izrazite ono što riječi ne mogu prenijeti; osjetiti najrazličitije emocije isprepletene u uragan osjećaja; otrgnuti se od zemlje, neba pa čak i od samog Svemira, krenuti na putovanje na kojem nema karata, cesta, znakova; osmislite, ispričajte i doživite cijelu priču koja će uvijek ostati jedinstvena i neponovljiva. Sve to može učiniti glazba - umjetnost koja postoji već mnogo tisuća godina i oduševljava naše uši i srca.

Međutim, glazba, odnosno glazbena djela, mogu služiti ne samo za estetski užitak, već i za prijenos informacija kodiranih u njima, namijenjenih nekom uređaju i nevidljivih slušatelju. Danas ćemo se upoznati s vrlo neobičnim istraživanjem u kojem su diplomirani studenti ETH Zurich uspjeli neprimjetno za ljudsko uho unijeti određene podatke u glazbena djela, zbog čega sama glazba postaje kanal prijenosa podataka. Kako su točno implementirali svoju tehnologiju, razlikuju li se melodije sa i bez ugrađenih podataka i što su pokazala praktična testiranja? O tome doznajemo iz izvješća istraživača. Ići.

Osnova istraživanja

Istraživači svoju tehnologiju nazivaju tehnologijom akustičnog prijenosa podataka. Kada zvučnik svira modificiranu melodiju, osoba to doživljava normalno, ali, na primjer, pametni telefon može čitati kodirane informacije između redaka, odnosno između nota, da tako kažemo. Znanstvenici (činjenica da su ovi momci još uvijek diplomirani studenti ne sprječava ih da budu znanstvenici) nazivaju brzinu i pouzdanost prijenosa uz održavanje razine ovih parametara, bez obzira na odabranu audio datoteku, kao najvažniji aspekt u implementaciji ova tehnika prijenosa podataka. Psihoakustika, koja proučava psihološke i fiziološke aspekte ljudske percepcije zvukova, pomaže u suočavanju s tim zadatkom.

Jezgrom akustičkog prijenosa podataka možemo nazvati OFDM (orthogonal frequency division multiplexing) koji je uz prilagodbu podnosača izvornoj glazbi tijekom vremena omogućio maksimalno korištenje emitiranog frekvencijskog spektra za prijenos informacija. Zahvaljujući tome, bilo je moguće postići brzinu prijenosa od 412 bps na udaljenosti do 24 metra (stopa pogreške < 10%). Praktični eksperimenti u kojima je sudjelovalo 40 volontera potvrdili su činjenicu da je gotovo nemoguće čuti razliku između originalne melodije i one u koju je informacija ugrađena.

Gdje se ova tehnologija može primijeniti u praksi? Istraživači imaju svoj odgovor: gotovo svi moderni pametni telefoni, prijenosna računala i drugi ručni uređaji opremljeni su mikrofonima, a mnoga javna mjesta (kafići, restorani, trgovački centri itd.) imaju zvučnike s pozadinskom glazbom. Ova pozadinska melodija može, primjerice, uključivati ​​podatke za povezivanje s Wi-Fi mrežom bez potrebe za dodatnim radnjama.

Opće značajke akustičkog prijenosa podataka postale su nam jasne, a sada prijeđimo na detaljnu studiju strukture ovog sustava.

Opis sistema

Uvođenje podataka u melodiju događa se zbog maskiranja frekvencije. U vremenskim odsječcima identificiraju se maskirne frekvencije i OFDM podnosači blizu ovih maskirnih elemenata popunjavaju se podacima.

Čitanje između nota: sustav prijenosa podataka unutar glazbe
Slika #1: Pretvaranje izvorne datoteke u kompozitni signal (melodija + podaci) koji se prenosi kroz zvučnike.

Za početak, izvorni audio signal se dijeli na uzastopne segmente za analizu. Svaki takav segment (Hi) od L = 8820 uzoraka, jednako 200 ms, množi se s prozor* kako bi se smanjili granični učinci.

Prozor* je funkcija ponderiranja koja se koristi za kontrolu učinaka zbog bočnih snopova u spektralnim procjenama.

Zatim su detektirane dominantne frekvencije originalnog signala u rasponu od 500 Hz do 9.8 kHz, što je omogućilo dobivanje maskirnih frekvencija fM,l za ovaj segment. Osim toga, podaci su odaslani u malom rasponu od 9.8 do 10 kHz kako bi se utvrdilo mjesto podnosača na prijemniku. Gornja granica korištenog frekvencijskog raspona postavljena je na 10 kHz zbog niske osjetljivosti mikrofona pametnog telefona na visokim frekvencijama.

Frekvencije maskiranja određene su za svaki analizirani segment pojedinačno. Koristeći HPS (Harmonic Product Spectrum) metodu, tri dominantne frekvencije su identificirane i zatim zaokružene na najbliže note na harmonijskoj kromatskoj ljestvici. Tako su dobivene glavne note fF,i = 1…3 koje se nalaze između tipki C0 (16.35 Hz) i B0 (30.87 Hz). Na temelju činjenice da su osnovne note preniske za korištenje u prijenosu podataka, njihove više oktave 500kfF,i izračunate su u rasponu od 9.8 Hz ... 2 kHz. Mnoge od ovih frekvencija (fO,l1) bile su izraženije zbog prirode HPS-a.

Čitanje između nota: sustav prijenosa podataka unutar glazbe
Slika #2: Izračunate oktave fO,l1 za osnovne note i harmonike fH,l2 najjačeg tona.

Rezultirajući skup oktava i harmonika korišten je kao maskirne frekvencije, iz kojih su izvedene OFDM frekvencije podnositelja fSC,k. Dva podnosača umetnuta su ispod i iznad svake frekvencije maskiranja.

Zatim je spektar Hi audio segmenta filtriran na frekvencijama podnosača fSC,k. Nakon toga je na temelju informacijskih bitova u Bi kreiran OFDM simbol, zahvaljujući kojemu se kroz zvučnik mogao prenositi kompozitni segment Ci. Veličine i faze podnosača moraju biti odabrane tako da prijamnik može izdvojiti odaslane podatke dok slušatelj ne primijeti promjene u melodiji.

Čitanje između nota: sustav prijenosa podataka unutar glazbe
Slika br. 3: dio spektra i podnosećih frekvencija Hi segmenta originalne melodije.

Kada se zvučni signal s informacijama kodiranim u njemu reproducira kroz zvučnike, mikrofon prijemnog uređaja ga snima. Da biste pronašli početne položaje ugrađenih OFDM simbola, zapise prvo treba filtrirati pojasnim prolazom. Na ovaj način izdvaja se gornji frekvencijski raspon, gdje nema glazbenih interferencijskih signala između podnosača. Početak OFDM simbola možete pronaći pomoću cikličkog prefiksa.

Nakon otkrivanja početka OFDM simbola, prijemnik dobiva informacije o najdominantnijim notama kroz dekodiranje visokofrekventne domene. Osim toga, OFDM je prilično otporan na uskopojasne izvore smetnji, budući da one utječu samo na neke od podnosača.

Praktični testovi

Kao izvor modificiranih melodija bio je zvučnik KRK Rokit 8, a primatelj je bio pametni telefon Nexus 5X.

Čitanje između nota: sustav prijenosa podataka unutar glazbe
Slika #4: Razlika između stvarnih OFDM i korelacijskih vrhova izmjerenih u zatvorenom prostoru na 5 m između zvučnika i mikrofona.

Većina OFDM točaka nalazi se u rasponu od 0 do 25 ms, tako da možete pronaći važeći početak unutar cikličkog prefiksa od 66.6 ms. Istraživači napominju da prijamnik (u ovom eksperimentu, pametni telefon) uzima u obzir da se OFDM simboli reprodukuju povremeno, što poboljšava njihovu detekciju.

Prvo što je trebalo provjeriti bio je učinak udaljenosti na stopu pogreške u bitovima (BER). Kako bi se to postiglo, provedena su tri testa u različitim vrstama prostorija: hodnik s tepihom, ured s linoleumom na podu i gledalište s drvenim podom.


Kao predmet testiranja odabrana je pjesma “And The Cradle Will Rock” Van Halena.

Glasnoća zvuka je podešena tako da je razina zvuka izmjerena pametnim telefonom na udaljenosti od 2 m od zvučnika iznosila 63 dB.

Čitanje između nota: sustav prijenosa podataka unutar glazbe
Slika br. 5: BER indikatori ovisno o udaljenosti između zvučnika i mikrofona (plava linija - publika, zelena - hodnik, narančasta - ured).

U hodniku je zvuk od 40 dB uhvatio pametni telefon na udaljenosti do 24 metra od zvučnika. U učionici na udaljenosti od 15 m zvuk je bio 55 dB, au uredu na udaljenosti od 8 metara razina zvuka koju opaža pametni telefon dosegnula je 57 dB.

Budući da gledalište i ured imaju veću reverberaciju, kasni odjeci OFDM simbola premašuju duljinu cikličkog prefiksa i povećavaju BER.

Odjek* - postupno smanjenje intenziteta zvuka zbog njegove višestruke refleksije.

Istraživači su dodatno pokazali svestranost svog sustava primjenom na 6 različitih pjesama iz tri žanra (tablica u nastavku).

Čitanje između nota: sustav prijenosa podataka unutar glazbe
Tablica br. 1: pjesme korištene u testovima.

Također, kroz podatke u tablici, možemo vidjeti bit rate i stope grešaka u bitovima za svaku pjesmu. Brzine prijenosa podataka su različite jer diferencijalni BPSK (fazni pomak) radi bolje kada se koriste isti podnosioci. A to je moguće kada susjedni segmenti sadrže iste maskirne elemente. Stalno glasne pjesme pružaju optimalnu osnovu za skrivanje podataka jer su maskirne frekvencije jače prisutne u širokom frekvencijskom rasponu. Glazba s brzim tempom može samo djelomično maskirati OFDM simbole zbog fiksne duljine prozora analize.

Zatim su ljudi počeli testirati sustav, koji su morali odrediti koja je melodija originalna, a koja je modificirana informacijama ugrađenim u nju. U tu su svrhu na posebnoj web stranici postavljeni 12-sekundni odlomci pjesama iz tablice br.

U prvom eksperimentu (E1), svaki je sudionik dobio ili modificirani ili originalni fragment za slušanje i morao je odlučiti je li fragment originalan ili modificiran. U drugom eksperimentu (E2) sudionici su mogli poslušati obje verzije onoliko puta koliko su htjeli, a zatim odlučiti koja je originalna, a koja modificirana.

Čitanje između nota: sustav prijenosa podataka unutar glazbe
Tablica br. 2: rezultati pokusa E1 i E2.

Rezultati prvog eksperimenta imaju dva pokazatelja: p(O|O) - postotak sudionika koji su točno označili originalnu melodiju i p(O|M) - postotak sudionika koji su modificiranu verziju melodije označili kao originalnu.

Zanimljivo je da su neki sudionici, prema riječima istraživača, pojedine izmijenjene melodije smatrali originalnijima od samog originala. Prosjek oba eksperimenta sugerira da prosječni slušatelj ne bi primijetio razliku između obične melodije i one u koju su ugrađeni podaci.

Naravno, glazbeni stručnjaci i glazbenici moći će otkriti neke netočnosti i sumnjive elemente u promijenjenim melodijama, ali ti elementi nisu toliko značajni da izazivaju nelagodu.

A sada i sami možemo sudjelovati u eksperimentu. Ispod su dvije verzije iste melodije - originalna i modificirana. Čuješ li razliku?

Originalna verzija melodije
vs
Modificirana verzija melodije

Za detaljnije upoznavanje s nijansama studije, preporučujem da pogledate izvješće istraživačka grupa.

Također možete preuzeti ZIP arhivu audio datoteka izvornih i modificiranih pjesama korištenih u studiji na ovaj link.

Epilog

U ovom radu, diplomirani studenti ETH Zurich opisali su nevjerojatan sustav prijenosa podataka unutar glazbe. Da bi to učinili, upotrijebili su maskiranje frekvencije, što je omogućilo ugradnju podataka u melodiju koju svira zvučnik. Tu melodiju percipira mikrofon uređaja koji prepoznaje skrivene podatke i dekodira ih, dok prosječni slušatelj neće niti primijetiti razliku. U budućnosti, dečki planiraju razviti svoj sustav, odabirući naprednije metode za uvođenje podataka u audio.

Kad netko smisli nešto neobično, a što je najvažnije, nešto što funkcionira, uvijek smo sretni. Ali još veća radost je što su ovaj izum stvorili mladi ljudi. Znanost nema dobnih ograničenja. A ako je mladima znanost dosadna, onda se ona prikazuje iz, da tako kažem, krivog kuta. Uostalom, kao što znamo, znanost je nevjerojatan svijet koji ne prestaje zadivljivati.

Petak off-top:


Kad smo već kod glazbe, odnosno rock glazbe, evo jednog prekrasnog putovanja prostranstvima rocka.


Queen, "Radio Ga Ga" (1984).

Hvala na čitanju, ostanite znatiželjni i ugodan vikend momci! 🙂

Hvala što ste ostali s nama. Sviđaju li vam se naši članci? Želite li vidjeti više zanimljivog sadržaja? Podržite nas narudžbom ili preporukom prijateljima, 30% popusta za korisnike Habra na jedinstveni analog početnih poslužitelja, koji smo izmislili za vas: Cijela istina o VPS (KVM) E5-2650 v4 (6 jezgri) 10GB DDR4 240GB SSD 1Gbps od 20 USD ili kako podijeliti poslužitelj? (dostupno s RAID1 i RAID10, do 24 jezgre i do 40 GB DDR4).

Dell R730xd 2 puta jeftiniji? Samo ovdje 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV od 199 USD u Nizozemskoj! Dell R420 - 2x E5-2430 2.2 Ghz 6C 128 GB DDR3 2x960 GB SSD 1 Gbps 100 TB - od 99 USD! Pročitaj o Kako izgraditi infrastrukturu corp. klase uz korištenje Dell R730xd E5-2650 v4 servera vrijednih 9000 eura za lipu?

Izvor: www.habr.com

Dodajte komentar