Čitanje između nota: sistem prenosa podataka unutar muzike

Čitanje između nota: sistem prenosa podataka unutar muzike

Izrazite ono što riječi ne mogu prenijeti; osjetiti širok spektar emocija isprepletenih u uraganu osjećaja; otrgnuti se od zemlje, neba, pa čak i samog Univerzuma, ići na put na kojem nema ni mapa, ni puteva, ni znakova; osmislite, ispričajte i doživite cijelu priču koja će uvijek ostati jedinstvena i neponovljiva. Sve to može da uradi muzika – umetnost koja postoji hiljadama godina i oduševljava naše uši i srca.

Međutim, muzika, odnosno muzička dela, mogu poslužiti ne samo za estetski užitak, već i za prenošenje u njima kodiranih informacija, namenjenih nekom uređaju i nevidljivih za slušaoca. Danas ćemo se upoznati sa veoma neobičnom studijom u kojoj su diplomirani studenti ETH Ciriha mogli da, neprimećeno ljudskom uhu, unesu određene podatke u muzička dela, zbog čega sama muzika postaje kanal za prenos podataka. Kako su tačno implementirali svoju tehnologiju, da li su melodije sa i bez ugrađenih podataka veoma različite i šta su pokazali praktični testovi? O tome saznajemo iz izvještaja istraživača. Idi.

Osnova istraživanja

Istraživači svoju tehnologiju nazivaju tehnologijom akustičnog prijenosa podataka. Kada zvučnik pušta modifikovanu melodiju, osoba to doživljava kao normalnu, ali, na primjer, pametni telefon može čitati kodirane informacije između redova, odnosno između nota, da tako kažem. Naučnici (činjenica da su ovi momci još diplomirani studenti ne sprečava ih da budu naučnici) brzinu i pouzdanost prenosa uz održavanje nivoa ovih parametara, bez obzira na odabrani audio fajl, nazivaju najvažnijim aspektom u implementaciji ovu tehniku ​​prenosa podataka. Psihoakustika, koja proučava psihološke i fiziološke aspekte ljudske percepcije zvukova, pomaže da se nosi s ovim zadatkom.

Jezgro akustičkog prenosa podataka može se nazvati OFDM (ortogonalno frekvencijsko multipleksiranje), koji je, uz prilagođavanje podnosača izvornoj muzici tokom vremena, omogućio da se prenošeni frekventni spektar maksimalno iskoristi za prenos informacija. Zahvaljujući tome, bilo je moguće postići brzinu prijenosa od 412 bps na udaljenosti do 24 metra (stopa greške < 10%). Praktični eksperimenti sa 40 volontera potvrdili su činjenicu da je gotovo nemoguće čuti razliku između originalne melodije i one u koju je informacija ugrađena.

Gdje se ova tehnologija može primijeniti u praksi? Istraživači imaju svoj odgovor: gotovo svi moderni pametni telefoni, laptopovi i drugi ručni uređaji opremljeni su mikrofonima, a mnoga javna mjesta (kafići, restorani, tržni centri itd.) imaju zvučnike sa pozadinskom muzikom. Ova pozadinska melodija može, na primjer, uključivati ​​podatke za povezivanje na Wi-Fi mrežu bez potrebe za dodatnim radnjama.

Opće karakteristike akustičkog prijenosa podataka postale su nam jasne, a sada prijeđimo na detaljno proučavanje strukture ovog sistema.

Opis sistema

Do unošenja podataka u melodiju dolazi zbog maskiranja frekvencije. U vremenskim slotovima se identifikuju maskirne frekvencije i OFDM podnosioci blizu ovih elemenata maskiranja se popunjavaju podacima.

Čitanje između nota: sistem prenosa podataka unutar muzike
Slika #1: Pretvaranje originalne datoteke u kompozitni signal (melodija + podaci) koji se prenosi preko zvučnika.

Za početak, originalni audio signal je podijeljen u uzastopne segmente za analizu. Svaki takav segment (Hi) od L = 8820 uzoraka, jednak 200 ms, množi se sa prozor* kako bi se minimizirali granični efekti.

prozor* je težinska funkcija koja se koristi za kontrolu efekata zbog bočnih režnjeva u spektralnim procjenama.

Zatim su detektovane dominantne frekvencije originalnog signala u opsegu od 500 Hz do 9.8 kHz, što je omogućilo dobijanje maskirnih frekvencija fM,l za ovaj segment. Pored toga, podaci su prenošeni u malom opsegu od 9.8 do 10 kHz da bi se utvrdila lokacija podnosača na prijemniku. Gornja granica korištenog frekvencijskog opsega postavljena je na 10 kHz zbog niske osjetljivosti mikrofona pametnih telefona na visokim frekvencijama.

Učestalosti maskiranja su određene za svaki analizirani segment pojedinačno. Koristeći HPS (Harmonic Product Spectrum) metodu, identifikovane su tri dominantne frekvencije, a zatim zaokružene na najbliže tonove na harmonijskoj hromatskoj skali. Tako su dobijene glavne note fF,i = 1…3 koje se nalaze između tastera C0 (16.35 Hz) i B0 (30.87 Hz). Na osnovu činjenice da su osnovne note preniske za upotrebu u prenosu podataka, njihove više oktave 500kfF,i su izračunate u opsegu 9.8 Hz ... 2 kHz. Mnoge od ovih frekvencija (fO,l1) bile su izraženije zbog prirode HPS-a.

Čitanje između nota: sistem prenosa podataka unutar muzike
Slika #2: Izračunate oktave fO,l1 za osnovne note i harmonike fH,l2 najjačeg tona.

Dobijeni skup oktava i harmonika korišten je kao maskirne frekvencije, iz kojih su izvedene frekvencije OFDM podnosača fSC,k. Dva podnosača su umetnuta ispod i iznad svake maskirne frekvencije.

Zatim je spektar Hi audio segmenta filtriran na frekvencijama podnosača fSC,k. Nakon toga je kreiran OFDM simbol na osnovu informacionih bitova u Bi, zbog čega je kompozitni segment Ci mogao biti prenošen preko zvučnika. Veličine i faze podnosača moraju biti odabrane tako da prijemnik može izdvojiti prenesene podatke dok slušalac ne primijeti promjene u melodiji.

Čitanje između nota: sistem prenosa podataka unutar muzike
Slika br. 3: dio spektra i frekvencije podnosača Hi segmenta originalne melodije.

Kada se audio signal sa informacijama kodiranim u njemu reprodukuje preko zvučnika, mikrofon prijemnog uređaja ga snima. Da biste pronašli početne pozicije ugrađenih OFDM simbola, zapisi prvo moraju biti filtrirani propusnim opsegom. Na ovaj način se izdvaja gornji frekventni opseg, gdje nema muzičkih signala smetnje između podnosaca. Možete pronaći početak OFDM simbola koristeći ciklički prefiks.

Nakon detekcije početka OFDM simbola, prijemnik dobija informacije o najdominantnijim notama kroz dekodiranje visokofrekventnog domena. Osim toga, OFDM je prilično otporan na uskopojasne izvore smetnji, budući da utiču samo na neke od podnosača.

Praktični testovi

Zvučnik KRK Rokit 8 je bio izvor modifikovanih melodija, a pametni telefon Nexus 5X je imao ulogu primaoca.

Čitanje između nota: sistem prenosa podataka unutar muzike
Slika #4: Razlika između stvarnih OFDM i korelacijskih vrhova izmjerenih u zatvorenom prostoru na 5m između zvučnika i mikrofona.

Većina OFDM tačaka se nalazi u rasponu od 0 do 25 ms, tako da možete pronaći valjani početak unutar cikličkog prefiksa od 66.6 ms. Istraživači napominju da prijemnik (u ovom eksperimentu, pametni telefon) uzima u obzir da se OFDM simboli povremeno reproduciraju, što poboljšava njihovu detekciju.

Prva stvar koju treba provjeriti je utjecaj udaljenosti na stopu greške u bitovima (BER). Da bi se to postiglo, izvršena su tri testa u različitim tipovima prostorija: hodnik sa tepihom, kancelarija sa linoleumom na podu i auditorijum sa drvenim podom.


Pesma "And The Cradle Will Rock" autora Van Halena je odabrana kao ispitanik.

Jačina zvuka je podešena tako da je nivo zvuka mjeren pametnim telefonom na udaljenosti od 2 m od zvučnika bio 63 dB.

Čitanje između nota: sistem prenosa podataka unutar muzike
Slika br. 5: BER indikatori u zavisnosti od udaljenosti između zvučnika i mikrofona (plava linija - publika, zelena - hodnik, narandžasta - kancelarija).

U hodniku je pametni telefon uhvatio zvuk od 40 dB na udaljenosti do 24 metra od zvučnika. U učionici na udaljenosti od 15 m zvuk je bio 55 dB, au kancelariji na udaljenosti od 8 metara nivo zvuka koji je pametni telefon percipirao dostigao je 57 dB.

Pošto auditorijum i kancelarija odjekuju, kasni odjeci OFDM simbola premašuju dužinu cikličkog prefiksa i povećavaju BER.

odjek* - postepeno smanjenje intenziteta zvuka zbog njegovih višestrukih refleksija.

Istraživači su dalje demonstrirali svestranost svog sistema primjenom na 6 različitih pjesama iz tri žanra (tabela ispod).

Čitanje između nota: sistem prenosa podataka unutar muzike
Tabela br. 1: pjesme korištene u testovima.

Također, kroz tabelarne podatke možemo vidjeti bit rate i stope grešaka u bitovima za svaku pjesmu. Brzine podataka su različite jer diferencijalni BPSK (fazni pomak) radi bolje kada se koriste isti podnosioci. A to je moguće kada susjedni segmenti sadrže iste maskirne elemente. Kontinuirano glasne pjesme pružaju optimalnu osnovu za skrivanje podataka jer su maskirne frekvencije jače prisutne u širokom rasponu frekvencija. Brza muzika može samo djelimično maskirati OFDM simbole zbog fiksne dužine prozora analize.

Zatim su ljudi počeli da testiraju sistem, koji su morali da utvrde koja je melodija originalna, a koja modifikovana informacijama koje su u njoj ugrađene. U tu svrhu 12-sekundni odlomci pjesama iz tabele br. 1 objavljeni su na posebnoj web stranici.

U prvom eksperimentu (E1), svaki sudionik je dobio modificirani ili originalni fragment za slušanje i morao je odlučiti da li je fragment originalan ili modificiran. U drugom eksperimentu (E2), sudionici su mogli slušati obje verzije koliko god puta žele, a zatim odlučiti koja je originalna, a koja modificirana.

Čitanje između nota: sistem prenosa podataka unutar muzike
Tabela br. 2: rezultati eksperimenata E1 i E2.

Rezultati prvog eksperimenta imaju dva indikatora: p(O|O) - procenat učesnika koji su tačno označili originalnu melodiju i p(O|M) - procenat učesnika koji su modifikovanu verziju melodije označili kao originalnu.

Zanimljivo je da su neki učesnici, prema istraživačima, smatrali da su određene izmijenjene melodije originalnije od samog originala. Prosjek oba eksperimenta sugerira da prosječan slušalac ne bi primijetio razliku između obične melodije i one u koju su ugrađeni podaci.

Naravno, muzički stručnjaci i muzičari će moći da otkriju neke nepreciznosti i sumnjive elemente u izmenjenim melodijama, ali ti elementi nisu toliko značajni da izazivaju nelagodu.

A sada i sami možemo učestvovati u eksperimentu. Ispod su dvije verzije iste melodije - originalna i modificirana. čujete li razliku?

Originalna verzija melodije
vs
Izmijenjena verzija melodije

Za detaljnije upoznavanje sa nijansama studije, preporučujem da pogledate izveštaj istraživačka grupa.

Također možete preuzeti ZIP arhivu audio datoteka originalnih i modificiranih pjesama korištenih u studiji na ovaj link.

Epilog

U ovom radu, diplomirani studenti sa ETH u Cirihu opisali su neverovatan sistem prenosa podataka unutar muzike. Da bi to učinili, koristili su frekvencijsko maskiranje, što je omogućilo ugradnju podataka u melodiju koju je puštao zvučnik. Ovu melodiju percipira mikrofon uređaja koji prepoznaje skrivene podatke i dekodira ih, dok prosječan slušalac neće ni primijetiti razliku. U budućnosti, momci planiraju da razviju svoj sistem, birajući naprednije metode za uvođenje podataka u audio.

Kada neko smisli nešto neobično, i što je najvažnije, nešto što funkcioniše, uvek smo srećni. Ali još je veća radost što su ovaj izum stvorili mladi ljudi. Nauka nema starosna ograničenja. A ako je mladima nauka dosadna, onda se ona predstavlja iz pogrešnog ugla, da tako kažem. Na kraju krajeva, kao što znamo, nauka je neverovatan svet koji ne prestaje da zadivljuje.

petak van vrha:


Pošto je riječ o muzici, odnosno rok muzici, evo jednog divnog putovanja kroz prostranstva roka.


Kraljica, "Radio Ga Ga" (1984).

Hvala na čitanju, ostanite radoznali i ugodan vikend momci! 🙂

Hvala vam što ste ostali s nama. Da li vam se sviđaju naši članci? Želite li vidjeti još zanimljivijeg sadržaja? Podržite nas naručivanjem ili preporukom prijateljima, 30% popusta za korisnike Habra na jedinstveni analog početnih servera, koji smo mi osmislili za vas: Cijela istina o VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps od 20$ ili kako dijeliti server? (dostupno sa RAID1 i RAID10, do 24 jezgra i do 40GB DDR4).

Dell R730xd 2 puta jeftiniji? Samo ovdje 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV od 199 USD u Holandiji! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - od 99 USD! Pročitajte o Kako izgraditi infrastrukturnu kompaniju. klase uz korišćenje Dell R730xd E5-2650 v4 servera u vrednosti od 9000 evra za peni?

izvor: www.habr.com

Dodajte komentar