Leximi midis notave: sistemi i transmetimit të të dhënave brenda muzikës

Leximi midis notave: sistemi i transmetimit të të dhënave brenda muzikës

Shpreh atë që fjalët nuk mund të përcjellin; ndjeni një shumëllojshmëri të gjerë emocionesh të ndërthurura në një stuhi ndjenjash; të shkëputesh nga toka, qielli dhe madje edhe vetë Universi, duke shkuar në një udhëtim ku nuk ka as harta, as rrugë, as shenja; shpikni, tregoni dhe përjetoni një histori të tërë që do të mbetet gjithmonë unike dhe e paimitueshme. E gjithë kjo mund të bëhet nga muzika - një art që ekziston për mijëra vjet dhe që kënaq veshët dhe zemrat tona.

Sidoqoftë, muzika, ose më mirë vepra muzikore, mund të shërbejë jo vetëm për kënaqësi estetike, por edhe për transmetimin e informacionit të koduar në to, të destinuara për ndonjë pajisje dhe të padukshme për dëgjuesin. Sot do të njihemi me një studim shumë të pazakontë në të cilin studentët e diplomuar nga ETH Cyrih patën mundësi që, pa u vënë re nga veshi i njeriut, të fusin në veprat muzikore të dhëna të caktuara, për shkak të të cilave muzika bëhet një kanal transmetimi të dhënash. Si e zbatuan saktësisht teknologjinë e tyre, a janë shumë të ndryshme meloditë me dhe pa të dhënat e ngulitura dhe çfarë treguan testet praktike? Këtë e mësojmë nga raporti i studiuesve. Shkoni.

Baza e studimit

Studiuesit e quajnë teknologjinë e tyre teknologji akustike e transmetimit të të dhënave. Kur një altoparlant luan një melodi të modifikuar, një person e percepton atë si normale, por, për shembull, një telefon inteligjent mund të lexojë informacion të koduar midis rreshtave, ose më saktë midis notave, si të thuash. Shkencëtarët (fakti që këta djem janë ende studentë të diplomuar nuk i pengon ata të jenë shkencëtarë) e quajnë shpejtësinë dhe besueshmërinë e transmetimit duke ruajtur nivelin e këtyre parametrave, pavarësisht nga skedari audio i përzgjedhur, si aspektin më të rëndësishëm në zbatimin e kjo teknikë e transferimit të të dhënave. Psikoakustika, e cila studion aspektet psikologjike dhe fiziologjike të perceptimit njerëzor të tingujve, ndihmon për të përballuar këtë detyrë.

Bërthama e transmetimit të të dhënave akustike mund të quhet OFDM (multipleksimi ortogonal i ndarjes së frekuencës), i cili, së bashku me përshtatjen e nënbartësve me muzikën burimore me kalimin e kohës, bëri të mundur përdorimin maksimal të spektrit të frekuencës së transmetuar për transmetimin e informacionit. Falë kësaj, u arrit të arrihet një shpejtësi transmetimi prej 412 bps në një distancë deri në 24 metra (shkalla e gabimit < 10%). Eksperimentet praktike që përfshinin 40 vullnetarë konfirmuan faktin se është pothuajse e pamundur të dëgjosh ndryshimin midis melodisë origjinale dhe asaj në të cilën ishte futur informacioni.

Ku mund të zbatohet në praktikë kjo teknologji? Studiuesit kanë përgjigjen e tyre: pothuajse të gjithë telefonat inteligjentë modernë, laptopët dhe pajisjet e tjera të dorës janë të pajisur me mikrofona, dhe shumë vende publike (kafene, restorante, qendra tregtare, etj.) kanë altoparlantë me muzikë në sfond. Kjo melodi e sfondit, për shembull, mund të përfshijë të dhëna për t'u lidhur me një rrjet Wi-Fi pa pasur nevojë për veprime shtesë.

Karakteristikat e përgjithshme të transmetimit të të dhënave akustike janë bërë të qarta për ne; tani le të kalojmë në një studim të hollësishëm të strukturës së këtij sistemi.

Përshkrimi i sistemit

Futja e të dhënave në melodi ndodh për shkak të maskimit të frekuencës. Në slotet kohore, frekuencat e maskimit identifikohen dhe nënbartësit OFDM afër këtyre elementëve maskues mbushen me të dhëna.

Leximi midis notave: sistemi i transmetimit të të dhënave brenda muzikës
Imazhi #1: Konvertimi i skedarit origjinal në një sinjal të përbërë (melodi + të dhëna) që transmetohet përmes altoparlantëve.

Si fillim, sinjali origjinal audio ndahet në segmente të njëpasnjëshme për analizë. Çdo segment i tillë (Hi) i L = 8820 mostrave, i barabartë me 200 ms, shumëzohet me dritare* për të minimizuar efektet kufitare.

dritare* është një funksion peshimi që përdoret për të kontrolluar efektet për shkak të lobeve anësore në vlerësimet spektrale.

Më pas, frekuencat mbizotëruese të sinjalit origjinal u zbuluan në intervalin nga 500 Hz në 9.8 kHz, gjë që bëri të mundur marrjen e frekuencave maskuese fM,l për këtë segment. Për më tepër, të dhënat u transmetuan në një gamë të vogël nga 9.8 në 10 kHz për të përcaktuar vendndodhjen e nënbartësve në marrës. Kufiri i sipërm i diapazonit të frekuencës së përdorur u vendos në 10 kHz për shkak të ndjeshmërisë së ulët të mikrofonave të smartfonëve në frekuenca të larta.

Frekuencat e maskimit u përcaktuan për secilin segment të analizuar individualisht. Duke përdorur metodën HPS (Harmonic Product Spectrum), tre frekuencat dominuese u identifikuan dhe më pas u rrumbullakosën në notat më të afërta në shkallën kromatike harmonike. Kështu janë marrë notat kryesore fF,i = 1…3, të vendosura midis tasteve C0 (16.35 Hz) dhe B0 (30.87 Hz). Bazuar në faktin se shënimet themelore janë shumë të ulëta për t'u përdorur në transmetimin e të dhënave, oktavat e tyre më të larta 500kfF,i u llogaritën në intervalin 9.8 Hz ... 2 kHz. Shumë nga këto frekuenca (fO,l1) ishin më të theksuara për shkak të natyrës së HPS.

Leximi midis notave: sistemi i transmetimit të të dhënave brenda muzikës
Imazhi #2: oktavat e llogaritura fO,l1 për notat themelore dhe harmonikat fH,l2 të tonit më të fortë.

Grupi rezultues i oktavave dhe harmonikave u përdor si frekuenca maskuese, nga të cilat u përftuan frekuencat nënbartëse të OFDM fSC,k. Dy nënbartës u futën poshtë dhe mbi çdo frekuencë maskimi.

Më pas, spektri i segmentit audio Hi u filtua në frekuencat e nënbartësit fSC,k. Pas kësaj, u krijua një simbol OFDM bazuar në bitet e informacionit në Bi, për shkak të të cilit segmenti i përbërë Ci mund të transmetohej përmes altoparlantit. Madhësitë dhe fazat e nënbartësve duhet të zgjidhen në mënyrë që marrësi të mund të nxjerrë të dhënat e transmetuara ndërsa dëgjuesi nuk vëren ndryshime në melodi.

Leximi midis notave: sistemi i transmetimit të të dhënave brenda muzikës
Imazhi nr. 3: pjesë e spektrit dhe frekuencave nënbartëse të segmentit Hi të melodisë origjinale.

Kur një sinjal audio me informacion të koduar në të luhet përmes altoparlantëve, mikrofoni i pajisjes marrëse e regjistron atë. Për të gjetur pozicionet fillestare të simboleve të ngulitura OFDM, të dhënat fillimisht duhet të filtrohen me brez. Në këtë mënyrë nxirret diapazoni i sipërm i frekuencës, ku nuk ka sinjale të interferencës muzikore ndërmjet nënbartësve. Ju mund të gjeni fillimin e simboleve OFDM duke përdorur një parashtesë ciklike.

Pas zbulimit të fillimit të simboleve OFDM, marrësi merr informacion për notat më dominuese përmes dekodimit të domenit me frekuencë të lartë. Për më tepër, OFDM është mjaft rezistent ndaj burimeve të interferencave me brez të ngushtë, pasi ato prekin vetëm disa nga nënbartësit.

Testet praktike

Altoparlanti KRK Rokit 8 veproi si burim i melodive të modifikuara, dhe smartphone Nexus 5X luajti rolin e palës marrëse.

Leximi midis notave: sistemi i transmetimit të të dhënave brenda muzikës
Imazhi #4: Dallimi midis OFDM aktuale dhe majave të korrelacionit të matura në ambiente të mbyllura në 5 m midis altoparlantit dhe mikrofonit.

Shumica e pikave OFDM shtrihen në intervalin nga 0 në 25 ms, kështu që mund të gjeni një fillim të vlefshëm brenda prefiksit ciklik 66.6 ms. Studiuesit vërejnë se marrësi (në këtë eksperiment, një smartphone) merr parasysh që simbolet OFDM luhen periodikisht, gjë që përmirëson zbulimin e tyre.

Gjëja e parë që duhet kontrolluar ishte efekti i distancës në shkallën e gabimit të bitit (BER). Për ta bërë këtë, u kryen tre teste në lloje të ndryshme dhomash: një korridor me qilim, një zyrë me linoleum në dysheme dhe një auditor me dysheme druri.


Kënga "And The Cradle Will Rock" nga Van Halen u zgjodh si subjekt testimi.

Vëllimi i zërit u rregullua në mënyrë që niveli i zërit i matur nga smartphone në një distancë prej 2 m nga altoparlanti të ishte 63 dB.

Leximi midis notave: sistemi i transmetimit të të dhënave brenda muzikës
Imazhi nr. 5: Treguesit BER në varësi të distancës midis altoparlantit dhe mikrofonit (vija blu - audiencë, jeshile - korridor, portokalli - zyrë).

Në korridor, një tingull prej 40 dB u kap nga një smartphone në një distancë deri në 24 metra nga altoparlanti. Në klasë në një distancë prej 15 m tingulli ishte 55 dB, dhe në zyrë në një distancë prej 8 metrash niveli i zërit të perceptuar nga smartphone arriti në 57 dB.

Për shkak se auditori dhe zyra janë më jehonë, jehona e vonë e simbolit OFDM tejkalon gjatësinë e prefiksit ciklik dhe rrit BER.

jehonë* - një rënie graduale e intensitetit të zërit për shkak të reflektimeve të tij të shumta.

Studiuesit demonstruan më tej shkathtësinë e sistemit të tyre duke e aplikuar atë në 6 këngë të ndryshme nga tre zhanre (tabela më poshtë).

Leximi midis notave: sistemi i transmetimit të të dhënave brenda muzikës
Tabela nr. 1: këngët e përdorura në teste.

Gjithashtu, përmes të dhënave të tabelës, ne mund të shohim shpejtësinë e bitit dhe shkallën e gabimit të bitit për secilën këngë. Shkalla e të dhënave është e ndryshme sepse BPSK diferenciale (kyçja e zhvendosjes së fazës) funksionon më mirë kur përdoren të njëjtat nënbartës. Dhe kjo është e mundur kur segmentet ngjitur përmbajnë të njëjtat elementë maskues. Këngët vazhdimisht me zë të lartë ofrojnë një bazë optimale për fshehjen e të dhënave sepse frekuencat maskuese janë më të pranishme në një gamë të gjerë frekuencash. Muzika me ritëm të shpejtë mund të maskojë vetëm pjesërisht simbolet OFDM për shkak të gjatësisë fikse të dritares së analizës.

Më pas, njerëzit filluan të testonin sistemin, të cilët duhej të përcaktonin se cila melodi ishte origjinale dhe cila modifikohej nga informacioni i ngulitur në të. Për këtë qëllim, në një faqe të posaçme u postuan pjesë 12 sekondash të këngëve nga tabela nr.1.

Në eksperimentin e parë (E1), secilit pjesëmarrës iu dha ose një fragment i modifikuar ose origjinal për të dëgjuar dhe duhej të vendoste nëse fragmenti ishte origjinal apo i modifikuar. Në eksperimentin e dytë (E2), pjesëmarrësit mund t'i dëgjonin të dy versionet sa herë të dëshironin, dhe më pas të vendosnin se cili ishte origjinal dhe cili ishte modifikuar.

Leximi midis notave: sistemi i transmetimit të të dhënave brenda muzikës
Tabela nr. 2: rezultatet e eksperimenteve E1 dhe E2.

Rezultatet e eksperimentit të parë kanë dy tregues: p(O|O) - përqindja e pjesëmarrësve që shënuan saktë melodinë origjinale dhe p(O|M) - përqindja e pjesëmarrësve që shënuan versionin e modifikuar të melodisë si origjinal.

Është interesante se disa pjesëmarrës, sipas studiuesve, i konsideruan disa melodi të ndryshuara si më origjinale se vetë origjinali. Mesatarja e të dy eksperimenteve sugjeron që dëgjuesi mesatar nuk do të vinte re një ndryshim midis një melodie të zakonshme dhe asaj në të cilën ishin të ngulitura të dhënat.

Natyrisht, ekspertët dhe muzikantët e muzikës do të jenë në gjendje të zbulojnë disa pasaktësi dhe elementë të dyshimtë në meloditë e ndryshuara, por këto elemente nuk janë aq domethënëse sa të shkaktojnë shqetësim.

Dhe tani ne vetë mund të marrim pjesë në eksperiment. Më poshtë janë dy versione të së njëjtës melodi - origjinali dhe ai i modifikuar. A e dëgjoni ndryshimin?

Versioni origjinal i melodisë
vs
Versioni i modifikuar i melodisë

Për një kuptim më të detajuar të nuancave të studimit, unë rekomandoj t'i hidhni një sy raportin grupi kërkimor.

Ju gjithashtu mund të shkarkoni një arkiv ZIP të skedarëve audio të melodive origjinale dhe të modifikuara të përdorura në studim në kjo lidhje.

epilog

Në këtë punë, studentët e diplomuar nga ETH Cyrih përshkruan një sistem të mahnitshëm të transmetimit të të dhënave brenda muzikës. Për ta bërë këtë, ata përdorën maskimin e frekuencës, i cili bëri të mundur futjen e të dhënave në melodinë e luajtur nga altoparlanti. Kjo melodi perceptohet nga mikrofoni i pajisjes, i cili njeh të dhënat e fshehura dhe i deshifron ato, ndërsa dëgjuesi mesatar as që do ta vërejë ndryshimin. Në të ardhmen, djemtë planifikojnë të zhvillojnë sistemin e tyre, duke zgjedhur metoda më të avancuara për futjen e të dhënave në audio.

Kur dikush vjen me diçka të pazakontë, dhe më e rëndësishmja, diçka që funksionon, ne jemi gjithmonë të lumtur. Por edhe më shumë gëzim është se kjo shpikje është krijuar nga të rinjtë. Shkenca nuk ka kufizime moshe. Dhe nëse shkencës të rinjve u duket e mërzitshme, atëherë ajo po paraqitet nga këndvështrimi i gabuar, si të thuash. Në fund të fundit, siç e dimë, shkenca është një botë e mahnitshme që nuk pushon së mahnituri.

E premte jashtë topit:


Meqenëse po flasim për muzikë, ose më mirë muzikë rock, ja një udhëtim i mrekullueshëm nëpër hapësirat e rock-ut.


Mbretëresha, "Radio Ga Ga" (1984).

Faleminderit që lexoni, qëndroni kurioz dhe kaloni një fundjavë të mrekullueshme djema! 🙂

Faleminderit që qëndruat me ne. A ju pëlqejnë artikujt tanë? Dëshironi të shihni përmbajtje më interesante? Na mbështesni duke bërë një porosi ose duke rekomanduar miqve, 30% zbritje për përdoruesit e Habr në një analog unik të serverëve të nivelit të hyrjes, i cili u shpik nga ne për ju: E gjithë e vërteta rreth VPS (KVM) E5-2650 v4 (6 bërthama) 10 GB DDR4 240 GB SSD 1 Gbps nga 20 dollarë ose si të ndani një server? (e disponueshme me RAID1 dhe RAID10, deri në 24 bërthama dhe deri në 40 GB DDR4).

Dell R730xd 2 herë më lirë? Vetëm këtu 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV nga 199$ në Holandë! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - nga 99 dollarë! Lexoni rreth Si të ndërtohet korporata e infrastrukturës. klasë me përdorimin e serverëve Dell R730xd E5-2650 v4 me vlerë 9000 euro për një qindarkë?

Burimi: www.habr.com

Shto një koment