Lêze tusken de notysjes: it datatransmissionsysteem yn muzyk

Lêze tusken de notysjes: it datatransmissionsysteem yn muzyk

Druk út wat wurden net oerbringe kinne; fiel in grut ferskaat oan emoasjes ferweefd yn in orkaan fan gefoelens; ôfbrekke fan 'e ierde, de himel en sels it Universum sels, gean op in reis dêr't der gjin kaarten, gjin diken, gjin tekens; útfine, fertelle en belibje in hiel ferhaal dat sil altyd bliuwe unyk en ûnneifolgber. Dit alles kin dien wurde troch muzyk - in keunst dy't in protte tûzenen jierren bestiet en ús earen en hert bliid makket.

Lykwols, muzyk, of leaver muzikale wurken, kin tsjinje net allinnich foar estetyske wille, mar ek foar de oerdracht fan ynformaasje kodearre yn harren, bedoeld foar guon apparaat en ûnsichtber foar de harker. Hjoed sille wy yn 'e kunde komme mei in heul ûngewoane stúdzje wêryn ôfstudearstudinten fan ETH Zurich, ûngemurken troch it minsklik ear, bepaalde gegevens yn muzykwurken ynfiere koene, wêrtroch't de muzyk sels in datatransmissionkanaal wurdt. Hoe hawwe se har technology krekt ymplementearre, binne de meldijen mei en sûnder de ynbêde gegevens hiel oars, en wat lieten praktyske tests sjen? Dat leare wy út it rapport fan de ûndersikers. Gean.

Undersyk basis

De ûndersikers neame har technology akoestyske gegevensferfiertechnology. As in sprekker in oanpaste melody spilet, fynt in persoan it as normaal, mar bygelyks in smartphone kin kodearre ynformaasje lêze tusken de rigels, of leaver tusken de noten, om sa te sizzen. Wittenskippers (it feit dat dizze jonges noch ôfstudearre studinten binne net foarkomme dat se wittenskippers binne) neame de snelheid en betrouberens fan oerdracht, wylst it nivo fan dizze parameters behâlde, nettsjinsteande it selektearre audiobestân, as it wichtichste aspekt yn 'e útfiering fan dizze gegevens oerdracht technyk. Psychoakoestyk, dy't de psychologyske en fysiologyske aspekten fan 'e minsklike waarnimming fan lûden bestudearret, helpt om dizze taak te behanneljen.

De kearn fan akoestyske gegevens oerdracht kin neamd wurde OFDM (ortogonale frekwinsje divyzje multiplexing), dy't, tegearre mei de oanpassing fan subcarriers oan 'e boarne muzyk oer de tiid, makke it mooglik om maksimaal gebrûk fan it útstjoerd frekwinsje spektrum foar ynformaasje oerdracht. Hjirtroch wie it mooglik om in oerdrachtsnelheid fan 412 bps te berikken oer in ôfstân fan maksimaal 24 meter (flaterrate <10%). Praktyske eksperiminten mei 40 frijwilligers befêstige it feit dat it hast ûnmooglik is om it ferskil te hearren tusken de orizjinele melody en dejinge wêryn de ynformaasje ynbêde wie.

Wêr kin dizze technology yn 'e praktyk tapast wurde? Undersikers hawwe har eigen antwurd: hast alle moderne smartphones, laptops en oare handheld apparaten binne foarsjoen fan mikrofoans, en in protte iepenbiere plakken (kafes, restaurants, winkelsintrum, ensfh) hawwe sprekkers mei eftergrûnmuzyk. Dizze eftergrûnmelody kin bygelyks gegevens befetsje foar ferbining mei in Wi-Fi-netwurk sûnder ekstra aksjes nedich te wêzen.

De algemiene skaaimerken fan akoestyske gegevensoerdracht binne ús dúdlik wurden; litte wy no gean nei in detaillearre stúdzje fan 'e struktuer fan dit systeem.

Systeembeskriuwing

De ynfiering fan gegevens yn 'e melody komt foar troch frekwinsjemaskering. Yn tiid slots wurde maskeringsfrekwinsjes identifisearre en OFDM subcarriers tichtby dizze maskeringseleminten wurde fol mei gegevens.

Lêze tusken de notysjes: it datatransmissionsysteem yn muzyk
Ofbylding #1: Konvertearje fan it orizjinele bestân yn in gearstald sinjaal (melody + gegevens) oerbrocht fia de sprekkers.

Om te begjinnen, it orizjinele audio sinjaal wurdt ferdield yn opienfolgjende segminten foar analyze. Elk sa'n segmint (Hi) fan L = 8820 samples, lyk oan 200 ms, wurdt fermannichfâldige mei finster* om grinseffekten te minimalisearjen.

Finster* is in gewichtsfunksje dy't brûkt wurdt om effekten te kontrolearjen fanwege sidelobes yn spektrale skattings.

Dêrnei waarden de dominante frekwinsjes fan it orizjinele sinjaal ûntdutsen yn it berik fan 500 Hz oant 9.8 kHz, wat it mooglik makke om maskerfrekwinsjes fM,l te krijen foar dit segmint. Derneist waarden gegevens oerbrocht yn in lyts berik fan 9.8 oant 10 kHz om de lokaasje fan 'e subdragers by de ûntfanger te fêstigjen. De boppegrins fan it brûkte frekwinsjeberik waard ynsteld op 10 kHz fanwegen de lege gefoelichheid fan smartphonemikrofoans by hege frekwinsjes.

Masking frekwinsjes waarden bepaald foar elk analysearre segmint yndividueel. Mei help fan de HPS (Harmonic Product Spectrum) metoade, waarden de trije dominante frekwinsjes identifisearre en dan ôfrûn op de tichtstbye notysjes op 'e harmonic chromatyske skaal. Dit is hoe't de haadnotysjes fF,i = 1…3 waarden krigen, lizzend tusken de toetsen C0 (16.35 Hz) en B0 (30.87 Hz). Op grûn fan it feit dat de fûnemintele notysjes binne te leech foar gebrûk yn gegevens oerdracht, harren hegere oktaven 500kfF,i waarden berekkene yn it berik 9.8 Hz ... 2 kHz. In protte fan dizze frekwinsjes (fO,l1) wiene mear útsprutsen troch de aard fan 'e HPS.

Lêze tusken de notysjes: it datatransmissionsysteem yn muzyk
Ofbylding #2: Berekkene oktaven fO,l1 foar de fûnemintele notysjes en harmonika fH,l2 fan 'e sterkste toan.

De resultearjende set fan oktaven en harmoniken waarden brûkt as maskeringsfrekwinsjes, wêrfan de OFDM subdragerfrekwinsjes fSC,k waarden ôflaat. Twa subcarriers waarden ynfoege ûnder en boppe elke maskeringsfrekwinsje.

Dêrnei waard it spektrum fan it Hi-audiosegment filtere by subdragerfrekwinsjes fSC,k. Dêrnei waard in OFDM-symboal makke op basis fan de ynformaasjebits yn Bi, wêrtroch it gearstalde segmint Ci troch de sprekker oerdroegen wurde koe. De grutte en fazen fan 'e subdragers moatte wurde keazen sadat de ûntfanger de útstjoerde gegevens kin ekstrahearje, wylst de harker gjin feroaringen yn' e melody opnimt.

Lêze tusken de notysjes: it datatransmissionsysteem yn muzyk
Image No.. 3: diel fan it spektrum en subcarrier frekwinsjes fan de Hi segment fan de oarspronklike melody.

As in audiosinjaal mei ynkodearre ynformaasje wurdt spile troch sprekkers, nimt de mikrofoan fan it ûntfangende apparaat it op. Om de startposysjes fan ynbêde OFDM-symboalen te finen, moatte de records earst bandpassfiltere wurde. Op dizze manier wurdt it boppeste frekwinsjeberik ekstrakt, wêr't gjin muzikale ynterferinsjesignalen binne tusken subdragers. Jo kinne fine it begjin fan OFDM symboalen mei help fan in cyclic prefix.

Nei it ûntdekken fan it begjin fan OFDM-symboalen, krijt de ûntfanger ynformaasje oer de meast dominante notysjes troch hege frekwinsje-domeindekodearring. Derneist is OFDM frij resistint foar boarnen foar smelbân ynterferinsje, om't se allinich ynfloed hawwe op guon fan 'e subcarriers.

Praktyske tests

De KRK Rokit 8-sprekker fungearre as de boarne fan de wizige meldijen, en de Nexus 5X-smartphone spile de rol fan 'e ûntfangende partij.

Lêze tusken de notysjes: it datatransmissionsysteem yn muzyk
Ofbylding #4: Ferskil tusken werklike OFDM en korrelaasjepieken mjitten binnen op 5m tusken sprekker en mikrofoan.

De measte OFDM-punten lizze yn it berik fan 0 oant 25 ms, dus jo kinne in jildich begjin fine binnen it 66.6 ms cyclic prefix. De ûndersikers merken op dat de ûntfanger (yn dit eksperimint, in smartphone) rekken hâldt dat OFDM-symboalen periodyk spile wurde, wat har deteksje ferbettere.

It earste ding om te kontrolearjen wie it effekt fan ôfstân op bitflaterrate (BER). Om dit te dwaan, waarden trije testen útfierd yn ferskate soarten keamers: in korridor mei tapyt, in kantoar mei linoleum op 'e flier, en in auditorium mei in houten flier.


It nûmer "And The Cradle Will Rock" fan Van Halen waard as proefpersoan keazen.

It lûdfolume waard sa oanpast dat it lûdnivo mjitten troch de smartphone op in ôfstân fan 2 m fan de sprekker 63 dB wie.

Lêze tusken de notysjes: it datatransmissionsysteem yn muzyk
Image No.. 5: BER yndikatoaren ôfhinklik fan de ôfstân tusken de sprekker en de mikrofoan (blauwe line - publyk, grien - korridor, oranje - kantoar).

Yn de gong waard troch in smartphone op in ôfstân fan oant 40 meter fan de sprekker in lûd fan 24 dB opfongen. Yn 'e klasse op in ôfstân fan 15 m wie it lûd 55 dB, en yn it kantoar op in ôfstân fan 8 meter berikte it lûdnivo dat troch de smartphone waarnommen 57 dB.

Om't it auditorium en kantoar binne mear reverberant, lette OFDM symboal echoes boppe de cyclic prefix lingte en fergrutsje de BER.

Reverberation* - in stadige fermindering fan lûdintensiteit fanwege syn meardere refleksjes.

De ûndersikers demonstrearren de veelzijdigheid fan har systeem fierder troch it ta te passen op 6 ferskillende ferskes út trije sjenres (tabel hjirûnder).

Lêze tusken de notysjes: it datatransmissionsysteem yn muzyk
Tabel No.. 1: lieten brûkt yn tests.

Ek kinne wy ​​​​troch de tabelgegevens de bitrate en bitflaterraten foar elk ferske sjen. De gegevens tariven binne oars omdat differinsjaaloperator BPSK (fase shift keying) wurket better as deselde subcarriers wurde brûkt. En dit is mooglik as neistlizzende segminten befetsje deselde maskering eleminten. Trochrinnende lûde ferskes jouwe in optimale basis foar gegevensferbergjen, om't de maskerfrekwinsjes sterker oanwêzich binne oer in breed frekwinsjeberik. Snelle muzyk kin OFDM-symboalen mar foar in part maskerje troch de fêste lingte fan it analysefinster.

Dêrnei begûnen minsken it systeem te testen, dy't moasten bepale hokker melody oarspronklik wie en wat feroare waard troch de ynformaasje dy't deryn ynbêde. Foar dit doel waarden 12-sekonden úttreksels fan lieten fan tafel nûmer 1 op in spesjale webside pleatst.

Yn it earste eksperimint (E1) krige elke dielnimmer in wizige of orizjinele fragmint om nei te harkjen en moast beslute oft it fragmint oarspronklik of feroare wie. Yn it twadde eksperimint (E2) koene de dielnimmers safolle kearen nei beide ferzjes harkje as se woene, en dan beslute hokker orizjineel wie en hokker wie feroare.

Lêze tusken de notysjes: it datatransmissionsysteem yn muzyk
Tabel No.. 2: resultaten fan eksperiminten E1 en E2.

De resultaten fan it earste eksperimint hawwe twa yndikatoaren: p(O|O) - it persintaazje dielnimmers dy't de orizjinele melody korrekt markearren en p(O|M) - it persintaazje dielnimmers dy't de feroare ferzje fan 'e melody markearren as orizjineel.

It is nijsgjirrich dat guon dielnimmers, neffens de ûndersikers, bepaalde feroare meldijen as oarspronkliker beskôgen as it orizjineel sels. It gemiddelde fan beide eksperiminten suggerearret dat de gemiddelde harker gjin ferskil soe fernimme tusken in gewoane melody en ien dêr't gegevens yn ynbêde binne.

Natuerlik sille muzykeksperts en muzikanten wat ûnkrektens en fertochte eleminten yn 'e feroare meldijen kinne ûntdekke, mar dizze eleminten binne net sa wichtich dat se ûngemak feroarsaakje.

En no kinne wy ​​sels meidwaan oan it eksperimint. Hjirûnder binne twa ferzjes fan deselde melody - de oarspronklike en de wizige. Kinne jo it ferskil hearre?

Orizjinele ferzje fan 'e melody
vs
Feroare ferzje fan 'e melody

Foar in mear detaillearre kunde mei de nuânses fan 'e stúdzje, advisearje ik om te sjen melde ûndersyk groep.

Jo kinne ek in ZIP-argyf downloade fan audiobestannen fan 'e orizjinele en wizige tunes brûkt yn' e stúdzje by dizze keppeling.

Epilogue

Yn dit wurk beskreau ôfstudearden fan ETH Zürich in geweldig gegevensferfiersysteem binnen muzyk. Om dit te dwaan, brûkten se frekwinsjemaskering, wêrtroch it mooglik makke om de gegevens yn te ynbêden yn 'e melody spile troch de sprekker. Dizze melody wurdt waarnommen troch de mikrofoan fan it apparaat, dy't de ferburgen gegevens erkent en dekodearret, wylst de gemiddelde harker it ferskil net iens fernimme sil. Yn 'e takomst plan de jonges te ûntwikkeljen harren systeem, selektearjen mear avansearre metoaden foar ynfiering fan gegevens yn audio.

As immen komt mei wat ûngewoane, en vooral, iets dat wurket, wy binne altyd bliid. Mar noch mear wille is dat dizze útfining is makke troch jonge minsken. Wittenskip hat gjin leeftydsbeperkingen. En as jongeren de wittenskip saai fine, dan wurdt dy sa te sizzen út de ferkearde hoeke presintearre. Ommers, lykas wy witte, is de wittenskip in geweldige wrâld dy't noait ophâldt te fernuverjen.

Freed off-top:


Om't wy it oer muzyk hawwe, of leaver rockmuzyk, is hjir in prachtige reis troch de gebieten fan rock.


Queen, "Radio Ga Ga" (1984).

Betanke foar it lêzen, bliuw nijsgjirrich, en hawwe in geweldich wykein jonges! 🙂

Tankewol foar it bliuwen by ús. Hâld jo fan ús artikels? Wolle jo mear ynteressante ynhâld sjen? Stypje ús troch in bestelling te pleatsen of oan te befeljen oan freonen, 30% koarting foar Habr-brûkers op in unike analoog fan servers op yngongsnivo, dy't troch ús foar jo útfûn is: De hiele wierheid oer VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps fan $20 of hoe te dielen in tsjinner? (beskikber mei RAID1 en RAID10, oant 24 kearnen en oant 40GB DDR4).

Dell R730xd 2 kear goedkeaper? Allinne hjir 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV fan $199 yn Nederlân! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - fan $99! Lêze oer Hoe kinne jo Infrastructure Corp. klasse mei it brûken fan Dell R730xd E5-2650 v4 tsjinners wurdich 9000 euro foar in penny?

Boarne: www.habr.com

Add a comment