Xwendina di navbera notan de: pergala veguheztina daneyê di hundurê muzîkê de

Xwendina di navbera notan de: pergala veguheztina daneyê di hundurê muzîkê de

Tiştê ku peyv nikarin ragihînin îfade bikin; hestên cûrbecûr hestên ku di bahozek hestan de bi hev ve girêdayî ne; ku ji erd, ezman û heta ji Gerdûnê bi xwe biqete, biçe rêwîtiyek ku ne nexşe, ne rê, ne nîşanek lê hene; Çîrokek tevahî ku dê her dem bêhempa û bêhempa bimîne, îcad bike, bêje û biceribîne. Ev hemî bi muzîkê dikare were kirin - hunerek ku bi hezaran salan heye û guh û dilê me xweş dike.

Lêbelê, muzîk, an bêtir karên mûzîkî, ne tenê ji bo kêfa estetîkî, lê di heman demê de ji bo veguheztina agahdariya ku di wan de kodkirî ye, ku ji bo hin amûran hatî armanc kirin û ji guhdaran re nayê dîtin jî xizmet dike. Îro em ê bi lêkolînek pir neasayî re nas bikin ku tê de xwendekarên mezûn ên ETH Zurichê karîbûn, bêyî guhê mirovan, hin daneyan bixin nav xebatên muzîkê, ji ber vê yekê muzîk bixwe dibe kanalek ragihandina daneyê. Wan bi rastî teknolojiya xwe çawa bicîh anîn, gelo melodiyên bi û bêyî daneyên pêvekirî pir cûda ne, û ceribandinên pratîkî çi nîşan dan? Em vê yekê ji rapora lêkolîneran hîn dibin. Ajotin.

Bingeha lêkolînê

Lekolînwan ji teknolojiya xwe re dibêjin teknolojiya ragihandina daneya akustîk. Gava ku axaftvanek melodiyek guhezbar dilîze, mirov wê wekî normal dihesibîne, lê, mînakî, smartphone dikare agahdariya kodkirî di navbera rêzan de, an jî di navbera notan de, bi vî rengî bixwîne. Zanyar (rastiya ku ev xort hîn jî xwendekarên mezûn in, rê li ber wan nagire ku bibin zanyar) bilez û pêbaweriya ragihandinê dema ku asta van parameteran diparêze, bêyî ku pelê dengî yê hilbijartî bigire, wekî aliyek herî girîng di pêkanîna ev teknîka veguhastina daneyê. Psychoacoustics, ku aliyên psîkolojîk û fîzyolojîkî yên têgihîştina dengan a mirovan lêkolîn dike, ji bo ku bi vî karî re mijûl bibe dibe alîkar.

Naveroka veguheztina daneya akustîk dikare were navandin OFDM (multiplekskirina dabeşkirina frekansa ortogonal), ku, ligel adaptasyona binekarkeran ji muzîka çavkaniyê re bi demê re, gengaz kir ku ji bo veguheztina agahdarî ji spektura frekansa veguhezbar herî zêde bikar bînin. Bi saya vê yekê, gengaz bû ku bigihîje leza veguheztinê 412 bps li ser dûriyek heya 24 metreyî (rêjeya xeletiyê < 10%). Ceribandinên praktîkî yên ku bi 40 dilxwazan ve tê de rastiyek piştrast kir ku ne gengaz e ku meriv cûdahiya di navbera melodiya orîjînal û ya ku tê de agahdarî tê de ye bibihîze.

Li ku derê ev teknolojî dikare di pratîkê de were sepandin? Lekolînwan bersiva xwe heye: hema hema hemî têlefonên nûjen, laptop û cîhazên din ên destan bi mîkrofonan ve têne saz kirin, û gelek cihên giştî (qahwexane, xwaringeh, navendên danûstendinê, hwd.) xwedî axaftvanên bi muzîka paşîn in. Ev melodiya paşîn dikare, mînakî, daneyên ji bo girêdana bi torgilokek Wi-Fi-yê re bêyî ku hewcedariya kiryarên zêde hebe, bigire.

Taybetmendiyên giştî yên veguheztina daneya akustîk ji me re zelal bûne; naha em biçin lêkolînek berfireh a avahiya vê pergalê.

Danasîna pergalê

Danasîna daneyan di melodiyê de ji ber maskeya frekansê pêk tê. Di hêlînên demê de, frekansên maskekirinê têne nas kirin û jêrkêşên OFDM yên nêzî van hêmanên maskekirinê bi daneyan têne dagirtin.

Xwendina di navbera notan de: pergala veguheztina daneyê di hundurê muzîkê de
Wêne #1: Veguheztina pelê orîjînal bo îşaretek pêkhatî (melodî + dane) ku bi axaftvanan ve hatî şandin.

Ji bo destpêkê, sînyala dengî ya orîjînal ji bo analîzê li beşên li pey hev tê dabeş kirin. Her perçeyek weha (Hi) ya L = 8820 nimûne, ku 200 ms wekhev e, bi pace* ji bo kêmkirina bandorên sînor.

Pace* fonksiyonek girankirinê ye ku ji bo kontrolkirina bandorên ji ber aligirên di texmînên spektral de tê bikar anîn.

Dûv re, frekansên serdest ên sînyala orîjînal di navbera 500 Hz heya 9.8 kHz de hatin tespît kirin, ku ev gengaz kir ku ji bo vê beşê frekansên maskekirinê fM,l bistînin. Wekî din, data di navberek piçûk de ji 9.8 heta 10 kHz hate şandin da ku cîhê bine-hilgiran li wergirê saz bike. Ji ber hestiyariya kêm a mîkrofonên smartphone di frekansên bilind de sînorê jorîn ê frekansa ku hatî bikar anîn 10 kHz hate danîn.

Frekansên maskkirinê ji bo her beşê analîzkirî bi rengek kesane hatine destnîşankirin. Bi karanîna rêbaza HPS (Harmonic Product Spectrum), sê frekansên serdest hatin nas kirin û dûv re li ser pîvana kromatîkî ya ahengî bi notên herî nêzîk ve hatin dorpêç kirin. Bi vî awayî notên sereke fF,i = 1…3, di navbera bişkokên C0 (16.35 Hz) û B0 (30.87 Hz) de hatine bidestxistin. Li ser bingeha vê rastiyê ku notên bingehîn ji bo karanîna di veguheztina daneyê de pir kêm in, oktavên wan ên bilind 500kfF,i di rêza 9.8 Hz ... 2 kHz de hatine hesibandin. Gelek ji van frekansan (fO,l1) ji ber xwezaya HPS-ê bêtir diyar bûn.

Xwendina di navbera notan de: pergala veguheztina daneyê di hundurê muzîkê de
Wêne #2: Ji bo notên bingehîn û ahengên fH,l1 yên dengê herî xurt oktavên fO,l2 têne hesibandin.

Di encamê de komek oktava û ahengan wekî frekansên nixumandî hatin bikar anîn, ku ji wan frekansên binerdkar ên OFDM fSC,k hatine girtin. Li jêr û li jor her frekansa maskkirinê du binehilgir hatin danîn.

Dûv re, spektora beşa bihîstwerê ya Hi li frekansên binerd fSC,k hate fîlter kirin. Piştî wê, sembolek OFDM li ser bingeha bitên agahdarî li Bi hate afirandin, ji ber vê yekê beşa pêkhatî Ci dikare bi axaftvan ve were veguheztin. Pêdivî ye ku mezinahî û qonaxên hilgiran werin hilbijartin da ku wergir bikaribe daneyên hatî şandin derxîne dema ku guhdar di melodiyê de guh nade guhertinan.

Xwendina di navbera notan de: pergala veguheztina daneyê di hundurê muzîkê de
Wêneya No. 3: Parçeyek ji frekansên spektrûm û binehilgir ên beşa Hi ya melodiya orjînal.

Dema ku sînyalek dengî ya ku agahdariya tê de kodkirî ye bi axaftvanan tê lîstin, mîkrofona cîhaza wergir wê tomar dike. Ji bo dîtina pozîsyonên destpêkê yên sembolên OFDM-ê yên pêvekirî, pêdivî ye ku tomar pêşî bi bandpasê bêne fîlter kirin. Bi vî rengî, rêza frekansa jorîn tê derxistin, ku li wir di navbera binekarkeran de îşaretên destwerdana muzîkê tune. Hûn dikarin destpêka sembolên OFDM-ê bi karanîna pêşgirek cyclic bibînin.

Piştî tespîtkirina destpêka sembolên OFDM, wergir di nav deşîfrekirina qada frekansa bilind de agahdariya li ser notên herî serdest digire. Digel vê yekê, OFDM li hember çavkaniyên navbeynkariya teng-bandê pir berxwedêr e, ji ber ku ew tenê bandorê li hin binavberan dikin.

Testên pratîk

Axaftvana KRK Rokit 8 wekî çavkaniya melodiyên guhertî tevdigere, û smartphone Nexus 5X rola partiya wergir lîst.

Xwendina di navbera notan de: pergala veguheztina daneyê di hundurê muzîkê de
Wêne #4: Cûdahiya di navbera OFDM-a rastîn û lûtkeyên pêwendiyê de ku li hundurê 5 m di navbera axaftvan û mîkrofonê de têne pîvandin.

Piraniya xalên OFDM di rêza 0 heya 25 ms de ne, ji ber vê yekê hûn dikarin di nav pêşgira 66.6 ms de destpêkek derbasdar bibînin. Lekolînwan destnîşan dikin ku wergirê (di vê ceribandinê de, smartphone) dihesibîne ku sembolên OFDM bi periyodîk têne lîstin, ku ev tespîtkirina wan çêtir dike.

Yekem tiştê ku hate kontrol kirin bandora dûrbûnê li ser rêjeya xeletiya bit (BER) bû. Ji bo vê yekê, sê ceribandin li cûrbecûr jûreyan hatin kirin: korîdorek bi xalîçe, nivîsgehek bi linoleum li erdê, û salonek bi zemînek darîn.


Strana "And The Cradle Will Rock" ya Van Halen wekî mijara testê hate hilbijartin.

Hêjmara deng bi vî rengî hate sererast kirin ku asta dengê ku ji hêla smartphone ve li dûrahiya 2 m ji axaftvan tê pîvandin 63 dB bû.

Xwendina di navbera notan de: pergala veguheztina daneyê di hundurê muzîkê de
Wêneya Hejmar 5: Nîşaneyên BER-ê li gorî dûrahiya di navbera axaftvan û mîkrofonê de (xêza şîn - temaşevan, kesk - korîdor, porteqalî - nivîsgeh) ve girêdayî ye.

Di korîdorê de dengek 40 dB bi telefona smart bi dûrahiya 24 metreyan ji dengbêjê hat girtin. Di dersxaneyê de li dûrahiya 15 m deng 55 dB bû, û di ofîsê de li dûrahiya 8 metreyî de asta dengê ku ji hêla smartphone ve tê fêm kirin gihîşt 57 dB.

Ji ber ku salon û ofîs rewantir in, dengbêjên dereng ên sembola OFDM ji dirêjahiya pêşgira çerxê derbas dibin û BER zêde dikin.

Reverberation* - kêmbûna gav bi gav di xurtbûna deng de ji ber refleksên wê yên pirjimar.

Lekolînwanan bi sepandina wê li ser 6 stranên cihêreng ên ji sê celeban (tabloya jêrîn) pirrengiya pergala xwe nîşan dan.

Xwendina di navbera notan de: pergala veguheztina daneyê di hundurê muzîkê de
Tabloya Hejmar 1: Stranên ku di testan de têne bikar anîn.

Di heman demê de, bi daneyên tabloyê, em dikarin rêjeya bit û rêjeyên xeletiya bit ji bo her stranê bibînin. Rêjeyên daneyê cûda ne ji ber ku BPSK-ya cihêreng (bişkojka guheztina qonaxê) dema ku heman bine-hilgir têne bikar anîn çêtir dixebite. Û ev mimkun e dema ku beşên cîran heman hêmanên maskkirinê hene. Stranên domdar ên bi deng ji bo veşartina daneyan bingehek çêtirîn peyda dikin ji ber ku frekansên maskekirinê di navberek frekansa fireh de bihêztir in. Ji ber dirêjahiya sabît a pencereya analîzê, muzîka bilez tenê dikare bi qismî sembolên OFDM mask bike.

Dûv re, mirovan dest bi ceribandina pergalê kir, yê ku diviyabû diyar bike ka kîjan melodiya orîjînal e û kîjan ji hêla agahdariya ku tê de hatî guheztin. Bi vê mebestê di malpereke taybet de beşên 12 saniyeyî yên stranên tabloya hejmar 1 hatin belavkirin.

Di ceribandina yekem de (E1), ji her beşdarekî re perçeyek guhertî an orîjînal hat dayîn ku lê guhdarî bike û neçar bû ku biryar bide ka ew perçe orîjînal e an hatî guherandin. Di azmûna duyemîn de (E2), beşdaran dikaribûn çend caran li her du guhertoyan guhdarî bikin, û dûv re biryar bidin ka kîjan orîjînal bû û kîjan hate guherandin.

Xwendina di navbera notan de: pergala veguheztina daneyê di hundurê muzîkê de
Tablo No. 2: encamên ceribandinên E1 û E2.

Di encamên ceribandina yekem de du nîşan hene: p(O|O) - rêjeya beşdaran ku melodiya orîjînal rast nîşan kirine û p(O|M) - rêjeya beşdarên ku guhertoya guhertî ya melodiyê wekî orîjînal nîşan dane.

Balkêş e ku hin beşdaran, li gorî lêkolîneran, hin melodiyên guhertî ji orîjînalê xwe orîjînaltir dîtine. Navînî ya her du ceribandinan destnîşan dike ku guhdarê navîn dê cûdahiyek di navbera melodiyek birêkûpêk û ya ku tê de dane tê de cih girtiye nebîne.

Bi xwezayî, pispor û muzîkjenên muzîkê dê karibin di melodiyên guhertî de hin nerastî û hêmanên gumanbar tespît bikin, lê ev hêman ne ew qas girîng in ku bibin sedema nerehetiyê.

Û niha em bixwe dikarin beşdarî ceribandinê bibin. Li jêr du guhertoyên heman melodiyê hene - ya orîjînal û ya guhertî. Hûn dikarin cûdahiyê bibihîzin?

Guhertoya orjînal a melodiyê
vs
Guhertoya guhertoya melodiyê

Ji bo têgihîştina hûrgulî ya hûrgelên lêkolînê, ez pêşniyar dikim ku li ser çavan bigerim nûçe koma lêkolînê.

Her weha hûn dikarin arşîvek ZIP ya pelên dengî yên awazên orîjînal û guhertî yên ku di lêkolînê de hatine bikar anîn dakêşin vê girêdanê.

Încîlê

Di vê xebatê de, xwendekarên mezûn ên ji ETH Zurichê pergalek ragihandina daneya ecêb di nav muzîkê de şirove kirin. Ji bo vê yekê, wan maskeya frekansê bikar anîn, ku ev gengaz kir ku daneyan têxin nav melodiya ku ji hêla axaftvan ve tê lîstin. Ev melodiya ji hêla mîkrofona cîhazê ve tê fêm kirin, ku daneyên veşartî nas dike û wê deşîfre dike, di heman demê de ku guhdarê navîn dê cûdahiyê jî nabîne. Di pêşerojê de, xort plan dikin ku pergala xwe pêşve bibin, ji bo danasîna daneyan di deng de rêbazên pêşkeftî hilbijêrin.

Gava ku kesek tiştek neasayî, û ya herî girîng, tiştek ku kar dike tê, em her gav kêfxweş in. Lê hê bêtir kêfxweş e ku ev îcad ji hêla ciwanan ve hatî çêkirin. Zanist ti astengên temenî tune. Û heke ciwan zanistê bêzar dibînin, wê hingê ew ji hêla xelet ve tê pêşkêş kirin, bi vî rengî. Beriya her tiştî, wekî ku em dizanin, zanist cîhanek ecêb e ku qet matmayî namîne.

Roja Înê ji top:


Ji ber ku em li ser muzîkê, an bêtir muzîka rockê dipeyivin, li vir rêwîtiyek ecêb di nav berbeha rockê de heye.


Queen, "Radio Ga Ga" (1984).

Spas ji bo xwendinê, meraq bimînin, û hefteyek xweş hebe heval! 🙂

Spas ji bo ku hûn bi me re bimînin. Ma hûn ji gotarên me hez dikin? Ma hûn dixwazin naveroka balkêştir bibînin? Piştgiriya me bikin bi danîna fermanek an pêşniyarkirina hevalan, 30% erzanî ji bo bikarhênerên Habr li ser analogek bêhempa ya pêşkêşkerên asta têketinê, ku ji hêla me ve ji bo we hatî vedîtin: Tevahiya rastiyê di derbarê VPS (KVM) E5-2650 v4 (6 Cores) 10 GB DDR4 240 GB SSD 1Gbps ji 20 $ an çawa serverek parve dike? (bi RAID1 û RAID10, heta 24 core û heya 40 GB DDR4 peyda dibe).

Dell R730xd 2 car erzantir? Tenê li vir 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV ji 199$ li Hollanda! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - ji $99! Li ser bixwînin Meriv çawa pargîdaniya binesaziyê ava dike. pola bi karanîna serverên Dell R730xd E5-2650 v4 bi nirxek 9000 euro ji bo quruşek?

Source: www.habr.com

Add a comment