Kusoma kati ya maelezo: mfumo wa upitishaji data ndani ya muziki

Kusoma kati ya maelezo: mfumo wa upitishaji data ndani ya muziki

Eleza maneno ambayo hayawezi kuwasilisha; kuhisi aina mbalimbali za hisia zilizounganishwa katika kimbunga cha hisia; kujitenga na ardhi, mbingu na hata Ulimwengu wenyewe, kwenda kwa safari ambapo hakuna ramani, hakuna barabara, hakuna ishara; vumbua, sema na upate uzoefu wa hadithi nzima ambayo itabaki kuwa ya kipekee na isiyoweza kuigwa. Haya yote yanaweza kufanywa na muziki - sanaa ambayo imekuwepo kwa maelfu ya miaka na inafurahisha masikio na mioyo yetu.

Walakini, muziki, au tuseme kazi za muziki, zinaweza kutumika sio tu kwa raha ya uzuri, lakini pia kwa usambazaji wa habari iliyosimbwa ndani yao, iliyokusudiwa kwa kifaa fulani na isiyoonekana kwa msikilizaji. Leo tutafahamiana na utafiti usio wa kawaida sana ambao wanafunzi waliohitimu kutoka ETH Zurich waliweza, bila kutambuliwa na sikio la mwanadamu, kuanzisha data fulani katika kazi za muziki, kwa sababu ambayo muziki yenyewe inakuwa njia ya maambukizi ya data. Je, walitekeleza vipi teknolojia yao, je, nyimbo zilizo na na bila data iliyopachikwa ni tofauti sana, na majaribio ya vitendo yalionyesha nini? Tunajifunza kuhusu hili kutokana na ripoti ya watafiti. Nenda.

Msingi wa utafiti

Watafiti huita teknolojia yao ya upitishaji data ya akustisk. Wakati mzungumzaji anapocheza wimbo uliobadilishwa, mtu huiona kama kawaida, lakini, kwa mfano, simu mahiri inaweza kusoma habari iliyosimbwa kati ya mistari, au tuseme kati ya noti, kwa kusema. Wanasayansi (ukweli kwamba watu hawa bado ni wanafunzi waliohitimu haiwazuii kuwa wanasayansi) huita kasi na uaminifu wa maambukizi wakati wa kudumisha kiwango cha vigezo hivi, bila kujali faili ya sauti iliyochaguliwa, kama kipengele muhimu zaidi katika utekelezaji wa mbinu hii ya kuhamisha data. Psychoacoustics, ambayo inasoma masuala ya kisaikolojia na kisaikolojia ya mtazamo wa binadamu wa sauti, husaidia kukabiliana na kazi hii.

Msingi wa uwasilishaji wa data ya akustisk inaweza kuitwa OFDM (orthogonal frequency division multiplexing), ambayo, pamoja na urekebishaji wa vibebaji vidogo kwenye muziki wa chanzo kwa muda, ilifanya iwezekane kutumia upeo wa masafa ya zinaa kwa upitishaji wa habari. Shukrani kwa hili, iliwezekana kufikia kasi ya maambukizi ya bps 412 kwa umbali wa hadi mita 24 (kiwango cha makosa <10%). Majaribio ya vitendo yaliyohusisha watu 40 wa kujitolea yalithibitisha ukweli kwamba karibu haiwezekani kusikia tofauti kati ya wimbo wa asili na ule ambao habari hiyo ilipachikwa.

Teknolojia hii inaweza kutumika wapi katika mazoezi? Watafiti wana jibu lao wenyewe: karibu smartphones zote za kisasa, laptops na vifaa vingine vya mkono vina vifaa vya maikrofoni, na sehemu nyingi za umma (mikahawa, migahawa, vituo vya ununuzi, nk) zina wasemaji wenye muziki wa nyuma. Mdundo huu wa usuli unaweza, kwa mfano, kujumuisha data ya kuunganisha kwenye mtandao wa Wi-Fi bila hitaji la vitendo vya ziada.

Vipengele vya jumla vya uwasilishaji wa data ya akustisk imekuwa wazi kwetu; sasa wacha tuendelee kwenye uchunguzi wa kina wa muundo wa mfumo huu.

Maelezo ya Mfumo

Kuanzishwa kwa data katika melody hutokea kutokana na masking frequency. Katika nafasi za muda, masafa ya ufunikaji hutambuliwa na watoa huduma wadogo wa OFDM walio karibu na vipengele hivi vya ufunikaji hujazwa na data.

Kusoma kati ya maelezo: mfumo wa upitishaji data ndani ya muziki
Picha #1: Kubadilisha faili asili kuwa mawimbi ya mchanganyiko (melody + data) inayotumwa kupitia spika.

Kuanza, ishara asili ya sauti imegawanywa katika sehemu zinazofuatana kwa uchambuzi. Kila sehemu kama hiyo (Hi) ya L = 8820 sampuli, sawa na 200 ms, inazidishwa na dirisha* ili kupunguza athari za mipaka.

Dirisha* ni kipengele cha uzani kinachotumiwa kudhibiti athari kutokana na kando katika makadirio ya spectral.

Kisha, masafa makuu ya mawimbi asilia yaligunduliwa katika safu kutoka 500 Hz hadi 9.8 kHz, ambayo ilifanya iwezekane kupata masafa ya masking fM,l kwa sehemu hii. Kwa kuongeza, data ilipitishwa katika safu ndogo kutoka 9.8 hadi 10 kHz ili kuanzisha eneo la wabebaji wadogo kwenye mpokeaji. Kikomo cha juu cha masafa ya masafa yaliyotumika kiliwekwa kuwa 10 kHz kutokana na unyeti mdogo wa maikrofoni ya smartphone kwenye masafa ya juu.

Masafa ya kuficha yamebainishwa kwa kila sehemu iliyochanganuliwa kibinafsi. Kwa kutumia mbinu ya HPS (Harmonic Product Spectrum), masafa matatu makuu yalitambuliwa na kisha kuzungushwa hadi madokezo yaliyo karibu zaidi kwenye mizani ya kromatiki inayolingana. Hivi ndivyo maelezo makuu fF,i = 1…3 yalivyopatikana, yakiwa kati ya funguo C0 (16.35 Hz) na B0 (30.87 Hz). Kulingana na ukweli kwamba vidokezo vya msingi ni vya chini sana kwa matumizi katika uwasilishaji wa data, oktava zao za juu 500kfF,i zilikokotolewa katika masafa 9.8 Hz ... 2 kHz. Mengi ya masafa haya (fO,l1) yalitamkwa zaidi kutokana na asili ya HPS.

Kusoma kati ya maelezo: mfumo wa upitishaji data ndani ya muziki
Picha #2: Oktaba zilizokokotwa za FO,l1 kwa madokezo ya kimsingi na maumbo fH,l2 ya toni kali zaidi.

Seti iliyotokana ya oktava na maumbo ilitumika kama masafa ya kufunika, ambapo masafa ya wabebaji wa OFDM fSC,k yalitolewa. Vibebaji vidogo viwili viliingizwa chini na juu ya kila masafa ya kufunika.

Kisha, wigo wa sehemu ya sauti ya Hi ilichujwa kwa masafa ya mtoa huduma mdogo fSC,k. Baada ya hapo, ishara ya OFDM iliundwa kulingana na biti za habari katika Bi, kwa sababu hiyo sehemu ya mchanganyiko ya Ci inaweza kupitishwa kupitia spika. Ukubwa na awamu za vibebaji vidogo lazima zichaguliwe ili mpokeaji atoe data iliyosambazwa huku msikilizaji haoni mabadiliko katika wimbo.

Kusoma kati ya maelezo: mfumo wa upitishaji data ndani ya muziki
Picha Nambari 3: sehemu ya masafa na masafa ya mtoaji wa sehemu ya Hi ya wimbo asili.

Wakati ishara ya sauti iliyo na habari iliyosimbwa ndani yake inachezwa kupitia spika, maikrofoni ya kifaa kinachopokea huirekodi. Ili kupata nafasi za kuanzia za alama za OFDM zilizopachikwa, rekodi zinahitaji kuchujwa kwanza. Kwa njia hii, masafa ya juu ya masafa hutolewa, ambapo hakuna ishara za kuingiliwa kwa muziki kati ya wabebaji wadogo. Unaweza kupata mwanzo wa alama za OFDM kwa kutumia kiambishi awali cha mzunguko.

Baada ya kugundua mwanzo wa alama za OFDM, mpokeaji hupata taarifa kuhusu noti kuu kupitia usimbaji wa masafa ya juu ya kikoa. Kwa kuongezea, OFDM ni sugu kwa vyanzo vya mwingiliano wa bendi nyembamba, kwani huathiri tu baadhi ya watoa huduma wadogo.

Vipimo vya vitendo

Spika ya KRK Rokit 8 ilifanya kazi kama chanzo cha nyimbo zilizobadilishwa, na simu mahiri ya Nexus 5X ilicheza jukumu la karamu ya kupokea.

Kusoma kati ya maelezo: mfumo wa upitishaji data ndani ya muziki
Picha #4: Tofauti kati ya OFDM halisi na vilele vya uunganisho vinavyopimwa ndani ya nyumba kwa mita 5 kati ya spika na maikrofoni.

Alama nyingi za OFDM ziko katika safu kutoka 0 hadi 25 ms, kwa hivyo unaweza kupata mwanzo halali ndani ya kiambishi awali cha mzunguko cha 66.6 ms. Watafiti wanabainisha kuwa mpokeaji (katika jaribio hili, simu mahiri) huzingatia kuwa alama za OFDM huchezwa mara kwa mara, jambo ambalo huboresha utambuzi wao.

Jambo la kwanza kuangalia lilikuwa athari ya umbali kwenye kiwango cha makosa kidogo (BER). Kwa kufanya hivyo, vipimo vitatu vilifanyika katika aina tofauti za vyumba: ukanda na carpet, ofisi yenye linoleum kwenye sakafu, na ukumbi wa sakafu ya mbao.


Wimbo "And The Cradle Will Rock" wa Van Halen ulichaguliwa kuwa somo la majaribio.

Sauti ya sauti ilirekebishwa ili kiwango cha sauti kilichopimwa na smartphone kwa umbali wa m 2 kutoka kwa msemaji ilikuwa 63 dB.

Kusoma kati ya maelezo: mfumo wa upitishaji data ndani ya muziki
Picha Nambari 5: Viashiria vya BER kulingana na umbali kati ya msemaji na kipaza sauti (mstari wa bluu - watazamaji, kijani - ukanda, machungwa - ofisi).

Katika barabara ya ukumbi, sauti ya 40 dB ilichukuliwa na smartphone kwa umbali wa hadi mita 24 kutoka kwa msemaji. Katika darasani kwa umbali wa m 15 sauti ilikuwa 55 dB, na katika ofisi kwa umbali wa mita 8 kiwango cha sauti kilichotambuliwa na smartphone kilifikia 57 dB.

Kwa sababu ukumbi na ofisi zina sauti ya kurejea, mwangwi wa alama za marehemu wa OFDM unazidi urefu wa kiambishi awali cha mzunguko na kuongeza BER.

Reverberation* - kupungua kwa kasi kwa sauti kwa sababu ya tafakari zake nyingi.

Watafiti walionyesha zaidi uthabiti wa mfumo wao kwa kuutumia kwa nyimbo 6 tofauti kutoka kwa aina tatu (jedwali hapa chini).

Kusoma kati ya maelezo: mfumo wa upitishaji data ndani ya muziki
Jedwali Nambari 1: nyimbo zinazotumiwa katika majaribio.

Pia, kupitia data ya jedwali, tunaweza kuona kiwango kidogo na viwango vya makosa kidogo kwa kila wimbo. Viwango vya data ni tofauti kwa sababu BPSK tofauti (ufunguo wa mabadiliko ya awamu) hufanya kazi vyema wakati watoa huduma wadogo sawa hutumiwa. Na hii inawezekana wakati makundi ya karibu yana vipengele sawa vya masking. Nyimbo za sauti zinazoendelea hutoa msingi bora wa kuficha data kwa sababu masafa ya kuficha yanapatikana kwa nguvu zaidi juu ya masafa mapana. Muziki wa kasi unaweza kufunika tu alama za OFDM kwa kiasi kutokana na urefu usiobadilika wa dirisha la uchanganuzi.

Kisha, watu walianza kupima mfumo, ambao walipaswa kuamua ni wimbo gani ulikuwa wa asili na ambao ulirekebishwa na habari iliyoingia ndani yake. Kwa kusudi hili, sehemu za nyimbo za sekunde 12 kutoka kwa meza Nambari 1 ziliwekwa kwenye tovuti maalum.

Katika jaribio la kwanza (E1), kila mshiriki alipewa kipande kilichorekebishwa au asili ili asikilize na ilibidi aamue ikiwa kipande hicho kilikuwa cha asili au kimerekebishwa. Katika jaribio la pili (E2), washiriki wangeweza kusikiliza matoleo yote mawili mara nyingi walivyotaka, na kisha kuamua lipi lilikuwa la asili na lipi lilirekebishwa.

Kusoma kati ya maelezo: mfumo wa upitishaji data ndani ya muziki
Jedwali Nambari 2: matokeo ya majaribio E1 na E2.

Matokeo ya jaribio la kwanza yana viashirio viwili: p(O|O) - asilimia ya washiriki waliotia alama kwa usahihi wimbo asilia na p(O|M) - asilimia ya washiriki waliotia alama toleo lililorekebishwa la mdundo kuwa halisi.

Inafurahisha, baadhi ya washiriki, kulingana na watafiti, walizingatia nyimbo fulani zilizobadilishwa kuwa asili zaidi kuliko asili yenyewe. Wastani wa majaribio yote mawili unapendekeza kuwa msikilizaji wastani hataona tofauti kati ya wimbo wa kawaida na ule ambao data ilipachikwa.

Kwa kawaida, wataalam wa muziki na wanamuziki wataweza kugundua baadhi ya makosa na vipengele vya kutiliwa shaka katika nyimbo zilizobadilishwa, lakini vipengele hivi sio muhimu sana na kusababisha usumbufu.

Na sasa sisi wenyewe tunaweza kushiriki katika majaribio. Chini ni matoleo mawili ya wimbo huo - ya asili na iliyorekebishwa. Je, unaweza kusikia tofauti?

Toleo la asili la wimbo
vs
Toleo lililobadilishwa la wimbo

Kwa ufahamu wa kina zaidi na nuances ya utafiti, napendekeza kutazama ripoti kikundi cha utafiti.

Unaweza pia kupakua kumbukumbu ya ZIP ya faili za sauti za nyimbo asili na zilizorekebishwa zilizotumika katika utafiti kiungo hiki.

Epilogue

Katika kazi hii, wanafunzi waliohitimu kutoka ETH Zurich walielezea mfumo wa ajabu wa upitishaji data ndani ya muziki. Ili kufanya hivyo, walitumia masking ya frequency, ambayo ilifanya iwezekane kupachika data kwenye wimbo uliochezwa na mzungumzaji. Wimbo huu unatambuliwa na maikrofoni ya kifaa, ambayo inatambua data iliyofichwa na kuifafanua, wakati msikilizaji wa kawaida hata hataona tofauti. Katika siku zijazo, wavulana wanapanga kukuza mfumo wao, wakichagua njia za juu zaidi za kuanzisha data kwenye sauti.

Wakati mtu anakuja na kitu kisicho cha kawaida, na muhimu zaidi, kitu kinachofanya kazi, tunafurahi kila wakati. Lakini furaha zaidi ni kwamba uvumbuzi huu uliundwa na vijana. Sayansi haina vikwazo vya umri. Na ikiwa vijana wanaona sayansi kuwa ya kuchosha, basi inawasilishwa kutoka kwa pembe isiyofaa, kwa kusema. Baada ya yote, kama tunavyojua, sayansi ni ulimwengu wa kushangaza ambao hauachi kushangaa.

Ijumaa kutoka juu:


Kwa kuwa tunazungumza juu ya muziki, au tuseme muziki wa roki, hapa kuna safari nzuri kupitia upanuzi wa rock.


Malkia, "Radio Ga Ga" (1984).

Asante kwa kusoma, endelea kutaka kujua, na uwe na wikendi njema guys! πŸ™‚

Asante kwa kukaa nasi. Je, unapenda makala zetu? Je, ungependa kuona maudhui ya kuvutia zaidi? Tuunge mkono kwa kuweka agizo au kupendekeza kwa marafiki, Punguzo la 30% kwa watumiaji wa Habr kwenye analogi ya kipekee ya seva za kiwango cha kuingia, ambayo tulikutengenezea: Ukweli wote kuhusu VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps kutoka $20 au jinsi ya kushiriki seva? (inapatikana kwa RAID1 na RAID10, hadi cores 24 na hadi 40GB DDR4).

Dell R730xd mara 2 nafuu? Hapa tu 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV kutoka $199 nchini Uholanzi! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - kutoka $99! Soma kuhusu Jinsi ya kujenga miundombinu ya Corp. darasa na matumizi ya seva za Dell R730xd E5-2650 v4 zenye thamani ya euro 9000 kwa senti?

Chanzo: mapenzi.com

Kuongeza maoni