Notlar arasında oxuma: musiqi daxilində məlumat ötürmə sistemi

Notlar arasında oxuma: musiqi daxilində məlumat ötürmə sistemi

Sözlərin çatdıra bilmədiyi şeyləri ifadə edin; hisslər qasırğasında bir-birinə qarışmış müxtəlif duyğuları hiss etmək; yerdən, göydən və hətta Kainatın özündən qopmaq, xəritələrin, yolların, işarələrin olmadığı bir səyahətə çıxmaq; həmişə unikal və təkrarolunmaz qalacaq bütöv bir hekayə icad edin, danışın və təcrübə edin. Bütün bunları musiqi - minilliklər boyu mövcud olan, qulağımızı, qəlbimizi sevindirən bir sənət etmək olar.

Lakin musiqi, daha doğrusu, musiqi əsərləri təkcə estetik zövq üçün deyil, həm də onlarda kodlaşdırılmış, hansısa qurğu üçün nəzərdə tutulmuş və dinləyiciyə görünməyən informasiyanın ötürülməsinə xidmət edə bilər. Bu gün biz çox qeyri-adi bir araşdırma ilə tanış olacağıq ki, ETH Sürixdən olan aspirantlar insan qulağının fərqinə varmadan müəyyən məlumatları musiqi əsərlərinə daxil edə bildilər, bunun sayəsində musiqi özü məlumat ötürmə kanalına çevrilir. Onlar texnologiyalarını tam olaraq necə tətbiq etdilər, daxil edilmiş məlumatlarla və olmayan melodiyalar çox fərqlidirmi və praktiki testlər nəyi göstərdi? Bu barədə tədqiqatçıların hesabatından öyrənirik. Get.

Tədqiqat bazası

Tədqiqatçılar öz texnologiyalarını akustik məlumat ötürmə texnologiyası adlandırırlar. Dinamik dəyişdirilmiş melodiya ifa edəndə insan bunu normal qəbul edir, lakin məsələn, smartfon sətirlər arasında, daha doğrusu, belə desək, notlar arasında kodlaşdırılmış məlumatları oxuya bilir. Alimlər (bu oğlanların hələ də aspirant olması onların alim olmasına mane olmur) seçilmiş audio fayldan asılı olmayaraq bu parametrlərin səviyyəsini qoruyarkən ötürülmə sürətini və etibarlılığını proqramın həyata keçirilməsində ən vacib cəhət adlandırırlar. bu məlumat ötürmə texnikası. İnsanın səsləri qavramasının psixoloji və fizioloji aspektlərini öyrənən psixoakustika bu vəzifənin öhdəsindən gəlməyə kömək edir.

Akustik məlumat ötürülməsinin nüvəsini OFDM (ortoqonal tezlik bölgüsü multipleksasiyası) adlandırmaq olar ki, bu da zamanla alt daşıyıcıların mənbə musiqisinə uyğunlaşması ilə yanaşı, məlumat ötürülməsi üçün ötürülən tezlik spektrindən maksimum istifadə etməyə imkan verdi. Bunun sayəsində 412 metrə qədər məsafədə 24 bps ötürmə sürətinə nail olmaq mümkün oldu (səhv nisbəti < 10%). 40 könüllünün iştirak etdiyi praktiki təcrübələr, orijinal melodiya ilə məlumatın daxil edildiyi melodiya arasındakı fərqi eşitməyin demək olar ki, mümkün olmadığını təsdiqlədi.

Bu texnologiya praktikada harada tətbiq oluna bilər? Tədqiqatçıların öz cavabı var: demək olar ki, bütün müasir smartfonlar, noutbuklar və digər əl cihazları mikrofonlarla təchiz olunub, bir çox ictimai yerlərdə (kafe, restoranlar, ticarət mərkəzləri və s.) fon musiqisi olan dinamiklər var. Bu fon melodiyasına, məsələn, əlavə tədbirlərə ehtiyac olmadan Wi-Fi şəbəkəsinə qoşulmaq üçün məlumatlar daxil ola bilər.

Akustik məlumat ötürülməsinin ümumi xüsusiyyətləri bizə aydın oldu, indi bu sistemin strukturunun ətraflı öyrənilməsinə keçək.

Sistem təsviri

Məlumatların melodiyaya daxil edilməsi tezliklərin maskalanması səbəbindən baş verir. Vaxt intervallarında maskalanma tezlikləri müəyyən edilir və bu maskalanma elementlərinə yaxın OFDM alt daşıyıcıları verilənlərlə doldurulur.

Notlar arasında oxuma: musiqi daxilində məlumat ötürmə sistemi
Şəkil #1: Orijinal faylın dinamiklər vasitəsilə ötürülən kompozit siqnala (melodiya + məlumat) çevrilməsi.

Başlamaq üçün orijinal səs siqnalı təhlil üçün ardıcıl seqmentlərə bölünür. 8820 ms-ə bərabər olan L = 200 nümunənin hər bir belə seqmenti (Hi) ilə vurulur. pəncərə* sərhəd təsirlərini minimuma endirmək.

Pəncərə* spektral təxminlərdə yan loblara görə təsirlərə nəzarət etmək üçün istifadə edilən çəki funksiyasıdır.

Sonra, orijinal siqnalın dominant tezlikləri 500 Hz-dən 9.8 kHz-ə qədər diapazonda aşkar edildi ki, bu da bu seqment üçün fM, l maskalanma tezliklərini əldə etməyə imkan verdi. Bundan əlavə, qəbuledicidə alt daşıyıcıların yerini təyin etmək üçün məlumatlar 9.8-dən 10 kHz-ə qədər kiçik diapazonda ötürüldü. İstifadə olunan tezlik diapazonunun yuxarı həddi smartfon mikrofonlarının yüksək tezliklərdə aşağı həssaslığına görə 10 kHz-ə təyin edilib.

Maskalanma tezliyi təhlil edilən hər bir seqment üçün ayrıca müəyyən edilmişdir. HPS (Harmonik Məhsul Spektr) metodundan istifadə edərək, üç dominant tezlik müəyyən edildi və sonra harmonik xromatik miqyasda ən yaxın qeydlərə yuvarlaqlaşdırıldı. C1 (3 Hz) və B0 (16.35 Hz) düymələri arasında yerləşən fF,i = 0…30.87 əsas notlar belə alındı. Fundamental notların məlumat ötürülməsində istifadə üçün çox aşağı olmasına əsaslanaraq, onların daha yüksək oktavaları 500kfF,i 9.8 Hz ... 2 kHz diapazonunda hesablanmışdır. Bu tezliklərin bir çoxu (fO, l1) SES-in təbiətinə görə daha aydın ifadə olunurdu.

Notlar arasında oxuma: musiqi daxilində məlumat ötürmə sistemi
Şəkil №2: Əsas notlar və ən güclü tonun fH,l1 harmonikləri üçün hesablanmış oktavalar fO,l2.

Nəticədə yaranan oktavalar və harmonikalar toplusu maskalama tezlikləri kimi istifadə edildi, onlardan fSC,k OFDM alt daşıyıcı tezlikləri əldə edildi. Hər maskalanma tezliyinin altına və üstünə iki alt daşıyıcı daxil edilmişdir.

Sonra, Hi audio seqmentinin spektri fSC,k alt daşıyıcı tezliklərində süzüldü. Bundan sonra Bi-dəki məlumat bitləri əsasında OFDM simvolu yaradıldı, bunun sayəsində kompozit Ci seqmenti dinamik vasitəsilə ötürülə bilər. Alt daşıyıcıların böyüklükləri və fazaları elə seçilməlidir ki, dinləyici melodiyadakı dəyişiklikləri hiss etmədən qəbuledici ötürülən məlumatları çıxara bilsin.

Notlar arasında oxuma: musiqi daxilində məlumat ötürmə sistemi
Şəkil № 3: orijinal melodiyanın Hi seqmentinin spektrinin və alt daşıyıcı tezliklərinin bir hissəsi.

İçərisində məlumat kodlanmış səs siqnalı dinamiklər vasitəsilə səsləndirildikdə, qəbul edən cihazın mikrofonu onu qeyd edir. Daxil edilmiş OFDM simvollarının başlanğıc mövqelərini tapmaq üçün ilk növbədə qeydlər bant keçidi filtrindən keçirilməlidir. Bu yolla, alt daşıyıcılar arasında musiqi müdaxiləsi siqnallarının olmadığı yuxarı tezlik diapazonu çıxarılır. Siz siklik prefiksdən istifadə edərək OFDM simvollarının başlanğıcını tapa bilərsiniz.

OFDM simvollarının başlanğıcını aşkar etdikdən sonra qəbuledici yüksək tezlikli domen kodlaşdırması vasitəsilə ən dominant notlar haqqında məlumat əldə edir. Bundan əlavə, OFDM dar zolaqlı müdaxilə mənbələrinə kifayət qədər davamlıdır, çünki onlar yalnız bəzi alt daşıyıcılara təsir göstərir.

Praktik testlər

Dəyişdirilmiş melodiyaların mənbəyi kimi KRK Rokit 8 dinamiki, qəbul edən tərəf rolunu isə Nexus 5X smartfonu oynayıb.

Notlar arasında oxuma: musiqi daxilində məlumat ötürmə sistemi
Şəkil №4: Həqiqi OFDM ilə daxili məkanda dinamik və mikrofon arasında 5 m məsafədə ölçülən korrelyasiya zirvələri arasındakı fərq.

Əksər OFDM nöqtələri 0 ilə 25 ms diapazonunda yerləşir, beləliklə, 66.6 ms siklik prefiks daxilində etibarlı başlanğıc tapa bilərsiniz. Tədqiqatçılar qeyd edirlər ki, qəbuledici (bu təcrübədə smartfon) OFDM simvollarının vaxtaşırı səsləndirilməsini nəzərə alır ki, bu da onların aşkarlanmasını yaxşılaşdırır.

Yoxlamaq üçün ilk şey məsafənin bit səhv dərəcəsinə (BER) təsiri idi. Bunun üçün müxtəlif tipli otaqlarda üç sınaq aparılıb: xalçalı dəhliz, döşəmədə linoleum olan ofis və taxta döşəməli auditoriya.


Test mövzusu kimi Van Halenin “And The Cradle Will Rock” mahnısı seçilmişdir.

Səsin həcmi elə tənzimlənib ki, smartfonun dinamikdən 2 m məsafədə ölçdüyü səs səviyyəsi 63 dB təşkil edib.

Notlar arasında oxuma: musiqi daxilində məlumat ötürmə sistemi
Şəkil № 5: Dinamik və mikrofon arasındakı məsafədən asılı olaraq BER göstəriciləri (mavi xətt - auditoriya, yaşıl - dəhliz, narıncı - ofis).

Dəhlizdə 40 dB səs dinamikdən 24 metrə qədər məsafədə olan smartfon tərəfindən götürüldü. 15 m məsafədə olan sinif otağında səs 55 dB, ofisdə isə 8 metr məsafədə smartfonun qəbul etdiyi səs səviyyəsi 57 dB-ə çatdı.

Auditoriya və ofis daha çox əks-səda doğurduğundan, gec OFDM simvolunun əks-sədaları siklik prefiksin uzunluğunu aşır və BER-i artırır.

əks-səda* - çoxlu əks olunması səbəbindən səs intensivliyinin tədricən azalması.

Tədqiqatçılar üç janrdan 6 fərqli mahnıya tətbiq etməklə öz sisteminin çox yönlülüyünü daha da nümayiş etdirdilər (aşağıdakı cədvəl).

Notlar arasında oxuma: musiqi daxilində məlumat ötürmə sistemi
Cədvəl №1: testlərdə istifadə olunan mahnılar.

Həmçinin, cədvəl məlumatları vasitəsilə biz hər mahnı üçün bit sürətini və bit xəta dərəcələrini görə bilərik. Məlumat sürətləri fərqlidir, çünki diferensial BPSK (faza sürüşdürmə açarı) eyni alt daşıyıcılardan istifadə edildikdə daha yaxşı işləyir. Və bu, bitişik seqmentlər eyni maskalama elementlərini ehtiva etdikdə mümkündür. Davamlı yüksək səsli mahnılar məlumatların gizlədilməsi üçün optimal baza təmin edir, çünki maskalanma tezlikləri geniş tezlik diapazonunda daha güclü şəkildə mövcuddur. Sürətli musiqi, təhlil pəncərəsinin sabit uzunluğuna görə OFDM simvollarını yalnız qismən maskalaya bilər.

Daha sonra insanlar sistemi sınaqdan keçirməyə başladılar, onlar hansı melodiyanın orijinal olduğunu və hansı melodiyaya daxil edilmiş məlumatla dəyişdirildiyini müəyyən etməli idilər. Bu məqsədlə 12 nömrəli cədvəldən 1 saniyəlik mahnılardan parçalar xüsusi internet səhifəsində yerləşdirilib.

Birinci təcrübədə (E1) hər bir iştirakçıya dinləmək üçün dəyişdirilmiş və ya orijinal fraqment verilmiş və fraqmentin orijinal və ya dəyişdirilmiş olduğuna qərar verməli idi. İkinci təcrübədə (E2) iştirakçılar hər iki versiyanı istədikləri qədər dinləyə və sonra hansının orijinal, hansının dəyişdirildiyinə qərar verə bilərdilər.

Notlar arasında oxuma: musiqi daxilində məlumat ötürmə sistemi
Cədvəl №2: E1 və E2 təcrübələrinin nəticələri.

Birinci eksperimentin nəticələri iki göstəriciyə malikdir: p(O|O) - orijinal melodiyanı düzgün qeyd edən iştirakçıların faizi və p(O|M) - melodiyanın dəyişdirilmiş variantını orijinal kimi qeyd edən iştirakçıların faizi.

Maraqlıdır ki, bəzi iştirakçılar, tədqiqatçıların fikrincə, bəzi dəyişdirilmiş melodiyaları orijinaldan daha orijinal hesab edirdilər. Hər iki təcrübənin orta göstəricisi onu göstərir ki, adi dinləyici adi melodiya ilə məlumatların yerləşdirildiyi melodiya arasında fərq hiss etməyəcək.

Təbii ki, musiqi mütəxəssisləri və musiqiçilər dəyişdirilən melodiyalarda bəzi qeyri-dəqiqlikləri və şübhəli elementləri aşkar edə biləcəklər, lakin bu elementlər diskomfort yarada biləcək qədər əhəmiyyətli deyil.

İndi biz özümüz eksperimentdə iştirak edə bilərik. Aşağıda eyni melodiyanın iki versiyası var - orijinal və dəyişdirilmiş. Fərqi eşidə bilirsinizmi?

Melodiya orijinal versiyası
vs
Melodiyanın dəyişdirilmiş versiyası

Tədqiqatın nüansları ilə daha ətraflı tanış olmaq üçün baxmağı məsləhət görürəm hesabat tədqiqat qrupu.

Tədqiqatda istifadə olunan orijinal və dəyişdirilmiş melodiyaların audio fayllarının ZIP arxivini də yükləyə bilərsiniz Bu linki.

Epiloq

Bu işdə ETH Sürixdən məzun tələbələr musiqi daxilində heyrətamiz məlumat ötürmə sistemini təsvir etdilər. Bunun üçün onlar tezliyin maskalanmasından istifadə etdilər ki, bu da məlumatları dinamikin ifa etdiyi melodiyaya yerləşdirməyə imkan verdi. Bu melodiya gizli məlumatları tanıyan və deşifrə edən cihazın mikrofonu tərəfindən qəbul edilir, adi dinləyici isə fərqi belə hiss etməyəcək. Gələcəkdə uşaqlar məlumatları audioya daxil etmək üçün daha təkmil üsullar seçərək sistemlərini inkişaf etdirməyi planlaşdırırlar.

Kimsə qeyri-adi, ən əsası isə işə yarayan bir şey təklif edəndə biz həmişə xoşbəxt oluruq. Amma daha çox sevindirici haldır ki, bu ixtiranı gənclər yaradıb. Elmin yaş məhdudiyyəti yoxdur. Əgər gənclərə elm darıxdırıcı gəlirsə, deməli, o, yanlış rakursdan təqdim olunur. Axı, bildiyimiz kimi, elm heyrətamiz bir aləmdir ki, onu heyrətləndirməkdən vaz keçmir.

Cümədən kənar:


Söhbət musiqidən, daha doğrusu rok musiqisindən getdiyimizə görə, burada rokun genişliklərində gözəl səyahət var.


Kraliça, "Radio Ga Ga" (1984).

Oxuduğunuz üçün təşəkkür edirik, maraqlanın və gözəl həftə sonu keçirin! 🙂

Bizimlə qaldığınız üçün təşəkkür edirik. Məqalələrimizi bəyənirsinizmi? Daha maraqlı məzmun görmək istəyirsiniz? Sifariş verməklə və ya dostlarınıza tövsiyə etməklə bizə dəstək olun, Bizim tərəfimizdən sizin üçün ixtira edilmiş giriş səviyyəli serverlərin unikal analoquna Habr istifadəçiləri üçün 30% endirim: VPS (KVM) E5-2650 v4 (6 nüvəli) 10GB DDR4 240GB SSD 1Gbps haqqında 20 dollardan bütün həqiqət və ya serveri necə paylaşmaq olar? (RAID1 və RAID10, 24 nüvəyə qədər və 40 GB DDR4 ilə mövcuddur).

Dell R730xd 2 dəfə ucuzdur? Yalnız burada 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV 199$-dan başlayan qiymətlərlə Hollandiyada! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - 99 dollardan! haqqında oxuyun İnfrastruktur korporasiyasını necə qurmaq olar. bir qəpik üçün 730 avro dəyərində Dell R5xd E2650-4 v9000 serverlərinin istifadəsi ilə sinif?

Mənbə: www.habr.com

Добавить комментарий