Notalar orasidagi o'qish: musiqa ichidagi ma'lumotlarni uzatish tizimi

Notalar orasidagi o'qish: musiqa ichidagi ma'lumotlarni uzatish tizimi

Qanday so'zlarni ifoda eta olmasligini ifoda eting; hissiyotlar bo'ronida bir-biriga bog'langan turli xil his-tuyg'ularni his qilish; yerdan, osmondan va hatto koinotning o'zidan ajralib chiqish, xaritalar, yo'llar va belgilar bo'lmagan sayohatga chiqish; har doim o'ziga xos va takrorlanmas bo'lib qoladigan butun voqeani o'ylab toping, aytib bering va boshdan kechiring. Bularning barchasini musiqa – ko‘p ming yillar davomida mavjud bo‘lgan, qulog‘imiz va qalbimizni quvontiruvchi san’at yordamida amalga oshirish mumkin.

Biroq, musiqa, to'g'rirog'i, musiqiy asarlar nafaqat estetik zavq olish uchun, balki ularda kodlangan, qandaydir qurilma uchun mo'ljallangan va tinglovchiga ko'rinmaydigan ma'lumotlarni uzatish uchun ham xizmat qilishi mumkin. Bugun biz juda g'ayrioddiy tadqiqot bilan tanishamiz, unda ETH Tsyurix aspirantlari inson qulog'i sezmagan holda musiqa asarlariga ma'lum ma'lumotlarni kiritishga muvaffaq bo'lishdi, buning natijasida musiqaning o'zi ma'lumot uzatish kanaliga aylanadi. Ular o'zlarining texnologiyasini qanday aniq amalga oshirdilar, o'rnatilgan ma'lumotlarga ega va ma'lumotlarsiz ohanglar juda farq qiladimi va amaliy testlar nimani ko'rsatdi? Bu haqda tadqiqotchilarning hisobotidan bilib olamiz. Bor.

Tadqiqot asoslari

Tadqiqotchilar o'zlarining texnologiyasini akustik ma'lumotlarni uzatish texnologiyasi deb atashadi. Spiker o'zgartirilgan ohangni ijro etganda, odam uni odatdagidek qabul qiladi, lekin, masalan, smartfon satrlar orasidagi, aniqrog'i, notalar orasidagi kodlangan ma'lumotlarni o'qiy oladi. Olimlar (bu yigitlarning hali ham aspirant bo'lishi ularning olim bo'lishiga to'sqinlik qilmaydi) tanlangan audio fayldan qat'i nazar, ushbu parametrlarning darajasini saqlab qolgan holda uzatish tezligi va ishonchliligini amalga oshirishning eng muhim jihati deb atashadi. bu ma'lumotlarni uzatish texnikasi. Insonning tovushlarni idrok etishining psixologik va fiziologik jihatlarini o'rganuvchi psixoakustika bu vazifani engishga yordam beradi.

Akustik ma'lumotlarni uzatishning yadrosini OFDM (ortogonal chastota bo'linishi multipleksatsiyasi) deb atash mumkin, bu esa vaqt o'tishi bilan subtashuvchilarning manba musiqasiga moslashishi bilan bir qatorda ma'lumot uzatish uchun uzatiladigan chastota spektridan maksimal darajada foydalanish imkonini berdi. Buning yordamida 412 metrgacha bo'lgan masofada 24 bps uzatish tezligiga erishish mumkin edi (xato darajasi < 10%). 40 nafar ko‘ngilli ishtirok etgan amaliy tajribalar asl ohang va ma’lumot kiritilgan musiqa o‘rtasidagi farqni eshitish deyarli mumkin emasligini tasdiqladi.

Ushbu texnologiyani amaliyotda qayerda qo'llash mumkin? Tadqiqotchilarning o‘ziga xos javobi bor: deyarli barcha zamonaviy smartfonlar, noutbuklar va boshqa qo‘l qurilmalari mikrofonlar bilan jihozlangan, ko‘plab jamoat joylarida (kafelar, restoranlar, savdo markazlari va boshqalar) fon musiqasi bilan ishlaydigan dinamiklar mavjud. Ushbu fon musiqasi, masalan, qo'shimcha harakatlarsiz Wi-Fi tarmog'iga ulanish uchun ma'lumotlarni o'z ichiga olishi mumkin.

Akustik ma'lumotlarni uzatishning umumiy xususiyatlari bizga aniq bo'ldi, endi ushbu tizimning tuzilishini batafsil o'rganishga o'tamiz.

Tizim tavsifi

Ma'lumotlarning ohangga kiritilishi chastotani maskalash tufayli sodir bo'ladi. Vaqt oralig'ida niqoblash chastotalari aniqlanadi va ushbu maskalash elementlariga yaqin bo'lgan OFDM pastki tashuvchilari ma'lumotlar bilan to'ldiriladi.

Notalar orasidagi o'qish: musiqa ichidagi ma'lumotlarni uzatish tizimi
Rasm №1: Asl faylni karnaylar orqali uzatiladigan kompozit signalga (melodiya + ma'lumotlar) aylantirish.

Boshlash uchun, asl audio signal tahlil qilish uchun ketma-ket segmentlarga bo'linadi. 8820 ms ga teng bo'lgan L = 200 namunaning har bir bunday segmenti (Hi) ga ko'paytiriladi. oyna* chegara ta'sirini minimallashtirish.

Oyna* spektral baholashlarda yon loblar tufayli ta'sirlarni nazorat qilish uchun ishlatiladigan tortish funktsiyasidir.

Keyinchalik, asl signalning dominant chastotalari 500 Gts dan 9.8 kHz gacha bo'lgan diapazonda aniqlandi, bu esa ushbu segment uchun fM, l niqoblash chastotalarini olish imkonini berdi. Bundan tashqari, qabul qiluvchida pastki tashuvchilarning joylashishini aniqlash uchun ma'lumotlar 9.8 dan 10 kHz gacha bo'lgan kichik diapazonda uzatildi. Ishlatilgan chastota diapazonining yuqori chegarasi yuqori chastotalarda smartfon mikrofonlarining sezgirligi pastligi sababli 10 kHz ga o'rnatildi.

Maskalash chastotalari har bir tahlil qilingan segment uchun alohida aniqlandi. HPS (Garmonik mahsulot spektri) usulidan foydalanib, uchta dominant chastotalar aniqlandi va keyin garmonik xromatik shkala bo'yicha eng yaqin notalarga yaxlitlandi. C1 (3 Gts) va B0 (16.35 Gts) tugmachalari o'rtasida joylashgan fF,i = 0…30.87 asosiy notalari shunday olingan. Asosiy notalar ma'lumotlarni uzatishda foydalanish uchun juda past ekanligiga asoslanib, ularning yuqori oktavalari 500kfF,i 9.8 Gts ... 2 kHz oralig'ida hisoblangan. Ushbu chastotalarning ko'pchiligi (fO, l1) HPSning tabiati tufayli yanada aniqroq edi.

Notalar orasidagi o'qish: musiqa ichidagi ma'lumotlarni uzatish tizimi
Rasm №2: Asosiy notalar va eng kuchli tonning fH, l1 harmoniklari uchun hisoblangan oktavalar fO,l2.

Olingan oktavalar va garmonikalar to'plami maskalanuvchi chastotalar sifatida ishlatilgan, ulardan fSC,k OFDM subtashuvchi chastotalari olingan. Har bir niqoblash chastotasining ostiga va ustiga ikkita subtashuvchi o'rnatilgan.

Keyinchalik, Hi audio segmentining spektri fSC, k subtashuvchi chastotalarida filtrlangan. Shundan so'ng Bi-dagi ma'lumot bitlari asosida OFDM belgisi yaratildi, buning natijasida Ci kompozit segmenti dinamik orqali uzatilishi mumkin edi. Subtashuvchilarning kattaligi va fazalari tinglovchi ohangdagi o'zgarishlarni sezmasligi uchun qabul qiluvchi uzatilgan ma'lumotlarni chiqarib olishi uchun tanlanishi kerak.

Notalar orasidagi o'qish: musiqa ichidagi ma'lumotlarni uzatish tizimi
Rasm № 3: asl ohangning Hi segmentining spektri va pastki tashuvchi chastotalarining bir qismi.

Kodlangan ma'lumotlarga ega audio signal dinamiklar orqali eshitilganda, qabul qiluvchi qurilmaning mikrofoni uni yozib oladi. O'rnatilgan OFDM belgilarining boshlang'ich pozitsiyalarini topish uchun, avvalo, yozuvlar tarmoqli o'tish filtridan o'tkazilishi kerak. Shu tarzda, yuqori chastota diapazoni chiqariladi, bu erda pastki tashuvchilar o'rtasida musiqiy shovqin signallari mavjud emas. OFDM belgilarining boshlanishini siklik prefiks yordamida topishingiz mumkin.

OFDM belgilarining boshlanishini aniqlagandan so'ng, qabul qiluvchi yuqori chastotali domen dekodlash orqali eng dominant notalar haqida ma'lumot oladi. Bundan tashqari, OFDM tor polosali shovqin manbalariga nisbatan ancha chidamli, chunki ular faqat ba'zi subtashuvchilarga ta'sir qiladi.

Amaliy testlar

O‘zgartirilgan ohanglarning manbai sifatida KRK Rokit 8 dinamiki, qabul qiluvchi tomon rolini Nexus 5X smartfoni o‘ynadi.

Notalar orasidagi o'qish: musiqa ichidagi ma'lumotlarni uzatish tizimi
Rasm №4: Haqiqiy OFDM va ichki makonda karnay va mikrofon o'rtasidagi 5 m masofada o'lchangan korrelyatsiya cho'qqilari o'rtasidagi farq.

Aksariyat OFDM nuqtalari 0 dan 25 ms oralig'ida joylashgan, shuning uchun siz 66.6 ms siklik prefiksi ichida to'g'ri boshlanishni topishingiz mumkin. Tadqiqotchilarning qayd etishicha, qabul qiluvchi (ushbu tajribada smartfon) OFDM belgilari vaqti-vaqti bilan o‘ynalishini hisobga oladi, bu esa ularni aniqlashni yaxshilaydi.

Tekshirish kerak bo'lgan birinchi narsa masofaning bit xato tezligiga (BER) ta'siri edi. Buning uchun har xil turdagi xonalarda uchta sinov o'tkazildi: gilamli koridor, polda linoleum bilan qoplangan ofis va yog'och polli auditoriya.


Sinov mavzusi sifatida Van Halenning "And The Cradle Will Rock" qo'shig'i tanlandi.

Ovoz balandligi shunday o'rnatildiki, smartfon tomonidan karnaydan 2 m masofada o'lchangan ovoz darajasi 63 dB bo'ladi.

Notalar orasidagi o'qish: musiqa ichidagi ma'lumotlarni uzatish tizimi
Rasm № 5: karnay va mikrofon o'rtasidagi masofaga qarab BER ko'rsatkichlari (ko'k chiziq - auditoriya, yashil - koridor, to'q sariq - ofis).

Koridorda 40 dB tovushni karnaydan 24 metrgacha bo'lgan masofada smartfon qabul qildi. Sinf xonasida 15 m masofada tovush 55 dB, ofisda esa 8 metr masofada smartfon tomonidan qabul qilinadigan tovush darajasi 57 dB ga yetdi.

Auditoriya va ofis ko'proq reverberant bo'lganligi sababli, kech OFDM belgisi aks-sadolari tsiklik prefiks uzunligidan oshib ketadi va BERni oshiradi.

Reverberatsiya* - ko'p marta aks etishi tufayli tovush intensivligining asta-sekin kamayishi.

Tadqiqotchilar o'z tizimining ko'p qirraliligini yana uchta janrdagi 6 xil qo'shiqqa qo'llash orqali ko'rsatdilar (quyidagi jadval).

Notalar orasidagi o'qish: musiqa ichidagi ma'lumotlarni uzatish tizimi
1-jadval: testlarda ishlatiladigan qo'shiqlar.

Bundan tashqari, jadval ma'lumotlari orqali biz har bir qo'shiq uchun bit tezligi va bit xato tezligini ko'rishimiz mumkin. Ma'lumot uzatish tezligi har xil, chunki differensial BPSK (fazani almashtirish) bir xil subtashuvchilardan foydalanilganda yaxshiroq ishlaydi. Va bu qo'shni segmentlarda bir xil niqoblash elementlari mavjud bo'lganda mumkin. Doimiy baland ovozli qo'shiqlar ma'lumotlarni yashirish uchun optimal asos bo'lib xizmat qiladi, chunki niqoblash chastotalari keng chastota diapazonida kuchliroq bo'ladi. Tez sur'atda musiqa faqat tahlil oynasining belgilangan uzunligi tufayli OFDM belgilarini qisman maskalashi mumkin.

Keyinchalik, odamlar tizimni sinab ko'rishni boshladilar, ular qaysi ohang asl ekanligini va unga kiritilgan ma'lumotlar bilan o'zgartirilganligini aniqlashlari kerak edi. Shu maqsadda 12-jadvaldagi qo‘shiqlardan 1 soniyalik parchalar maxsus saytga joylashtirildi.

Birinchi tajribada (E1) har bir ishtirokchiga tinglash uchun o'zgartirilgan yoki asl fragment berildi va fragmentning asl yoki o'zgartirilganligini hal qilish kerak edi. Ikkinchi tajribada (E2) ishtirokchilar ikkala versiyani ham xohlagancha tinglashlari va keyin qaysi biri original, qaysi biri o‘zgartirilganligini hal qilishlari mumkin edi.

Notalar orasidagi o'qish: musiqa ichidagi ma'lumotlarni uzatish tizimi
2-jadval: E1 va E2 tajribalari natijalari.

Birinchi tajriba natijalari ikkita ko'rsatkichga ega: p(O|O) - original kuyni to'g'ri belgilagan ishtirokchilar foizi va p(O|M) - ohangning o'zgartirilgan versiyasini original deb belgilagan ishtirokchilar ulushi.

Qizig'i shundaki, ba'zi ishtirokchilar, tadqiqotchilarning fikriga ko'ra, o'zgartirilgan ba'zi ohanglarni asl nusxadan ko'ra originalroq deb hisoblashgan. Ikkala tajribaning o'rtacha ko'rsatkichlari shuni ko'rsatadiki, o'rtacha tinglovchi oddiy ohang va ma'lumotlar o'rnatilgan musiqa o'rtasidagi farqni sezmaydi.

Tabiiyki, musiqa mutaxassislari va musiqachilar o'zgartirilgan ohanglardagi ba'zi noaniqliklar va shubhali elementlarni aniqlashlari mumkin, ammo bu elementlar noqulaylik tug'diradigan darajada ahamiyatli emas.

Va endi biz o'zimiz tajribada ishtirok etishimiz mumkin. Quyida bir xil ohangning ikkita versiyasi mavjud - asl va o'zgartirilgan. Farqni eshita olasizmi?

Musiqaning asl nusxasi
vs
Musiqaning o'zgartirilgan versiyasi

Tadqiqotning nuanslari bilan batafsilroq tanishish uchun men qarashni tavsiya qilaman hisobot tadqiqot guruhi.

Shuningdek, tadqiqotda foydalanilgan asl va oʻzgartirilgan musiqalarning audiofayllarining ZIP arxivini yuklab olishingiz mumkin Ushbu havola.

Epilog

Ushbu ishda ETH Zurich magistrantlari musiqa ichidagi ajoyib ma'lumotlarni uzatish tizimini tasvirlab berdilar. Buning uchun ular chastotani maskalashdan foydalanganlar, bu ma'lumotlarni karnay tomonidan ijro etilgan ohangga kiritish imkonini berdi. Ushbu ohang qurilmaning mikrofoni tomonidan qabul qilinadi, u yashirin ma'lumotlarni taniydi va uni dekodlaydi, oddiy tinglovchi esa hatto farqni sezmaydi. Kelajakda yigitlar audioga ma'lumotlarni kiritishning ilg'or usullarini tanlab, o'z tizimini ishlab chiqishni rejalashtirmoqda.

Agar kimdir g'ayrioddiy, eng muhimi, ishlaydigan narsa bilan chiqsa, biz doimo xursand bo'lamiz. Ammo bu ixtiro yoshlar tomonidan yaratilgani yanada quvonchli. Fanda yosh cheklovlari yo'q. Agar yoshlar ilmni zerikarli deb hisoblasa, demak, u noto‘g‘ri tomondan taqdim etilmoqda. Axir, biz bilganimizdek, ilm-fan hech qachon hayratga soladigan ajoyib olamdir.

Juma kunidan tashqari:


Musiqa, to‘g‘rirog‘i rok musiqasi haqida gapirayotganimiz uchun bu yerda rok kengliklari bo‘ylab ajoyib sayohat.


Qirolicha, "Radio Ga Ga" (1984).

O'qiganingiz uchun tashakkur, qiziquvchan bo'ling va dam olish kunini yaxshi o'tkazing! 🙂

Biz bilan qolganingiz uchun tashakkur. Bizning maqolalarimiz sizga yoqdimi? Yana qiziqarli tarkibni ko'rishni xohlaysizmi? Buyurtma berish yoki do'stlaringizga tavsiya qilish orqali bizni qo'llab-quvvatlang, Habr foydalanuvchilari uchun biz siz uchun ixtiro qilingan boshlang'ich darajadagi serverlarning noyob analogiga 30% chegirma: VPS (KVM) E5-2650 v4 (6 yadroli) 10GB DDR4 240GB SSD 1Gbps 20 dollardan yoki serverni qanday almashish haqida butun haqiqat? (RAID1 va RAID10, 24 tagacha yadro va 40 Gb gacha DDR4 bilan mavjud).

Dell R730xd 2 barobar arzonmi? Faqat shu yerda 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 televizor 199 dollardan Gollandiyada! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - 99 dollardan! Haqida o'qing Infratuzilma korporatsiyasini qanday qurish kerak. bir tiyinga 730 evroga teng Dell R5xd E2650-4 v9000 serverlaridan foydalanish bilan sinf?

Manba: www.habr.com

a Izoh qo'shish