Nota aralarını okumak: Müziğin içindeki veri aktarım sistemi

Nota aralarını okumak: Müziğin içindeki veri aktarım sistemi

Kelimelerin neyi aktaramayacağını ifade edin; bir duygu kasırgasında iç içe geçmiş çok çeşitli duyguları hissedin; yeryüzünden, gökyüzünden ve hatta Evrenin kendisinden kopup haritaların, yolların, işaretlerin olmadığı bir yolculuğa çıkmak; Her zaman benzersiz ve benzersiz kalacak bir hikaye icat edin, anlatın ve deneyimleyin. Bütün bunlar, binlerce yıldır var olan, kulaklarımızı ve kalplerimizi sevindiren bir sanat olan müzikle yapılabilir.

Ancak müzik, daha doğrusu müzik eserleri, yalnızca estetik zevk için değil, aynı zamanda içlerinde kodlanmış, bir tür cihaza yönelik ve dinleyici tarafından görülemeyen bilgilerin aktarımına da hizmet edebilir. Bugün, ETH Zürih'teki yüksek lisans öğrencilerinin, insan kulağı tarafından fark edilmeden, müziğin kendisinin bir veri aktarım kanalı haline gelmesi nedeniyle belirli verileri müzik eserlerine aktarabildikleri çok sıra dışı bir çalışmayla tanışacağız. Teknolojilerini tam olarak nasıl uyguladılar, gömülü veri içeren ve içermeyen melodiler çok farklı mı ve pratik testler ne gösterdi? Bunu araştırmacıların raporundan öğreniyoruz. Gitmek.

Araştırma temeli

Araştırmacılar teknolojilerini akustik veri aktarım teknolojisi olarak adlandırıyorlar. Hoparlör değiştirilmiş bir melodiyi çaldığında, kişi bunu normal olarak algılar, ancak örneğin bir akıllı telefon, tabiri caizse satırlar arasındaki veya daha doğrusu notalar arasındaki kodlanmış bilgileri okuyabilir. Bilim adamları (bu adamların hala yüksek lisans öğrencisi olmaları, onların bilim adamı olmalarını engellemez), seçilen ses dosyasından bağımsız olarak bu parametrelerin seviyesini korurken iletimin hızını ve güvenilirliğini, uygulamanın uygulanmasındaki en önemli husus olarak adlandırırlar. bu veri aktarım tekniği. İnsanın ses algısının psikolojik ve fizyolojik yönlerini inceleyen psikoakustik bu görevin üstesinden gelmeye yardımcı olur.

Akustik veri aktarımının çekirdeği, alt taşıyıcıların zaman içinde kaynak müziğe uyarlanmasıyla birlikte, bilgi aktarımı için iletilen frekans spektrumundan maksimum düzeyde yararlanmayı mümkün kılan OFDM (ortogonal frekans bölmeli çoğullama) olarak adlandırılabilir. Bu sayede 412 metreye kadar bir mesafede (hata oranı < %24) 10 bps iletim hızına ulaşmak mümkün oldu. 40 gönüllünün katıldığı pratik deneyler, orijinal melodi ile bilginin yer aldığı melodi arasındaki farkı duymanın neredeyse imkansız olduğu gerçeğini doğruladı.

Bu teknoloji pratikte nerede uygulanabilir? Araştırmacıların kendi cevapları var: Hemen hemen tüm modern akıllı telefonlar, dizüstü bilgisayarlar ve diğer el cihazları mikrofonlarla donatılmıştır ve birçok halka açık alanda (kafeler, restoranlar, alışveriş merkezleri vb.) arka planda müzik çalan hoparlörler bulunur. Bu arka plan melodisi, örneğin ek işlemlere gerek kalmadan bir Wi-Fi ağına bağlanmak için gereken verileri içerebilir.

Akustik veri iletiminin genel özellikleri bizim için netleşti; şimdi bu sistemin yapısını detaylı olarak incelemeye geçelim.

Sistem açıklaması

Verilerin melodiye dahil edilmesi frekans maskelemesi nedeniyle gerçekleşir. Zaman dilimlerinde maskeleme frekansları tanımlanır ve bu maskeleme elemanlarına yakın OFDM alt taşıyıcıları verilerle doldurulur.

Nota aralarını okumak: Müziğin içindeki veri aktarım sistemi
Resim #1: Orijinal dosyayı hoparlörler aracılığıyla iletilen bileşik sinyale (melodi + veri) dönüştürme.

Başlangıç ​​olarak, orijinal ses sinyali analiz için ardışık bölümlere bölünür. 8820 ms'ye eşit olan L = 200 numunenin bu tür her segmenti (Hi) şu şekilde çarpılır: pencere* Sınır etkilerini en aza indirmek için.

Pencere* spektral tahminlerde yan loblardan kaynaklanan etkileri kontrol etmek için kullanılan bir ağırlıklandırma fonksiyonudur.

Daha sonra, orijinal sinyalin baskın frekansları 500 Hz ila 9.8 kHz aralığında tespit edildi; bu, bu bölüm için fM,9.8 maskeleme frekanslarının elde edilmesini mümkün kıldı. Ek olarak, alt taşıyıcıların alıcıdaki konumunu belirlemek için veriler 10 ila 10 kHz arasında küçük bir aralıkta iletildi. Akıllı telefon mikrofonlarının yüksek frekanslardaki duyarlılığının düşük olması nedeniyle kullanılan frekans aralığının üst sınırı XNUMX kHz olarak belirlendi.

Maskeleme frekansları analiz edilen her segment için ayrı ayrı belirlendi. HPS (Harmonik Ürün Spektrum) yöntemi kullanılarak, üç baskın frekans belirlendi ve ardından harmonik kromatik ölçekte en yakın notalara yuvarlandı. C1 (3 Hz) ve B0 (16.35 Hz) tuşları arasında yer alan fF,i = 0…30.87 ana notaları bu şekilde elde edildi. Temel notaların veri aktarımında kullanılamayacak kadar düşük olması gerçeğinden hareketle, bunların yüksek oktavları 500kfF,i 9.8 Hz ... 2 kHz aralığında hesaplanmıştır. Bu frekansların çoğu (fO,l1) HPS'nin doğasından dolayı daha belirgindi.

Nota aralarını okumak: Müziğin içindeki veri aktarım sistemi
Resim #2: Temel notalar için fO,l1 oktavları ve en güçlü tonun fH,l2 harmonikleri hesaplanmıştır.

Ortaya çıkan oktav ve harmonik seti, OFDM alt taşıyıcı frekansları fSC,k'nin türetildiği maskeleme frekansları olarak kullanıldı. Her maskeleme frekansının altına ve üstüne iki alt taşıyıcı yerleştirildi.

Daha sonra, Yüksek ses bölümünün spektrumu fSC,k alt taşıyıcı frekanslarında filtrelendi. Bundan sonra, Bi'deki bilgi bitlerine dayanarak bir OFDM sembolü oluşturuldu, bu sayede kompozit Ci segmenti hoparlör aracılığıyla iletilebildi. Alt taşıyıcıların büyüklükleri ve aşamaları, alıcının iletilen veriyi çıkarabileceği ve dinleyicinin melodideki değişiklikleri fark etmeyeceği şekilde seçilmelidir.

Nota aralarını okumak: Müziğin içindeki veri aktarım sistemi
Resim No. 3: orijinal melodinin Hi bölümünün spektrumunun ve alt taşıyıcı frekanslarının bir kısmı.

İçinde kodlanmış bilgiler bulunan bir ses sinyali hoparlörler aracılığıyla çalındığında, alıcı cihazın mikrofonu bunu kaydeder. Gömülü OFDM sembollerinin başlangıç ​​konumlarını bulmak için öncelikle kayıtların bant geçiren filtreye tabi tutulması gerekir. Bu şekilde, alt taşıyıcılar arasında müzikal girişim sinyallerinin olmadığı üst frekans aralığı çıkarılır. OFDM sembollerinin başlangıcını döngüsel bir önek kullanarak bulabilirsiniz.

OFDM sembollerinin başlangıcını tespit ettikten sonra alıcı, yüksek frekanslı alan kod çözme yoluyla en baskın notalar hakkında bilgi elde eder. Ayrıca OFDM, yalnızca bazı alt taşıyıcıları etkilediğinden dar bant girişim kaynaklarına karşı oldukça dirençlidir.

Pratik testler

KRK Rokit 8 hoparlörü, değiştirilen melodilerin kaynağı olarak görev yaptı ve Nexus 5X akıllı telefon, alıcı taraf rolünü oynadı.

Nota aralarını okumak: Müziğin içindeki veri aktarım sistemi
Resim #4: Gerçek OFDM ile iç mekanda hoparlör ve mikrofon arasında 5 metrede ölçülen korelasyon zirveleri arasındaki fark.

OFDM noktalarının çoğu 0 ila 25 ms aralığında yer alır, dolayısıyla 66.6 ms döngüsel önek içinde geçerli bir başlangıç ​​bulabilirsiniz. Araştırmacılar, alıcının (bu deneyde bir akıllı telefon), OFDM sembollerinin periyodik olarak oynatıldığını dikkate aldığını ve bunun da algılamayı iyileştirdiğini belirtiyor.

Kontrol edilecek ilk şey, mesafenin bit hata oranı (BER) üzerindeki etkisiydi. Bunu yapmak için farklı oda tiplerinde üç test gerçekleştirildi: halılı bir koridor, zemini linolyumlu bir ofis ve ahşap zeminli bir oditoryum.


Test konusu olarak Van Halen'in "And The Cradle Will Rock" şarkısı seçildi.

Ses seviyesi, akıllı telefonun hoparlörden 2 m mesafede ölçülen ses seviyesi 63 dB olacak şekilde ayarlandı.

Nota aralarını okumak: Müziğin içindeki veri aktarım sistemi
Resim No. 5: Hoparlör ile mikrofon arasındaki mesafeye bağlı BER göstergeleri (mavi çizgi - seyirci, yeşil - koridor, turuncu - ofis).

Koridorda, hoparlörden 40 metreye kadar uzaklıktaki bir akıllı telefon tarafından 24 dB'lik bir ses algılandı. 15 m uzaklıktaki sınıfta ses 55 dB iken, 8 metre mesafedeki ofiste akıllı telefonun algıladığı ses düzeyi 57 dB'e ulaştı.

Oditoryum ve ofis daha yankılı olduğundan, geç OFDM sembol yankıları döngüsel önek uzunluğunu aşar ve BER'i ​​artırır.

Yankı* - Çoklu yansımalardan dolayı ses yoğunluğunda kademeli bir azalma.

Araştırmacılar ayrıca sistemlerinin çok yönlülüğünü üç türden 6 farklı şarkıya uygulayarak gösterdiler (aşağıdaki tablo).

Nota aralarını okumak: Müziğin içindeki veri aktarım sistemi
Tablo No. 1: Testlerde kullanılan şarkılar.

Ayrıca tablo verileri aracılığıyla her şarkının bit hızını ve bit hata oranlarını görebiliriz. Veri hızları farklıdır çünkü diferansiyel BPSK (faz kaydırmalı anahtarlama), aynı alt taşıyıcılar kullanıldığında daha iyi çalışır. Ve bu, bitişik segmentlerin aynı maskeleme elemanlarını içermesi durumunda mümkündür. Sürekli yüksek sesli şarkılar, veri gizleme için en uygun temeli sağlar çünkü maskeleme frekansları geniş bir frekans aralığında daha güçlü bir şekilde mevcuttur. Hızlı tempolu müzik, analiz penceresinin sabit uzunluğundan dolayı OFDM sembollerini yalnızca kısmen maskeleyebilir.

Daha sonra insanlar, hangi melodinin orijinal olduğunu ve hangisinin içinde yer alan bilgilerle değiştirildiğini belirlemek zorunda olan sistemi test etmeye başladı. Bu amaçla 12 numaralı tablodaki şarkılardan 1 saniyelik alıntılar özel bir sitede yayınlandı.

İlk deneyde (E1), her katılımcıya dinlemesi için değiştirilmiş veya orijinal bir parça verildi ve parçanın orijinal mi yoksa değiştirilmiş mi olduğuna karar vermesi gerekiyordu. İkinci deneyde (E2), katılımcılar her iki versiyonu da istedikleri kadar dinleyebilir ve hangisinin orijinal, hangisinin değiştirilmiş olduğuna karar verebilirler.

Nota aralarını okumak: Müziğin içindeki veri aktarım sistemi
Tablo No. 2: E1 ve E2 deneylerinin sonuçları.

İlk deneyin sonuçlarında iki gösterge vardır: p(O|O) - orijinal melodiyi doğru şekilde işaretleyen katılımcıların yüzdesi ve p(O|M) - melodinin değiştirilmiş versiyonunu orijinal olarak işaretleyen katılımcıların yüzdesi.

İlginç bir şekilde, araştırmacılara göre bazı katılımcılar, değiştirilmiş bazı melodilerin orijinalinden daha orijinal olduğunu düşünüyorlardı. Her iki deneyin ortalaması, ortalama bir dinleyicinin normal bir melodi ile verinin gömülü olduğu melodi arasındaki farkı fark etmeyeceğini göstermektedir.

Doğal olarak müzik uzmanları ve müzisyenler değişen melodilerde bazı yanlışlıklar ve şüpheli unsurları tespit edebileceklerdir ancak bu unsurlar rahatsızlık verecek kadar önemli değildir.

Ve şimdi biz de deneye katılabiliriz. Aşağıda aynı melodinin iki versiyonu bulunmaktadır - orijinal ve değiştirilmiş olanı. Farkı duyabiliyor musun?

Melodinin orijinal versiyonu
vs
Melodinin değiştirilmiş versiyonu

Çalışmanın nüansları hakkında daha ayrıntılı bilgi için, şuna bakmanızı tavsiye ederim: rapor Araştırma grubu.

Ayrıca çalışmada kullanılan orijinal ve değiştirilmiş melodilerin ses dosyalarının ZIP arşivini şu adresten indirebilirsiniz: Bu linki.

Sonuç bölümü

Bu çalışmada ETH Zürih'teki yüksek lisans öğrencileri müzikteki muhteşem bir veri aktarım sistemini anlattılar. Bunu yapmak için, verileri konuşmacının çaldığı melodiye yerleştirmeyi mümkün kılan frekans maskelemeyi kullandılar. Bu melodi, cihazın mikrofonu tarafından algılanarak gizli veriyi tanıyıp şifresini çözer ve ortalama bir dinleyici aradaki farkı fark etmez bile. Gelecekte, adamlar sese veri eklemek için daha gelişmiş yöntemler seçerek sistemlerini geliştirmeyi planlıyorlar.

Birisi alışılmadık ve en önemlisi işe yarayan bir şey bulduğunda her zaman mutlu oluruz. Ancak bu buluşun gençler tarafından yaratılmış olması daha da sevindirici. Bilimin yaş sınırlaması yoktur. Ve eğer gençler bilimi sıkıcı buluyorsa, o zaman bilim deyim yerindeyse yanlış açıdan sunuluyor demektir. Sonuçta, bildiğimiz gibi bilim, şaşırtmayı asla bırakmayan muhteşem bir dünyadır.

Cuma kapalı:


Madem müzikten, daha doğrusu rock müzikten bahsediyoruz, işte size rock'ın enginliğinde harika bir yolculuk.


Kraliçe, "Radyo Ga Ga" (1984).

Okuduğunuz için teşekkürler, meraklı kalın ve harika bir hafta sonu geçirin arkadaşlar! 🙂

Bizimle kaldığın için teşekkürler. Yazılarımızı beğeniyor musunuz? Daha ilginç içerik görmek ister misiniz? Sipariş vererek veya arkadaşlarınıza tavsiye ederek bize destek olun, Habr kullanıcıları için, bizim tarafımızdan sizin için icat ettiğimiz benzersiz bir giriş seviyesi sunucu analogunda %30 indirim: 5$'dan başlayan fiyatlarla VPS (KVM) E2650-4 v6 (10 Çekirdek) 4GB DDR240 1GB SSD 20Gbps hakkındaki tüm gerçekler veya bir sunucu nasıl paylaşılır? (RAID1 ve RAID10, 24 adede kadar çekirdek ve 40 GB'a kadar DDR4 ile mevcuttur).

Dell R730xd 2 kat daha mı ucuz? Sadece burada 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV 199$'dan Hollanda'da! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - 99$'dan! Hakkında oku Altyapı şirketi nasıl kurulur? Bir kuruş için 730 Euro değerinde Dell R5xd E2650-4 v9000 sunucuların kullanımı ile sınıf?

Kaynak: habr.com

Yorum ekle