🥇 Liest tëscht Notizen: Dateniwwerdroungssystem bannent Musek

Ausdréck wat Wierder net vermëttelen kënnen; fillen eng grouss Varietéit vun Emotiounen an engem Hurrikan vu Gefiller intertwined; vun der Äerd, dem Himmel a souguer dem Universum selwer ze briechen, op eng Rees ze goen, wou keng Kaarten, keng Stroossen, keng Schëlder sinn; erfannen, erzielen an erliewen eng ganz Geschicht déi ëmmer eenzegaarteg an onimitéierbar bleift. All dat kann duerch Musek gemaach ginn - eng Konscht, déi zënter ville Dausende vu Joer existéiert an eis Oueren an Häerzer freet.

Wéi och ëmmer, Musek, oder éischter musikalesch Wierker, kënnen net nëmme fir ästhetescht Genoss déngen, awer och fir d'Transmissioun vun der kodéierter Informatioun, geduecht fir en Apparat an onsichtbar fir den Nolauschterer. Haut kennen mir eng ganz ongewéinlech Etude kennen, an där d’Absolventen vun der ETH Zürich, onopgemerkt vum mënschlechen Ouer, verschidden Donnéeën a Musekswierker konnten aféieren, duerch déi d’Musek selwer en Datetransmissionskanal gëtt. Wéi genau hunn se hir Technologie ëmgesat, sinn d'Melodien mat an ouni embedded Daten ganz ënnerschiddlech, a wat hunn praktesch Tester gewisen? Mir léieren doriwwer aus de Fuerscher Bericht. Gitt.

Basis vun der Etude

D'Fuerscher nennen hir Technologie akustesch Dateniwwerdroungstechnologie. Wann e Spriecher eng modifizéiert Melodie spillt, gesäit eng Persoun et als normal, awer zum Beispill kann e Smartphone kodéiert Informatioun tëscht den Zeilen liesen, oder éischter tëscht den Noten, souzesoen. Wëssenschaftler (d'Tatsaach, datt dës Kärelen nach Graduéierter sinn, verhënnert net datt se Wëssenschaftler sinn) nennen d'Geschwindegkeet an d'Zouverlässegkeet vun der Iwwerdroung wärend den Niveau vun dëse Parameteren erhalen, onofhängeg vun der gewielter Audiodatei, als de wichtegsten Aspekt an der Ëmsetzung vun dëser Daten Transfermaart Technik. Psychoakustik, déi d'psychologesch a physiologesch Aspekter vun der mënschlecher Perceptioun vu Kläng studéiert, hëlleft dës Aufgab ze këmmeren.

De Kär vun der akustescher Dateniwwerdroung kann OFDM (Orthogonal Frequenz Divisioun Multiplexing) genannt ginn, déi, zesumme mat der Adaptatioun vun Subcarrieren un d'Quellmusek mat der Zäit, et méiglech gemaach huet maximal Notzung vum iwwerdroene Frequenzspektrum fir Informatiounsiwwerdroung ze maachen. Dank deem war et méiglech eng Iwwerdroungsgeschwindegkeet vun 412 bps iwwer eng Distanz vu bis zu 24 Meter z'erreechen (Feelerquote <10%). Praktesch Experimenter mat 40 Fräiwëlleger hunn d'Tatsaach bestätegt datt et bal onméiglech ass den Ënnerscheed tëscht der ursprénglecher Melodie ze héieren an där an där d'Informatioun agebonne war.

Wou kann dës Technologie an der Praxis applizéiert ginn? D'Fuerscher hunn hir eege Äntwert: bal all modern Smartphones, Laptops an aner Handheld Apparater si mat Mikrofonen ausgestatt, a vill ëffentlech Plazen (Caféen, Restauranten, Akafszentren, etc.) hunn Spriecher mat Hannergrondmusek. Dës Hannergrondmelodie kann zum Beispill Daten enthalen fir mat engem Wi-Fi Netzwierk ze verbannen ouni zousätzlech Handlungen.

Déi allgemeng Feature vun der akustescher Dateniwwerdroung sinn eis kloer ginn; loosst eis elo op eng detailléiert Etude vun der Struktur vun dësem System plënneren.

System Beschreiwung

D'Aféierung vun Daten an d'Melodie geschitt wéinst Frequenzmaskéierung. An Zäitslots ginn Maskefrequenzen identifizéiert an OFDM Subcarrier no bei dëse Maskeringselementer si mat Daten gefëllt.

Bild #1: Ëmwandlung vun der Originaldatei an e Komposit Signal (Melodie + Daten) iwwer d'Lautsprecher iwwerdroen.

Fir unzefänken, ass d'Original Audio Signal an successive Segmenter opgedeelt fir Analyse. All esou Segment (Hi) vu L = 8820 Echantillon, gläich wéi 200 ms, gëtt multiplizéiert mat Fënster* Grenzeffekter ze minimiséieren.

Fënster* ass eng Gewiichtsfunktioun déi benotzt gëtt fir Effekter ze kontrolléieren wéinst Sideloben a Spektralschätzungen.

Als nächst goufen déi dominant Frequenzen vum Originalsignal am Beräich vu 500 Hz bis 9.8 kHz erkannt, wat et méiglech gemaach huet Maskefrequenzen fM,l fir dëst Segment ze kréien. Zousätzlech goufen d'Donnéeën an engem klenge Beräich vun 9.8 bis 10 kHz iwwerdroe fir d'Plaz vun den Ënnerträger um Empfänger festzeleeën. Déi iewescht Limite vum benotzte Frequenzbereich gouf op 10 kHz gesat wéinst der gerénger Empfindlechkeet vu Smartphone Mikrofonen bei héijer Frequenzen.

Masking Frequenzen goufen fir all analyséiert Segment individuell bestëmmt. Mat der HPS (Harmonic Product Spectrum) Method goufen déi dräi dominant Frequenzen identifizéiert an duerno op déi nootste Noten op der harmonescher chromatesch Skala ofgerënnt. Dëst ass wéi d'Haaptnotizen fF,i = 1 ... 3 kritt goufen, déi tëscht de Schlësselen C0 (16.35 Hz) a B0 (30.87 Hz) leien. Baséierend op der Tatsaach, datt d'fundamental Noten ze niddreg sinn fir Benotzung vun Daten Transmissioun, hir héich Oktav 500kfF,i goufen am Beräich 9.8 Hz ... 2 kHz berechent. Vill vun dësen Frequenzen (fO,l1) ware méi ausgeschwat wéinst der Natur vum HPS.

Bild #2: Berechent Oktaven fO,l1 fir déi fundamental Noten an Harmonie fH,l2 vum stäerkste Toun.

De resultéierende Set vun Oktav an Harmonie gouf als Maskefrequenz benotzt, aus deenen d'OFDM Ënnerträgerfrequenzen fSC,k ofgeleet goufen. Zwee Subcarrier goufen ënner an iwwer all Maskefrequenz agebaut.

Als nächst gouf de Spektrum vum Hi Audio Segment bei Ënnerträgerfrequenzen fSC,k gefiltert. Duerno gouf en OFDM Symbol erstallt op Basis vun den Informatiounsbits am Bi, wéinst deem de Composite Segment Ci duerch de Lautsprecher iwwerdroe konnt ginn. D'Gréissten an d'Phasen vun den Ënnerträger musse gewielt ginn sou datt den Empfänger déi iwwerdroen Donnéeën extrahéieren kann, während den Nolauschterer keng Ännerungen an der Melodie bemierkt.

Bild Nr.

Wann en Audiosignal mat der kodéierter Informatioun duerch Spriecher gespillt gëtt, registréiert de Mikrofon vum Empfangsapparat et. Fir d'Startplazen vun agebaute OFDM Symboler ze fannen, mussen d'Records als éischt Bandpassfilter gefiltert ginn. Op dës Manéier gëtt den ieweschte Frequenzbereich extrahéiert, wou et keng musikalesch Interferenzsignaler tëscht Ënnerträger gëtt. Dir kënnt den Ufank vun OFDM Symboler mat engem cyclic Präfix fannen.

Nodeem den Ufank vun OFDM Symboler entdeckt gouf, kritt den Empfänger Informatioun iwwer déi dominant Noten duerch Héichfrequenz Domain Decodéierung. Zousätzlech ass OFDM zimlech resistent géint Schmuelbandinterferenzquellen, well se nëmmen e puer vun den Ënnerträger beaflossen.

Praktesch Tester

De KRK Rokit 8 Lautsprecher huet als Quell vun de modifizéierten Melodien gehandelt, an den Nexus 5X Smartphone huet d'Roll vun der Empfangs Partei gespillt.

Bild #4: Ënnerscheed tëscht aktuellen OFDM a Korrelatiounspeaks gemooss dobannen op 5m tëscht Lautsprecher a Mikrofon.

Déi meescht OFDM-Punkten leien am Beräich vun 0 bis 25 ms, sou datt Dir e gültege Start am 66.6 ms zyklesche Präfix fannt. D'Fuerscher bemierken datt den Empfänger (an dësem Experiment e Smartphone) berücksichtegt datt OFDM Symboler periodesch gespillt ginn, wat hir Detektioun verbessert.

Déi éischt Saach ze kontrolléieren war den Effet vun Distanz op Bit Feeler Taux (BER). Fir dëst ze maachen, goufen dräi Tester a verschiddenen Zëmmeren duerchgefouert: e Korridor mat Teppech, e Büro mat Linoleum um Buedem an en Auditorium mat engem Holzbuedem.

Als Testsubject gouf d'Lidd "And The Cradle Will Rock" vum Van Halen gewielt.

Den Tounvolumen gouf ugepasst sou datt den Tounniveau vum Smartphone op enger Distanz vun 2 m vum Lautsprecher 63 dB war.

Bild Nr.

An der Hal gouf e Klang vu 40 dB vun engem Smartphone op enger Distanz vu bis zu 24 Meter vum Lautsprecher opgefaang. Am Klassesall op enger Distanz vu 15 m war den Toun 55 dB, an am Büro op enger Distanz vun 8 Meter erreecht den Tounniveau vum Smartphone 57 dB.

Well den Auditorium an de Büro sinn méi reverberant, spéit OFDM Symbol Echoen iwwerschratt der cyclic Präfix Längt an Erhéijung der BER.

Reverberation* - eng graduell Ofsenkung vun der Tounintensitéit wéinst senge multiple Reflexiounen.

D'Fuerscher hunn d'Vielfalt vun hirem System weider bewisen andeems se et op 6 verschidde Lidder aus dräi Genren applizéieren (Tabelle hei ënnen).

Dësch Nr 1: Lidder an Tester benotzt.

Och duerch d'Tabellendaten kënne mir de Bitrate a Bitfehlerraten fir all Lidd gesinn. D'Datenraten sinn ënnerschiddlech well differenziell BPSK (Phaseverschiebungsschlëssel) besser funktionnéiert wann déiselwecht Ënnerträger benotzt ginn. An dëst ass méiglech wann ugrenzend Segmenter déiselwecht Maskeringselementer enthalen. Kontinuéierlech haart Lidder bidden eng optimal Basis fir Daten ze verstoppen, well d'Maskefrequenze méi staark iwwer e breet Frequenzbereich präsent sinn. Schnellmusek kann nëmmen deelweis OFDM Symboler maskéieren wéinst der fixer Längt vun der Analysefenster.

Als nächst hunn d'Leit ugefaang de System ze testen, déi hu misse bestëmmen wéi eng Melodie original war a wat duerch d'Informatioun, déi dran agebonne gouf, geännert gouf. Dofir goufen 12 Sekonnen Auszich vu Lidder vum Dësch Nummer 1 op enger spezieller Websäit gepost.

Am éischten Experiment (E1) krut all Participant entweder e modifizéierten oder originelle Fragment fir nozelauschteren an huet missen entscheeden ob d'Fragment original oder modifizéiert war. Am zweeten Experiment (E2) konnten d'Participanten béid Versiounen esou oft lauschteren wéi se wollten, an dann entscheeden wéi eng originell war a wéi eng geännert gouf.

Dësch Nr 2: Resultater vun Experimenter E1 an E2.

D'Resultater vum éischten Experiment hunn zwee Indikatoren: p(O|O) - de Prozentsaz vun de Participanten, déi d'Original Melodie korrekt markéiert hunn an p(O|M) - de Prozentsaz vun de Participanten, déi déi geännert Versioun vun der Melodie als Original markéiert hunn.

Interessanterweis hunn e puer Participanten, laut de Fuerscher, verschidde verännert Melodien als méi originell ugesinn wéi d'Original selwer. Den Duerchschnëtt vu béiden Experimenter suggeréiert datt den duerchschnëttleche Lauschterer keen Ënnerscheed tëscht enger regulärer Melodie an enger an där Donnéeën agebonne wieren.

Natierlech kënne Museksexperten a Museker e puer Ongenauegkeeten a verdächteg Elementer an de geännerte Melodien entdecken, awer dës Elementer sinn net sou bedeitend datt se Unerkennung verursaachen.

An elo kënne mir selwer um Experiment deelhuelen. Drënner sinn zwou Versiounen vun der selwechter Melodie - déi ursprénglech an déi geännert. Kënnt Dir den Ënnerscheed héieren?

Originalversioun vun der Melodie
vs
Modifizéiert Versioun vun der Melodie

Fir e méi detailléierte Verständnis vun den Nuancen vun der Studie, ech recommandéieren e Bléck op de Bericht Fuerschung Grupp.

Dir kënnt och e ZIP-Archiv vun Audiodateien vun den ursprénglechen a modifizéierten Melodien eroflueden, déi an der Studie benotzt ginn dëse Link.

Epilogue

An dëser Aarbecht hunn Diplomstudenten vun der ETH Zürich en erstaunlechen Datetransmissionssystem an der Musek beschriwwen. Fir dëst ze maachen, hu se Frequenzmaskéierung benotzt, wat et méiglech gemaach huet d'Donnéeën an d'Melodie vum Lautsprecher z'integréieren. Dës Melodie gëtt vum Mikrofon vum Apparat erkannt, deen déi verstoppt Donnéeën erkennt an decodéiert, während den duerchschnëttleche Lauschterer den Ënnerscheed net emol bemierkt. An Zukunft plangen d'Kärelen hire System z'entwéckelen, méi fortgeschratt Methoden auswielen fir Daten an Audio aféieren.

Wann iergendeen eppes Ongewéinleches opkënnt, an am wichtegsten, eppes wat funktionnéiert, si mir ëmmer frou. Awer nach méi Freed ass datt dës Erfindung vu jonke Leit erstallt gouf. Wëssenschaft huet keng Alter Restriktiounen. A wa jonk Leit d'Wëssenschaft langweileg fannen, da gëtt se souzesoen aus engem falsche Wénkel presentéiert. Iwwerhaapt, wéi mir wëssen, ass d'Wëssenschaft eng erstaunlech Welt déi ni ophält ze iwwerraschen.

Freideg off-top:

Well mir iwwer Musek, oder éischter Rockmusek schwätzen, hei eng wonnerbar Rees duerch d'Ausdehnen vum Rock.

Queen, "Radio Ga Ga" (1984).

Merci fir d'Liesen, bleift virwëtzeg, a wënschen e schéine Weekend Kärelen! 🙂

Merci datt Dir bei eis bleift. Hutt Dir eis Artikelen gär? Wëllt Dir méi interessant Inhalt gesinn? Ënnerstëtzt eis andeems Dir eng Bestellung maacht oder Frënn empfeelt, 30% Remise fir Habr Benotzer op engem eenzegaartegen Analog vun Entry-Level Serveren, dee vun eis fir Iech erfonnt gouf: Déi ganz Wourecht iwwer VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps vun $20 oder wéi een e Server deelt? (verfügbar mat RAID1 an RAID10, bis zu 24 Kären a bis zu 40GB DDR4).

Dell R730xd 2 Mol méi bëlleg? Nëmmen hei 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV vun $199 an Holland! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - vun $99! Liest iwwer Wéi bauen ech Infrastructure Corp. Klass mat der Benotzung vun Dell R730xd E5-2650 v4 Serveren Wäert 9000 Euro fir e Penny?

Source: will.com

Liesen tëscht den Noten: den Datenübertragungssystem an der Musek

Basis vun der Etude

System Beschreiwung

Praktesch Tester

Epilogue

Setzt e Commentaire annuléieren reply