Lectura entre notas: o sistema de transmisión de datos dentro da música

Lectura entre notas: o sistema de transmisión de datos dentro da música

Expresa o que as palabras non poden transmitir; sentir unha gran variedade de emocións entrelazadas nun furacán de sentimentos; desvincularse da terra, do ceo e mesmo do propio Universo, facendo unha viaxe onde non hai mapas, nin estradas, nin sinais; inventar, contar e vivir toda unha historia que permanecerá sempre única e inimitable. Todo isto pódese facer coa música, unha arte que existe durante moitos miles de anos e que deleita os nosos oídos e corazóns.

Porén, a música, ou máis ben as obras musicais, poden servir non só para o pracer estético, senón tamén para a transmisión de información codificada nelas, destinada a algún dispositivo e invisible para o oínte. Hoxe imos familiarizarnos cun estudo moi inusual no que estudantes de posgrao da ETH Zurich puideron, sen que o oído humano advirta, introducir certos datos nas obras musicais, polo que a propia música convértese nunha canle de transmisión de datos. Como implementaron exactamente a súa tecnoloxía, son moi diferentes as melodías con e sen os datos incorporados e que demostraron as probas prácticas? Aprendemos disto co informe dos investigadores. Vaia.

Base de investigación

Os investigadores chaman á súa tecnoloxía tecnoloxía de transmisión de datos acústicos. Cando un altofalante reproduce unha melodía modificada, unha persoa percíbea como normal, pero, por exemplo, un teléfono intelixente pode ler información codificada entre liñas, ou máis ben entre as notas, por así dicilo. Os científicos (o feito de que estes rapaces aínda sexan estudantes de posgrao non lles impide ser científicos) chaman á velocidade e fiabilidade da transmisión mantendo o nivel destes parámetros, independentemente do ficheiro de audio seleccionado, como o aspecto máis importante na implementación de esta técnica de transferencia de datos. A psicoacústica, que estuda os aspectos psicolóxicos e fisiolóxicos da percepción humana dos sons, axuda a afrontar esta tarefa.

O núcleo da transmisión de datos acústicos pódese chamar OFDM (multiplexación por división de frecuencia ortogonal), que, xunto coa adaptación das subportadoras á música fonte ao longo do tempo, permitiu aproveitar ao máximo o espectro de frecuencias transmitida para a transmisión de información. Grazas a isto, foi posible acadar unha velocidade de transmisión de 412 bps nunha distancia de ata 24 metros (taxa de erro < 10%). Experimentos prácticos nos que participaron 40 voluntarios confirmaron o feito de que é case imposible escoitar a diferenza entre a melodía orixinal e aquela na que se incrustaba a información.

Onde se pode aplicar esta tecnoloxía na práctica? Os investigadores teñen a súa propia resposta: case todos os teléfonos intelixentes, portátiles e outros dispositivos portátiles modernos están equipados con micrófonos, e moitos lugares públicos (cafeterías, restaurantes, centros comerciais, etc.) teñen altofalantes con música de fondo. Esta melodía de fondo pode, por exemplo, incluír datos para conectarse a unha rede wifi sen necesidade de accións adicionais.

As características xerais da transmisión de datos acústicos quedaron claras para nós; agora pasemos a un estudo detallado da estrutura deste sistema.

Descrición do sistema

A introdución de datos na melodía prodúcese debido ao enmascaramento de frecuencia. Nas franxas horarias, identifícanse as frecuencias de enmascaramento e as subportadoras OFDM próximas a estes elementos de enmascaramento énchense de datos.

Lectura entre notas: o sistema de transmisión de datos dentro da música
Imaxe #1: Converter o ficheiro orixinal nun sinal composto (melodía + datos) transmitido a través dos altofalantes.

Para comezar, o sinal de audio orixinal divídese en segmentos sucesivos para a súa análise. Cada segmento (Hi) de L = 8820 mostras, igual a 200 ms, multiplícase por fiestra* para minimizar os efectos de fronteira.

Ventá* é unha función de ponderación utilizada para controlar os efectos debidos aos lóbulos laterais nas estimacións espectrais.

A continuación, detectáronse as frecuencias dominantes do sinal orixinal no rango de 500 Hz a 9.8 kHz, o que permitiu obter frecuencias de enmascaramento fM,l para este segmento. Ademais, os datos foron transmitidos nun pequeno intervalo de 9.8 a 10 kHz para establecer a localización das subportadoras no receptor. O límite superior do intervalo de frecuencias utilizado estableceuse en 10 kHz debido á baixa sensibilidade dos micrófonos dos teléfonos intelixentes a altas frecuencias.

Determináronse as frecuencias de enmascaramento para cada segmento analizado individualmente. Utilizando o método HPS (Harmonic Product Spectrum), identificáronse as tres frecuencias dominantes e logo redondeáronse ás notas máis próximas na escala cromática harmónica. Así se obtiveron as notas principais fF,i = 1…3, situadas entre as teclas C0 (16.35 Hz) e B0 (30.87 Hz). Baseándose no feito de que as notas fundamentais son demasiado baixas para usar na transmisión de datos, as súas oitavas máis altas 500kfF,i calculáronse no rango de 9.8 Hz ... 2 kHz. Moitas destas frecuencias (fO,l1) foron máis pronunciadas debido á natureza do HPS.

Lectura entre notas: o sistema de transmisión de datos dentro da música
Imaxe #2: oitavas calculadas fO,l1 para as notas fundamentais e os harmónicos fH,l2 do ton máis forte.

O conxunto resultante de oitavas e harmónicos utilizouse como frecuencias de enmascaramento, das que se derivaron as frecuencias subportadoras OFDM fSC,k. Inseríronse dúas subportadoras debaixo e por riba de cada frecuencia de enmascaramento.

A continuación, o espectro do segmento de audio Hi filtrouse nas frecuencias subportadoras fSC,k. Despois diso, creouse un símbolo OFDM baseado nos bits de información en Bi, polo que o segmento composto Ci podería transmitirse a través do altofalante. As magnitudes e fases das subportadoras deben escollerse para que o receptor poida extraer os datos transmitidos mentres o oínte non note cambios na melodía.

Lectura entre notas: o sistema de transmisión de datos dentro da música
Imaxe no 3: parte do espectro e das frecuencias subportadoras do segmento Hi da melodía orixinal.

Cando se reproduce un sinal de audio con información codificada a través dos altofalantes, o micrófono do dispositivo receptor grávao. Para atopar as posicións iniciais dos símbolos OFDM incrustados, primeiro hai que filtrar pasabanda os rexistros. Deste xeito, extráese o rango de frecuencia superior, onde non hai sinais de interferencia musicais entre subportadoras. Podes atopar o inicio dos símbolos OFDM usando un prefixo cíclico.

Despois de detectar o inicio dos símbolos OFDM, o receptor obtén información sobre as notas máis dominantes mediante a decodificación do dominio de alta frecuencia. Ademais, OFDM é bastante resistente ás fontes de interferencia de banda estreita, xa que só afectan a algunhas das subportadoras.

Probas prácticas

O altofalante KRK Rokit 8 actuou como fonte das melodías modificadas e o teléfono intelixente Nexus 5X desempeñou o papel da parte receptora.

Lectura entre notas: o sistema de transmisión de datos dentro da música
Imaxe #4: Diferenza entre o OFDM real e os picos de correlación medidos en interiores a 5 m entre o altofalante e o micrófono.

A maioría dos puntos OFDM atópanse no intervalo de 0 a 25 ms, polo que podes atopar un inicio válido dentro do prefixo cíclico de 66.6 ms. Os investigadores sinalan que o receptor (neste experimento, un teléfono intelixente) ten en conta que os símbolos OFDM son reproducidos periódicamente, o que mellora a súa detección.

O primeiro que se comprobou foi o efecto da distancia na taxa de erro de bits (BER). Para iso realizáronse tres probas en diferentes tipos de salas: un corredor con alfombra, un despacho con linóleo no chan, e un auditorio con chan de madeira.


A canción "And The Cradle Will Rock" de Van Halen foi escollida como tema da proba.

O volume do son axustouse para que o nivel de son medido polo teléfono intelixente a unha distancia de 2 m do altofalante fose de 63 dB.

Lectura entre notas: o sistema de transmisión de datos dentro da música
Imaxe no 5: indicadores BER en función da distancia entre o altofalante e o micrófono (liña azul - público, verde - corredor, laranxa - oficina).

No corredor, un son de 40 dB foi captado por un teléfono intelixente a unha distancia de ata 24 metros do altofalante. Na aula a unha distancia de 15 m o son era de 55 dB, e na oficina a unha distancia de 8 metros o nivel de son percibido polo smartphone alcanzou os 57 dB.

Debido a que o auditorio e a oficina son máis reverberantes, os ecos tardíos do símbolo OFDM superan a lonxitude do prefixo cíclico e aumentan o BER.

Reverberación* - unha diminución gradual da intensidade do son debido ás súas múltiples reflexións.

Os investigadores demostraron ademais a versatilidade do seu sistema aplicándoo a 6 cancións diferentes de tres xéneros (táboa a continuación).

Lectura entre notas: o sistema de transmisión de datos dentro da música
Táboa no 1: cancións utilizadas nas probas.

Ademais, a través dos datos da táboa, podemos ver a taxa de bits e as taxas de erro de bits de cada canción. As taxas de datos son diferentes porque o BPSK diferencial (transmisión de fase) funciona mellor cando se usan as mesmas subportadoras. E isto é posible cando os segmentos adxacentes conteñen os mesmos elementos de enmascaramento. As cancións continuamente altas proporcionan unha base óptima para ocultar datos porque as frecuencias de enmascaramento están máis presentes nun amplo rango de frecuencias. A música de ritmo rápido só pode enmascarar parcialmente os símbolos OFDM debido á lonxitude fixa da xanela de análise.

A continuación, a xente comezou a probar o sistema, que tiña que determinar que melodía era orixinal e cal era modificada pola información incorporada nel. Para iso colgáronse fragmentos de 12 segundos de cancións da táboa número 1 nunha páxina web especial.

No primeiro experimento (E1), cada participante recibiu un fragmento modificado ou orixinal para escoitar e tivo que decidir se o fragmento era orixinal ou modificado. No segundo experimento (E2), os participantes puideron escoitar as dúas versións tantas veces como quixesen, e despois decidir cal era orixinal e cal se modificaba.

Lectura entre notas: o sistema de transmisión de datos dentro da música
Táboa no 2: resultados dos experimentos E1 e E2.

Os resultados do primeiro experimento teñen dous indicadores: p(O|O) - a porcentaxe de participantes que marcaron correctamente a melodía orixinal e p(O|M) - a porcentaxe de participantes que marcaron a versión modificada da melodía como orixinal.

Curiosamente, algúns participantes, segundo os investigadores, consideraron que certas melodías alteradas eran máis orixinais que a propia orixinal. A media de ambos experimentos suxire que o oínte medio non notaría diferenzas entre unha melodía normal e aquela na que se incorporaban datos.

Naturalmente, os expertos musicais e os músicos poderán detectar algunhas inexactitudes e elementos sospeitosos nas melodías modificadas, pero estes elementos non son tan significativos como para causar molestias.

E agora nós mesmos podemos participar no experimento. Abaixo amósanse dúas versións da mesma melodía: a orixinal e a modificada. Podes escoitar a diferenza?

Versión orixinal da melodía
vs
Versión modificada da melodía

Para un coñecemento máis detallado dos matices do estudo, recoméndolle ollar informe grupo de investigación.

Tamén podes descargar un arquivo ZIP dos ficheiros de audio das melodías orixinais e modificadas utilizadas no estudo en este enlace.

Epílogo

Neste traballo, estudantes de posgrao da ETH Zurich describiron un sorprendente sistema de transmisión de datos dentro da música. Para iso, utilizaron o enmascaramento de frecuencia, que permitiu incrustar os datos na melodía que toca o altofalante. Esta melodía é percibida polo micrófono do dispositivo, que recoñece os datos ocultos e os descodifica, mentres que o oínte medio nin sequera notará a diferenza. No futuro, os mozos planean desenvolver o seu sistema, seleccionando métodos máis avanzados para introducir datos no audio.

Cando a alguén se lle ocorre algo inusual e, sobre todo, algo que funciona, sempre estamos felices. Pero aínda máis alegría é que este invento foi creado por mozos. A ciencia non ten restricións de idade. E se os mozos consideran que a ciencia é aburrida, entón estase presentando desde un ángulo equivocado, por así dicilo. Despois, como sabemos, a ciencia é un mundo incrible que non deixa de sorprender.

Venres fóra de tope:


Xa que falamos de música, ou máis ben de música rock, aquí tedes unha marabillosa viaxe polas extensións do rock.


Queen, "Radio Ga Ga" (1984).

Grazas por ler, manter a curiosidade e que teñades unha boa fin de semana rapaces! 🙂

Grazas por estar connosco. Gústanche os nosos artigos? Queres ver máis contido interesante? Apóyanos facendo un pedido ou recomendando a amigos, Desconto do 30 % para os usuarios de Habr nun análogo único de servidores de nivel de entrada, que inventamos nós para ti: Toda a verdade sobre VPS (KVM) E5-2650 v4 (6 núcleos) 10 GB DDR4 240 GB SSD 1 Gbps desde 20 dólares ou como compartir un servidor? (dispoñible con RAID1 e RAID10, ata 24 núcleos e ata 40 GB DDR4).

Dell R730xd 2 veces máis barato? Só aquí 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV desde $199 nos Países Baixos! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - desde $ 99! Ler sobre Como construír a infraestrutura corp. clase co uso de servidores Dell R730xd E5-2650 v4 por valor de 9000 euros por un centavo?

Fonte: www.habr.com

Engadir un comentario