القراءة بين النوتات: نظام نقل البيانات داخل الموسيقى

القراءة بين النوتات: نظام نقل البيانات داخل الموسيقى

التعبير عما لا تستطيع الكلمات نقله؛ تشعر بمجموعة واسعة من المشاعر المتشابكة في إعصار من المشاعر؛ الانفصال عن الأرض والسماء وحتى الكون نفسه، والذهاب في رحلة حيث لا توجد خرائط ولا طرق ولا علامات؛ اخترع وأخبر واختبر قصة كاملة ستظل دائمًا فريدة وفريدة من نوعها. كل هذا يمكن أن يتم عن طريق الموسيقى - وهو فن موجود منذ آلاف السنين ويسعد آذاننا وقلوبنا.

ومع ذلك، فإن الموسيقى، أو بالأحرى الأعمال الموسيقية، يمكن أن تخدم ليس فقط للمتعة الجمالية، ولكن أيضا لنقل المعلومات المشفرة فيها، مخصصة لبعض الأجهزة وغير مرئية للمستمع. سنتعرف اليوم على دراسة غير عادية للغاية، حيث تمكن طلاب الدراسات العليا من ETH Zurich من إدخال بيانات معينة في الأعمال الموسيقية، دون أن يلاحظها أحد من قبل الأذن البشرية، بحيث تصبح الموسيقى نفسها قناة لنقل البيانات. كيف بالضبط قاموا بتنفيذ التكنولوجيا الخاصة بهم، وهل الألحان مع البيانات المضمنة وبدونها مختلفة تمامًا، وماذا أظهرت الاختبارات العملية؟ نتعلم عن هذا من تقرير الباحثين. يذهب.

أساس البحث

يطلق الباحثون على تقنيتهم ​​اسم تكنولوجيا نقل البيانات الصوتية. عندما يقوم المتحدث بتشغيل لحن معدل، فإن الشخص ينظر إليه على أنه أمر طبيعي، ولكن، على سبيل المثال، يمكن للهاتف الذكي قراءة المعلومات المشفرة بين السطور، أو بالأحرى بين النوتات الموسيقية، إذا جاز التعبير. العلماء (حقيقة أن هؤلاء الأشخاص ما زالوا طلاب دراسات عليا لا يمنعهم من أن يكونوا علماء) يطلقون على سرعة وموثوقية الإرسال مع الحفاظ على مستوى هذه المعلمات، بغض النظر عن الملف الصوتي المحدد، باعتبارها الجانب الأكثر أهمية في تنفيذ تقنية نقل البيانات هذه. يساعد علم الصوت النفسي، الذي يدرس الجوانب النفسية والفسيولوجية لإدراك الإنسان للأصوات، على التعامل مع هذه المهمة.

يمكن أن يسمى جوهر نقل البيانات الصوتية OFDM (تعدد الإرسال بتقسيم التردد المتعامد)، والذي، إلى جانب تكييف الموجات الحاملة الفرعية مع الموسيقى المصدر مع مرور الوقت، جعل من الممكن تحقيق أقصى استفادة من طيف التردد المرسل لنقل المعلومات. وبفضل هذا، كان من الممكن تحقيق سرعة نقل تبلغ 412 بت في الثانية على مسافة تصل إلى 24 مترًا (معدل الخطأ <10%). وأكدت التجارب العملية التي شارك فيها 40 متطوعًا حقيقة أنه يكاد يكون من المستحيل سماع الفرق بين اللحن الأصلي واللحن الذي تم تضمين المعلومات فيه.

أين يمكن تطبيق هذه التكنولوجيا عمليا؟ لدى الباحثين إجابتهم الخاصة: تقريبًا جميع الهواتف الذكية الحديثة وأجهزة الكمبيوتر المحمولة وغيرها من الأجهزة المحمولة مجهزة بميكروفونات، والعديد من الأماكن العامة (المقاهي والمطاعم ومراكز التسوق وما إلى ذلك) بها مكبرات صوت مع موسيقى خلفية. يمكن لحن الخلفية هذا، على سبيل المثال، أن يتضمن بيانات للاتصال بشبكة Wi-Fi دون الحاجة إلى إجراءات إضافية.

لقد أصبحت الملامح العامة لنقل البيانات الصوتية واضحة لنا، فلننتقل الآن إلى دراسة تفصيلية لبنية هذا النظام.

وصف النظام

يحدث إدخال البيانات في اللحن بسبب إخفاء التردد. وفي الفترات الزمنية، يتم تحديد ترددات التقنيع ويتم ملء الموجات الحاملة الفرعية OFDM القريبة من عناصر التقنيع هذه بالبيانات.

القراءة بين النوتات: نظام نقل البيانات داخل الموسيقى
صورة #1: تحويل الملف الأصلي إلى إشارة مركبة (لحن + بيانات) تنتقل عبر مكبرات الصوت.

في البداية، يتم تقسيم الإشارة الصوتية الأصلية إلى أجزاء متتالية لتحليلها. يتم ضرب كل مقطع (Hi) من L = 8820 عينة، أي ما يعادل 200 مللي ثانية، بـ نافذة او شباك* لتقليل تأثيرات الحدود.

نافذة او شباك* هي دالة ترجيح تستخدم للتحكم في التأثيرات الناجمة عن الفصوص الجانبية في التقديرات الطيفية.

بعد ذلك، تم الكشف عن الترددات السائدة للإشارة الأصلية في المدى من 500 هرتز إلى 9.8 كيلو هرتز، مما جعل من الممكن الحصول على ترددات التقنيع fM,l لهذا المقطع. بالإضافة إلى ذلك، تم إرسال البيانات في نطاق صغير من 9.8 إلى 10 كيلو هرتز لتحديد موقع الموجات الحاملة الفرعية عند جهاز الاستقبال. تم ضبط الحد الأعلى لنطاق التردد المستخدم على 10 كيلو هرتز نظرًا لانخفاض حساسية ميكروفونات الهواتف الذكية عند الترددات العالية.

تم تحديد ترددات التقنيع لكل مقطع تم تحليله على حدة. باستخدام طريقة HPS (طيف المنتج التوافقي)، تم تحديد الترددات الثلاثة السائدة ثم تقريبها إلى أقرب نغمات على المقياس اللوني التوافقي. هذه هي الطريقة التي تم بها الحصول على النوتات الرئيسية fF,i = 1…3، الواقعة بين المفاتيح C0 (16.35 هرتز) وB0 (30.87 هرتز). استنادًا إلى حقيقة أن النوتات الأساسية منخفضة جدًا بحيث لا يمكن استخدامها في نقل البيانات، فقد تم حساب أوكتافاتها الأعلى 500kfF,i في النطاق 9.8 هرتز ... 2 كيلو هرتز. كانت العديد من هذه الترددات (fO,l1) أكثر وضوحًا نظرًا لطبيعة HPS.

القراءة بين النوتات: نظام نقل البيانات داخل الموسيقى
صورة #2: حساب الأوكتافات fO,l1 للنوتات الأساسية والتوافقيات fH,l2 للنغمة الأقوى.

واستخدمت مجموعة الأوكتافات والتوافقيات الناتجة كترددات مقنعة، والتي اشتقت منها ترددات الموجة الحاملة الفرعية OFDM fSC,k. تم إدراج موجتين حاملتين فرعيتين أسفل وفوق كل تردد تقنيع.

بعد ذلك، تمت تصفية طيف المقطع الصوتي Hi عند ترددات الموجة الحاملة الفرعية fSC,k. بعد ذلك، تم إنشاء رمز OFDM استنادًا إلى بتات المعلومات في Bi، والتي يمكن من خلالها إرسال المقطع المركب Ci عبر مكبر الصوت. ويجب اختيار مقادير وأطوار الموجات الحاملة الفرعية بحيث يتمكن المستقبل من استخراج البيانات المرسلة بينما لا يلاحظ المستمع تغيرات في اللحن.

القراءة بين النوتات: نظام نقل البيانات داخل الموسيقى
الصورة رقم 3: جزء من الطيف والترددات الحاملة للمقطع Hi من اللحن الأصلي.

عند تشغيل إشارة صوتية تحتوي على معلومات مشفرة عبر مكبرات الصوت، يقوم ميكروفون جهاز الاستقبال بتسجيلها. للعثور على مواضع البداية لرموز OFDM المضمنة، تحتاج السجلات أولاً إلى تصفية ممر الموجة. وبهذه الطريقة يتم استخراج نطاق التردد العلوي، حيث لا توجد إشارات تداخل موسيقية بين الموجات الحاملة الفرعية. يمكنك العثور على بداية رموز OFDM باستخدام بادئة دورية.

بعد اكتشاف بداية رموز OFDM، يحصل جهاز الاستقبال على معلومات حول النغمات الأكثر شيوعًا من خلال فك تشفير مجال التردد العالي. وبالإضافة إلى ذلك، فإن OFDM مقاوم تماماً لمصادر التداخل ضيقة النطاق، لأنها تؤثر فقط على بعض الموجات الحاملة الفرعية.

اختبارات عملية

كان مكبر الصوت KRK Rokit 8 بمثابة مصدر الألحان المعدلة، ولعب الهاتف الذكي Nexus 5X دور الطرف المتلقي.

القراءة بين النوتات: نظام نقل البيانات داخل الموسيقى
الصورة #4: الفرق بين OFDM الفعلي وقمم الارتباط المقاسة في الداخل عند 5 أمتار بين مكبر الصوت والميكروفون.

تقع معظم نقاط OFDM في النطاق من 0 إلى 25 مللي ثانية، لذا يمكنك العثور على بداية صالحة ضمن البادئة الدورية البالغة 66.6 مللي ثانية. لاحظ الباحثون أن جهاز الاستقبال (في هذه التجربة، الهاتف الذكي) يأخذ في الاعتبار تشغيل رموز OFDM بشكل دوري، مما يحسن اكتشافها.

أول شيء يجب التحقق منه هو تأثير المسافة على معدل الخطأ في البتات (BER). للقيام بذلك، تم إجراء ثلاثة اختبارات في أنواع مختلفة من الغرف: ممر بسجاد، ومكتب به مشمع على الأرض، وقاعة بأرضية خشبية.


تم اختيار أغنية "And The Cradle Will Rock" لفان هالين لتكون موضوع الاختبار.

تم ضبط مستوى الصوت بحيث يصبح مستوى الصوت الذي يقيسه الهاتف الذكي على مسافة 2 متر من مكبر الصوت 63 ديسيبل.

القراءة بين النوتات: نظام نقل البيانات داخل الموسيقى
الصورة رقم 5: مؤشرات BER حسب المسافة بين السماعة والميكروفون (الخط الأزرق - الجمهور، الأخضر - الممر، البرتقالي - المكتب).

وفي الردهة، التقط هاتف ذكي صوتًا بقوة 40 ديسيبل على مسافة تصل إلى 24 مترًا من مكبر الصوت. في الفصل الدراسي على مسافة 15 مترًا، كان الصوت 55 ديسيبل، وفي المكتب على مسافة 8 أمتار، وصل مستوى الصوت الذي يراه الهاتف الذكي إلى 57 ديسيبل.

ونظرًا لأن القاعة والمكتب أكثر ترددًا، فإن أصداء رموز OFDM المتأخرة تتجاوز طول البادئة الدورية وتزيد من معدل الخطأ في البتات (BER).

صدى* - انخفاض تدريجي في شدة الصوت بسبب انعكاساته المتعددة.

كما أظهر الباحثون تنوع نظامهم من خلال تطبيقه على 6 أغانٍ مختلفة من ثلاثة أنواع (الجدول أدناه).

القراءة بين النوتات: نظام نقل البيانات داخل الموسيقى
جدول رقم 1: الأغاني المستخدمة في الاختبارات.

أيضًا، من خلال بيانات الجدول، يمكننا رؤية معدل البت ومعدلات خطأ البت لكل أغنية. تختلف معدلات البيانات لأن BPSK التفاضلي (مفتاح إزاحة الطور) يعمل بشكل أفضل عند استخدام نفس الموجات الحاملة الفرعية. وهذا ممكن عندما تحتوي الأجزاء المتجاورة على نفس عناصر التقنيع. توفر الأغاني الصاخبة باستمرار قاعدة مثالية لإخفاء البيانات لأن ترددات الإخفاء تكون أكثر قوة على نطاق ترددي واسع. يمكن للموسيقى سريعة الوتيرة أن تخفي رموز OFDM جزئيًا فقط بسبب الطول الثابت لنافذة التحليل.

بعد ذلك، بدأ الأشخاص في اختبار النظام، وكان عليهم تحديد اللحن الأصلي واللحن الذي تم تعديله من خلال المعلومات المضمنة فيه. ولهذا الغرض تم نشر مقتطفات من الأغاني من الجدول رقم 12 مدتها 1 ثانية على موقع خاص.

في التجربة الأولى (E1)، تم إعطاء كل مشارك إما جزءًا معدلاً أو أصليًا للاستماع إليه وكان عليه أن يقرر ما إذا كان الجزء أصليًا أم معدلاً. وفي التجربة الثانية (E2)، تمكن المشاركون من الاستماع إلى كلا الإصدارين عدة مرات كما أرادوا، ومن ثم تحديد أي منهما كان أصليًا وأيهما تم تعديله.

القراءة بين النوتات: نظام نقل البيانات داخل الموسيقى
جدول رقم 2: نتائج التجربتين E1 وE2.

تحتوي نتائج التجربة الأولى على مؤشرين: p(O|O) - النسبة المئوية للمشاركين الذين قاموا بتمييز اللحن الأصلي بشكل صحيح وp(O|M) - النسبة المئوية للمشاركين الذين وضعوا علامة على النسخة المعدلة من اللحن على أنها أصلية.

ومن المثير للاهتمام أن بعض المشاركين، وفقًا للباحثين، اعتبروا أن بعض الألحان المعدلة أكثر أصالة من الأصل نفسه. يشير متوسط ​​كلتا التجربتين إلى أن المستمع العادي لن يلاحظ فرقًا بين اللحن العادي واللحن الذي تم تضمين البيانات فيه.

وبطبيعة الحال، سيتمكن خبراء الموسيقى والموسيقيون من اكتشاف بعض العناصر غير الدقيقة والعناصر المشبوهة في الألحان المتغيرة، لكن هذه العناصر ليست كبيرة لدرجة أنها تسبب الانزعاج.

والآن يمكننا نحن أنفسنا المشاركة في التجربة. يوجد أدناه نسختان من نفس اللحن - النسخة الأصلية والمعدلة. هل يمكنك سماع الفرق؟

النسخة الأصلية من اللحن
vs
نسخة معدلة من اللحن

لمزيد من التعارف المفصل مع الفروق الدقيقة في الدراسة ، أوصي بالنظر تقرير مجموعة بحث.

يمكنك أيضًا تنزيل أرشيف ZIP للملفات الصوتية للألحان الأصلية والمعدلة المستخدمة في الدراسة على هذا الرابط.

خاتمة

في هذا العمل، وصف طلاب الدراسات العليا من ETH Zurich نظامًا مذهلاً لنقل البيانات داخل الموسيقى. للقيام بذلك، استخدموا إخفاء التردد، مما جعل من الممكن تضمين البيانات في اللحن الذي يعزفه المتحدث. يتم إدراك هذا اللحن بواسطة ميكروفون الجهاز، الذي يتعرف على البيانات المخفية ويفك تشفيرها، في حين أن المستمع العادي لن يلاحظ حتى الفرق. في المستقبل، يخطط الرجال لتطوير نظامهم، واختيار طرق أكثر تقدمًا لإدخال البيانات في الصوت.

عندما يأتي شخص ما بشيء غير عادي، والأهم من ذلك، شيء ناجح، نكون سعداء دائمًا. ولكن الأمر الأكثر متعة هو أن هذا الاختراع ابتكره الشباب. العلم ليس له قيود عمرية. وإذا كان الشباب يجدون العلم مملاً، فإنه يتم تقديمه من زاوية خاطئة، إذا جاز التعبير. بعد كل شيء، كما نعلم، العلم عالم مدهش لا يتوقف أبدًا عن الإبهار.

الجمعة خارج القمة:


وبما أننا نتحدث عن الموسيقى، أو بالأحرى موسيقى الروك، فإليك رحلة رائعة عبر مساحات الروك.


الملكة "راديو جا جا" (1984).

شكرًا على القراءة، ابقَ فضوليًا، وأتمنى لك عطلة نهاية أسبوع رائعة يا رفاق! 🙂

أشكركم على البقاء معنا. هل تحب مقالاتنا؟ هل تريد رؤية المزيد من المحتويات الشيقة؟ ادعمنا عن طريق تقديم طلب أو التوصية للأصدقاء ، خصم 30٪ لمستخدمي Habr على تناظرية فريدة من الخوادم المبتدئة ، والتي اخترعناها من أجلك: الحقيقة الكاملة حول VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps من 20 دولارًا أو كيفية مشاركة الخادم؟ (متوفر مع RAID1 و RAID10 ، حتى 24 مركزًا وحتى 40 جيجا بايت DDR4).

ديل R730xd 2 مرات أرخص؟ هنا فقط 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6 جيجا هرتز 14C 64 جيجا بايت DDR4 4x960 جيجا بايت SSD 1 جيجابت في الثانية 100 تلفزيون من 199 دولارًا في هولندا! Dell R420 - 2x E5-2430 2.2 جيجا هرتز 6C 128 جيجا بايت DDR3 2x960 جيجا بايت SSD 1 جيجا بايت في الثانية 100 تيرا بايت - من 99 دولارًا! أقرأ عن كيفية بناء شركة البنية التحتية. فئة مع استخدام خوادم Dell R730xd E5-2650 v4 بقيمة 9000 يورو مقابل فلس واحد؟

المصدر: www.habr.com

إضافة تعليق