د نوټونو تر مینځ لوستل: د میوزیک دننه د معلوماتو لیږد سیسټم

د نوټونو تر مینځ لوستل: د میوزیک دننه د معلوماتو لیږد سیسټم

هغه څه بیان کړئ چې کلمې نشي بیانولی؛ د احساساتو په طوفان کې د مختلف ډوله احساساتو احساس کول؛ د ځمکې، اسمان او حتی کائنات څخه ځان جلا کول، په داسې سفر کې چې هلته نه نقشه وي، نه سړکونه، نه نښې؛ یوه ټوله کیسه ایجاد کړئ، ووایاست او تجربه کړئ چې تل به بې ساري او بې ساري پاتې شي. دا ټول د موسیقۍ په واسطه ترسره کیدی شي - یو هنر چې د زرګونو کلونو لپاره شتون لري او زموږ غوږونه او زړونه خوښوي.

په هرصورت، میوزیک، یا بلکه د موسیقۍ کارونه، نه یوازې د جمالیاتی خوښۍ لپاره خدمت کولی شي، بلکې په دوی کې د کوډ شوي معلوماتو لیږد لپاره هم خدمت کولی شي، د ځینې وسیلو لپاره او اوریدونکي ته د لیدو وړ نه وي. نن ورځ موږ به د یوې خورا غیر معمولي مطالعې سره آشنا شو چې د ETH زوریخ څخه فارغ شوي زده کونکي وکولی شول ، د انسان غوږ ته پام نه وي ، د میوزیک کارونو کې ځینې معلومات معرفي کړي ، چې له امله یې میوزیک پخپله د معلوماتو لیږد چینل کیږي. دوی څنګه په سمه توګه خپله ټیکنالوژي پلي کړې، ایا د ایمبیډ شوي ډیټا سره او پرته خټکي خورا توپیر لري، او عملي ازموینو څه ښودلي؟ موږ په دې اړه د څیړونکو له راپور څخه زده کوو. لاړ شه.

د مطالعې اساس

څیړونکي د دوی ټیکنالوژي د اکوسټیک ډیټا لیږد ټیکنالوژي بولي. کله چې یو سپیکر بدل شوی میلوډي غږوي، یو سړی دا د عادي په توګه پیژني، مګر، د بیلګې په توګه، یو سمارټ فون کولی شي د لیکونو تر مینځ، یا د نوټونو تر مینځ کوډ شوي معلومات ولولي، نو د خبرو کولو لپاره. ساینس پوهان (دا حقیقت چې دا هلکان لاهم فارغ شوي زده کونکي دي دوی د ساینس پوهانو کیدو مخه نه نیسي) د لیږد سرعت او اعتبار د دې پیرامیټونو کچې ساتلو پرمهال ، د ټاکل شوي آډیو فایل په پام کې نیولو پرته ، د پلي کولو خورا مهم اړخ په توګه بولي. دا د معلوماتو لیږد تخنیک. رواني اکوسټکس، کوم چې د غږونو په اړه د انسان د ادراک رواني او فزیولوژیکي اړخونه مطالعه کوي، د دې دندې سره مقابله کې مرسته کوي.

د اکوسټیک ډیټا لیږد اصلي ته د OFDM (اورتوګونل فریکوینسي ډیویژن ملټي پلیکسینګ) په نوم ویل کیدی شي ، کوم چې د وخت په تیریدو سره د سرچینې میوزیک ته د فرعي کیریرونو موافقت سره ، د معلوماتو لیږد لپاره د لیږد شوي فریکونسۍ سپیکٹرم اعظمي ګټه اخیستنه ممکنه کړې. د دې څخه مننه، دا ممکنه وه چې تر 412 مترو پورې د 24 bps د لیږد سرعت ترلاسه کړئ (د تېروتنې کچه <10٪). عملي تجربو چې 40 رضاکاران پکې شامل وو دا حقیقت تایید کړ چې دا تقریبا ناممکن دی چې د اصلي میلوډي او هغه یو تر مینځ توپیر واوري چې معلومات پکې ځای پرځای شوي.

دا ټیکنالوژي چیرته په عمل کې پلي کیدی شي؟ څیړونکي خپل ځواب لري: نږدې ټول عصري سمارټ فونونه، لپټاپونه او نور لاسي وسایل په مایکروفونونو سمبال دي، او ډیری عامه ځایونه (کافې، رستورانتونه، د پیرودلو مرکزونه، او نور) د شالید موسیقۍ سره سپیکرې لري. دا شالید میلوډي کولی شي د مثال په توګه ، د اضافي عملونو اړتیا پرته د Wi-Fi شبکې سره وصل کولو لپاره ډیټا شامل کړي.

د اکوسټیک ډیټا لیږد عمومي ځانګړتیاوې موږ ته روښانه شوي؛ اوس راځئ چې د دې سیسټم جوړښت مفصلې مطالعې ته لاړ شو.

د سیسټم توضیحات

په میلوډي کې د معلوماتو معرفي کول د فریکونسۍ ماسک کولو له امله پیښیږي. د وخت په سلاټونو کې، د ماسک کولو فریکونسۍ پیژندل کیږي او د دې ماسکینګ عناصرو ته نږدې د OFDM فرعي کیریرونه د معلوماتو سره ډک شوي.

د نوټونو تر مینځ لوستل: د میوزیک دننه د معلوماتو لیږد سیسټم
انځور #1: د اصلي فایل بدلول په یوه جامع سیګنال (میلوډي + ډیټا) کې چې د سپیکرو له لارې لیږدول کیږي.

د پیل کولو لپاره، اصلي آډیو سیګنال د تحلیل لپاره په پرله پسې برخو ویشل شوی. د L = 8820 نمونو هره دا ډول برخه (Hi)، د 200 ms سره مساوي، سره ضرب کیږي کړکۍ* د سرحدونو اغیزو کمولو لپاره.

کړکۍ* د وزن کولو فعالیت دی چې په سپیکٹرل اندازې کې د سایډلوبونو له امله د اغیزو کنټرول لپاره کارول کیږي.

بیا، د اصلي سیګنال غالب فریکونسۍ د 500 Hz څخه تر 9.8 kHz پورې په رینج کې کشف شوي، کوم چې د دې برخې لپاره د ماسکینګ فریکونسۍ fM،l ترلاسه کول ممکن کړي. برسېره پردې، ډاټا د 9.8 څخه تر 10 kHz پورې په کوچنۍ لړۍ کې لیږدول شوي ترڅو په رسیدونکي کې د فرعي کیریر موقعیت تاسیس کړي. د کارول شوي فریکونسۍ رینج پورتنۍ حد په لوړه فریکونسۍ کې د سمارټ فون مایکروفونونو ټیټ حساسیت له امله 10 kHz ته ټاکل شوی.

د ماسک کولو فریکونسۍ په انفرادي ډول د هرې تحلیل شوې برخې لپاره ټاکل شوې. د HPS (هارمونیک محصول سپیکٹرم) میتود په کارولو سره ، درې غالب فریکونسۍ پیژندل شوي او بیا د هارمونیک کروماتیک پیمانه نږدې یادداشتونو ته ګردي شوي. په دې توګه اصلي نوټونه fF,i = 1…3 ترلاسه شوي، د C0 (16.35 Hz) او B0 (30.87 Hz) تر منځ پروت دي. د دې حقیقت پر بنسټ چې بنسټیز یادښتونه د ډیټا په لیږد کې د کارولو لپاره خورا ټیټ دي، د دوی لوړ اوکتوز 500kfF،i په 9.8 Hz ... 2 kHz کې حساب شوي. د دې ډیری فریکونسۍ (fO,l1) د HPS طبیعت له امله ډیر څرګند شوي.

د نوټونو تر مینځ لوستل: د میوزیک دننه د معلوماتو لیږد سیسټم
انځور #2: د بنسټیزو یادښتونو او هارمونیک fH، l1 د خورا قوي ټون لپاره د octaves fO,l2 حساب شوي.

د octaves او هارمونیکونو پایله لرونکي سیټ د ماسک کولو فریکونسۍ په توګه کارول شوي ، له کوم څخه چې د OFDM فرعي کیریر فریکونسۍ fSC,k اخیستل شوي. دوه فرعي کیریرونه د هر ماسک کولو فریکونسۍ لاندې او پورته داخل شوي.

بیا، د های آډیو برخې سپیکٹرم د فرعي کیریر فریکونسۍ fSC,k کې فلټر شوی. له دې وروسته، په Bi کې د معلوماتو بټونو پراساس د OFDM سمبول رامینځته شو چې له امله یې د سپیکر له لارې د جامع برخې Ci لیږدول کیدی شي. د فرعي کیریرونو اندازه او مرحلې باید غوره شي ترڅو ترلاسه کونکی کولی شي لیږدول شوي ډاټا استخراج کړي پداسې حال کې چې اوریدونکي په میلوډي کې بدلون نه ګوري.

د نوټونو تر مینځ لوستل: د میوزیک دننه د معلوماتو لیږد سیسټم
انځور نمبر 3: د اصلي میلوډي د Hi برخې د سپیکٹرم او فرعي کیریر فریکونسۍ برخه.

کله چې د کوډ شوي معلوماتو سره یو آډیو سیګنال د سپیکرو له لارې پلی کیږي ، د ترلاسه کونکي وسیلې مایکروفون دا ثبتوي. د ایمبیډ شوي OFDM سمبولونو پیل شوي موقعیتونو موندلو لپاره ، ریکارډونه لومړی باید د بانډ پاس فلټر شي. پدې توګه ، د پورتنۍ فریکونسۍ رینج ایستل کیږي ، چیرې چې د فرعي کیریرونو ترمینځ د میوزیک مداخلې نښې شتون نلري. تاسو کولی شئ د سایکلیک مختګ په کارولو سره د OFDM سمبولونو پیل ومومئ.

د OFDM سمبولونو د پیل موندلو وروسته، اخیستونکی د لوړې فریکونسۍ ډومین ډیکوډینګ له لارې د خورا غالب نوټونو په اړه معلومات ترلاسه کوي. برسېره پردې، OFDM د محدود مداخلې سرچینې په وړاندې خورا مقاومت لري، ځکه چې دوی یوازې په ځینو فرعي کیریرونو اغیزه کوي.

عملي ازموینې

د KRK Rokit 8 سپیکر د بدل شوي میلوډیز سرچینې په توګه عمل وکړ، او د Nexus 5X سمارټ فون د ترلاسه کونکي ګوند رول لوبولی.

د نوټونو تر مینځ لوستل: د میوزیک دننه د معلوماتو لیږد سیسټم
انځور #4: د حقیقي OFDM او ارتباطي چوټو ترمنځ توپیر د سپیکر او مایکروفون ترمنځ په 5m کې د کور دننه اندازه شوی.

د OFDM ډیری ټکي د 0 څخه تر 25 ms پورې رینج کې دي، نو تاسو کولی شئ د 66.6 ms سایکلیک مخکیني دننه یو باوري پیل ومومئ. څیړونکي یادونه کوي چې اخیستونکی (په دې تجربه کې، یو سمارټ فون) په پام کې نیسي چې د OFDM سمبولونه په دوره توګه لوبول کیږي، کوم چې د دوی کشف ته وده ورکوي.

د چک کولو لپاره لومړی شی د بټ غلطی نرخ (BER) باندې د فاصلې اغیز و. د دې کولو لپاره، درې ازموینې په مختلف ډوله خونو کې ترسره شوې: د غالۍ سره دهلیز، په فرش کې د لینولیم سره یو دفتر، او د لرګیو فرش سره یو آډیټوریم.


د وان هیلین لخوا سندره "او کریډل ول راک" د ازموینې موضوع په توګه غوره شوې.

د غږ حجم تنظیم شوی ترڅو د سپیکر څخه د 2 متر په فاصله کې د سمارټ فون لخوا اندازه شوي غږ کچه 63 dB وه.

د نوټونو تر مینځ لوستل: د میوزیک دننه د معلوماتو لیږد سیسټم
د انځور شمیره 5: د BER شاخصونه د سپیکر او مایکروفون ترمنځ فاصله پورې اړه لري (نیلي کرښه - لیدونکي، شنه - دهلیز، نارنجي - دفتر).

په دالان کې ، د سپیکر څخه تر 40 مترو پورې د سمارټ فون لخوا د 24 dB غږ پورته شو. په ټولګي کې د 15 متر په فاصله کې غږ 55 dB وو، او په دفتر کې د 8 مترو په فاصله کې د سمارټ فون لخوا د غږ کچه 57 dB ته رسیدله.

ځکه چې آډیوټوریم او دفتر ډیر متوجه دي، د ناوخته OFDM سمبول گونج د سایکلیک مخکیني اوږدوالي څخه ډیریږي او BER زیاتوي.

تکرار* - د څو انعکاس له امله د غږ شدت کې تدریجي کمښت.

څیړونکو د دریو ژانرونو (لاندې جدول) څخه په 6 مختلف سندرو کې د پلي کولو له لارې د دوی سیسټم استعداد نور هم وښود.

د نوټونو تر مینځ لوستل: د میوزیک دننه د معلوماتو لیږد سیسټم
جدول نمبر 1: په ازموینو کې کارول شوې سندرې.

همدارنګه، د جدول ډیټا له لارې، موږ کولی شو د هرې سندرې لپاره د بټ نرخ او د بټ غلطی نرخونه وګورو. د معلوماتو نرخونه توپیر لري ځکه چې توپیر BPSK (د مرحلې شفټ کینګ) ښه کار کوي کله چې ورته فرعي کیریرونه کارول کیږي. او دا ممکنه ده کله چې نږدې برخې د ورته ماسک کولو عناصر ولري. په دوامداره توګه لوړ غږ سندرې د معلوماتو پټولو لپاره غوره اساس چمتو کوي ځکه چې د ماسک کولو فریکونسۍ په پراخه فریکونسۍ کې خورا قوي شتون لري. ګړندی میوزیک کولی شي یوازې د تحلیل کړکۍ د ټاکل شوي اوږدوالي له امله د OFDM سمبولونه په جزوي ډول ماسک کړي.

بیا، خلکو د سیسټم ازموینه پیل کړه، څوک باید دا معلومه کړي چې کوم میلوډي اصلي دی او کوم چې په هغې کې شامل شوي معلوماتو سره سمون لري. د همدې موخې لپاره، د جدول له 12 څخه د 1 ثانیو سندرې اقتباسونه په ځانګړې ویب پاڼه کې خپاره شوي.

په لومړۍ تجربه (E1) کې، هر ګډونوال ته د اوریدلو لپاره یو تعدیل شوی یا اصلي ټوټه ورکړل شوې وه او پریکړه یې کړې وه چې آیا ټوټه اصلي یا تعدیل شوې وه. په دویمه تجربه (E2) کې، ګډونوال کولی شي دواړه نسخې څو ځله واوري څومره چې دوی وغواړي، او بیا پریکړه وکړي چې کوم یو اصلي دی او کوم یو تعدیل شوی.

د نوټونو تر مینځ لوستل: د میوزیک دننه د معلوماتو لیږد سیسټم
جدول نمبر 2: د E1 او E2 تجربو پایلې.

د لومړۍ تجربې پایلې دوه شاخصونه لري: p(O|O) - د برخه اخیستونکو سلنه چې په سمه توګه اصلي میلوډي په نښه کړي او p(O|M) - د برخه اخیستونکو سلنه چې د میلوډي بدله شوې نسخه یې د اصلي په توګه نښه کړې.

په زړه پورې خبره دا ده چې د څیړونکو په وینا ځینې برخه اخیستونکي ځینې بدل شوي خټکي د اصلي څخه ډیر اصلي بولي. د دواړو تجربو اوسط وړاندیز کوي چې اوسط اوریدونکی به د منظم میلوډي او یو په کوم کې چې معلومات پکې ځای په ځای شوي توپیر ونه ګوري.

په طبیعي ډول، د موسیقۍ ماهرین او موسیقار به وتوانیږي چې په بدل شوي غږونو کې ځینې غلطۍ او شکمن عناصر کشف کړي، مګر دا عناصر دومره مهم ندي چې د ناخوښۍ لامل شي.

او اوس موږ پخپله تجربه کې برخه اخلو. لاندې د ورته میلوډي دوه نسخې دي - اصلي او ترمیم شوي. ایا تاسو توپیر اوریدلی شئ؟

د میلوډي اصلي نسخه
vs
د میلوډي بدله شوې نسخه

د مطالعې د باریکیو په اړه د لا زیاتو مفصلو پوهیدو لپاره ، زه وړاندیز کوم چې یو نظر وګورم راپور څیړنیز ګروپ

تاسو کولی شئ د آډیو فایلونو زپ آرشیف هم ډاونلوډ کړئ د اصلي او بدل شوي ټونونو څخه چې په مطالعې کې کارول شوي دا لینک.

اییلیلوم

په دې کار کې، د ETH زوریخ څخه فارغ شوي زده کونکي په موسیقۍ کې د معلوماتو د لیږد یو حیرانونکي سیسټم تشریح کړ. د دې کولو لپاره، دوی د فریکونسۍ ماسکینګ کارول، کوم چې دا ممکنه کړه چې ډاټا د سپیکر لخوا غږول شوي میلوډي کې ځای پرځای کړي. دا میلوډي د وسیلې مایکروفون لخوا درک کیږي ، کوم چې پټ معلومات پیژني او ډیکوډ کوي ، پداسې حال کې چې اوسط اوریدونکی به حتی توپیر ونه ګوري. په راتلونکي کې، هلکان پالن لري چې خپل سیسټم رامینځته کړي، په آډیو کې د معلوماتو معرفي کولو لپاره نور پرمختللي میتودونه غوره کړي.

کله چې یو څوک د غیر معمولي شی سره راځي، او تر ټولو مهم، یو څه چې کار کوي، موږ تل خوشحاله یو. خو تر دې هم د خوښۍ خبره دا ده چې دا اختراع د ځوانانو له خوا رامنځته شوې ده. ساینس د عمر محدودیت نلري. او که ځوانان ساینس ستړی کوي، نو دا د غلط زاویې څخه وړاندې کیږي، نو د خبرو کولو لپاره. په هرصورت، لکه څنګه چې موږ پوهیږو، ساینس یوه حیرانونکې نړۍ ده چې هیڅکله د حیرانتیا مخه نه نیسي.

د جمعې په ورځ:


له هغه ځایه چې موږ د موسیقۍ په اړه خبرې کوو، یا د راک موسیقۍ په اړه خبرې کوو، دلته د راک پراخولو له لارې یو ښه سفر دی.


ملکه، "راډیو ګا ګا" (1984).

د لوستلو لپاره مننه ، لیواله اوسئ ، او د اونۍ پای هلکان ولرئ! 🙂

له موږ سره د پاتې کیدو لپاره مننه. ایا تاسو زموږ مقالې خوښوي؟ غواړئ نور په زړه پورې مینځپانګه وګورئ؟ د امر په ورکولو یا ملګرو ته وړاندیز کولو سره زموږ ملاتړ وکړئ ، د ننوتلو کچې سرورونو ځانګړي انلاګ کې د هابر کاروونکو لپاره 30٪ تخفیف ، کوم چې زموږ لخوا ستاسو لپاره اختراع شوی و: د VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps په اړه بشپړ حقیقت له $ 20 څخه یا څنګه سرور شریک کړئ؟ (د RAID1 او RAID10 سره شتون لري، تر 24 کور پورې او تر 40GB DDR4 پورې).

Dell R730xd 2 ځله ارزانه؟ یوازې دلته 2x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 تلویزیون له $199 څخه په هالنډ کې! ډیل R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - له $ 99 څخه! په اړه ولولئ د زیربنا شرکت جوړولو څرنګوالی د ډیل R730xd E5-2650 v4 سرورونو کارولو سره ټولګي د یوې پیسي لپاره د 9000 یورو ارزښت لري؟

سرچینه: www.habr.com

Add a comment