Нотуудын хооронд унших: хөгжим доторх өгөгдөл дамжуулах систем

Нотуудын хооронд унших: хөгжим доторх өгөгдөл дамжуулах систем

Үгээр илэрхийлэх боломжгүй зүйлийг илэрхийлэх; мэдрэмжийн шуурганд холбогдсон олон төрлийн сэтгэл хөдлөлийг мэдрэх; газар, тэнгэр, тэр ч байтугай орчлон ертөнцөөс салж, газрын зураг, зам, тэмдэг байхгүй аялалд гарах; Үргэлж өвөрмөц, давтагдашгүй хэвээр үлдэх бүхэл бүтэн түүхийг зохион бүтээж, ярьж, мэдрээрэй. Олон мянган жилийн турш оршин тогтнож, бидний чих, зүрх сэтгэлийг баясгадаг урлаг болох хөгжим энэ бүхнийг хийж чадна.

Гэсэн хэдий ч хөгжим, эс тэгвээс хөгжмийн бүтээлүүд нь зөвхөн гоо зүйн таашаал авахаас гадна зарим төхөөрөмжид зориулагдсан, сонсогчдод үл үзэгдэх мэдээллийг дамжуулахад зориулагдсан болно. Өнөөдөр бид ETH Zurich-ийн төгсөх ангийн оюутнууд хүний ​​чихэнд анзааралгүй хөгжмийн бүтээлд тодорхой өгөгдлийг нэвтрүүлж чадсан, үүний үр дүнд хөгжим өөрөө мэдээлэл дамжуулах суваг болж чадсан маш ер бусын судалгаатай танилцах болно. Тэд технологио яг яаж хэрэгжүүлсэн бэ, суулгасан өгөгдөлтэй, өгөгдөлгүй аялгуу нь маш өөр байна уу, практик туршилтууд юуг харуулсан бэ? Энэ талаар бид судлаачдын тайлангаас олж мэдсэн. Яв.

Судалгааны үндэс

Судлаачид өөрсдийн технологийг акустик өгөгдөл дамжуулах технологи гэж нэрлэдэг. Чанга яригч өөрчилсөн аялгуу тоглоход хүн үүнийг ердийн зүйл мэт хүлээж авдаг, гэхдээ жишээлбэл, ухаалаг утас нь мөр хоорондын, эсвэл нотны хооронд кодлогдсон мэдээллийг уншиж чаддаг. Эрдэмтэд (эдгээр залуус төгсөх курсын оюутнууд хэвээр байгаа нь тэднийг эрдэмтэн болоход саад болохгүй) сонгосон аудио файлаас үл хамааран эдгээр параметрүүдийн түвшинг хадгалахын зэрэгцээ дамжуулах хурд, найдвартай байдлыг хэрэгжүүлэхэд хамгийн чухал зүйл гэж нэрлэдэг. Энэ өгөгдөл дамжуулах техник. Хүний дуу авиаг мэдрэх сэтгэл зүй, физиологийн талыг судалдаг психоакустик нь энэ ажлыг даван туулахад тусалдаг.

Акустик өгөгдөл дамжуулах цөмийг OFDM (orthogonal frekans хуваах олон талт) гэж нэрлэж болох бөгөөд энэ нь дэд зөөгчдийг эх хөгжимд цаг хугацааны явцад дасан зохицохын зэрэгцээ дамжуулагдсан давтамжийн спектрийг мэдээлэл дамжуулахад хамгийн их ашиглах боломжтой болгосон. Үүний ачаар 412 метр хүртэлх зайд 24 бит / сек хурдтай дамжуулах боломжтой болсон (алдааны түвшин < 10%). 40 сайн дурынхныг хамарсан практик туршилтууд нь анхны аялгуу болон мэдээлэл суулгасан аялгуу хоёрын ялгааг сонсох бараг боломжгүй гэдгийг баталжээ.

Энэ технологийг практикт хаана хэрэглэж болох вэ? Судлаачид өөрсдийн гэсэн хариулттай: бараг бүх орчин үеийн ухаалаг гар утас, зөөврийн компьютер болон бусад гар төхөөрөмжүүд микрофоноор тоноглогдсон, олон нийтийн газар (кафе, ресторан, худалдааны төв гэх мэт) арын хөгжимтэй чанга яригчтай байдаг. Энэ дэвсгэр аялгуу нь жишээлбэл, нэмэлт үйлдэл хийх шаардлагагүйгээр Wi-Fi сүлжээнд холбогдох өгөгдлийг агуулж болно.

Акустик өгөгдөл дамжуулах ерөнхий шинж чанарууд бидэнд тодорхой болсон тул одоо энэ системийн бүтцийн нарийвчилсан судалгаа руу шилжье.

Системийн тодорхойлолт

Өгөгдлийг аялгуунд оруулах нь давтамжийг далдлахтай холбоотой юм. Цагийн интервалд далдлах давтамжийг тодорхойлж, эдгээр далдлах элементүүдтэй ойролцоох OFDM дэд дамжуулагчийг мэдээллээр дүүргэдэг.

Нотуудын хооронд унших: хөгжим доторх өгөгдөл дамжуулах систем
Зураг №1: Эх файлыг чанга яригчаар дамжуулдаг нийлмэл дохио (ая + өгөгдөл) болгон хувиргах.

Эхлэхийн тулд анхны аудио дохиог шинжилгээнд зориулж дараалсан сегментүүдэд хуваана. 8820 мс-тэй тэнцүү L = 200 дээжийн ийм сегмент (Hi) бүрийг үржүүлнэ. цонх* хил хязгаарын нөлөөллийг багасгах.

Цонх* нь спектрийн тооцоонд хажуугийн дэлбэнгийн нөлөөг хянахад ашигладаг жинлэх функц юм.

Дараа нь анхны дохионы давамгайлсан давтамжийг 500 Гц-ээс 9.8 кГц-ийн хооронд илрүүлсэн нь энэ сегментийн хувьд fM,l-ийн далдлах давтамжийг авах боломжтой болсон. Нэмж дурдахад хүлээн авагч дээрх дэд тээвэрлэгчдийн байршлыг тогтоохын тулд өгөгдлийг 9.8-аас 10 кГц-ийн бага давтамжтайгаар дамжуулсан. Ухаалаг утасны микрофоны өндөр давтамжийн мэдрэмж багатай тул ашигласан давтамжийн хязгаарын дээд хязгаарыг 10 кГц болгон тохируулсан.

Шинжилгээнд хамрагдсан сегмент тус бүрээр далдлах давтамжийг тус тусад нь тодорхойлсон. HPS (Harmonic Product Spectrum) аргыг ашиглан гурван давамгайлсан давтамжийг тодорхойлж, дараа нь гармоник хроматик хуваарийн хамгийн ойрын тэмдэглэл хүртэл дугуйрсан. C1 (3 Гц) ба B0 (16.35 Гц) товчлууруудын хооронд байрлах fF,i = 0...30.87 гэсэн үндсэн ноотуудыг ингэж авсан. Үндсэн тэмдэглэлүүд нь өгөгдөл дамжуулахад ашиглахад хэтэрхий бага байдаг тул тэдгээрийн өндөр октава 500kfF,i-ийг 9.8 Гц ... 2 кГц-ийн мужид тооцоолсон. Эдгээр давтамжуудын ихэнх нь (fO,l1) УЦС-ын шинж чанараас шалтгаалан илүү тод харагдаж байв.

Нотуудын хооронд унших: хөгжим доторх өгөгдөл дамжуулах систем
Зураг №2: Үндсэн ноот болон хамгийн хүчтэй аялгууны fH,l1 гармоникийн тооцоолсон октава fO,l2.

Үүний үр дүнд үүссэн октава ба гармоникуудыг далдлах давтамж болгон ашигласан бөгөөд үүнээс OFDM дэд дамжуулагч fSC,k давтамжийг гаргаж авсан. Масклах давтамж бүрийн доор болон дээр хоёр дэд дамжуулагчийг оруулсан.

Дараа нь Hi аудио сегментийн спектрийг fSC,k дэд дамжуулагч давтамжаар шүүсэн. Үүний дараа Bi дахь мэдээллийн битүүд дээр үндэслэн OFDM тэмдгийг үүсгэсэн бөгөөд үүний ачаар Ci нийлмэл сегментийг чанга яригчаар дамжуулж болно. Дэд дамжуулагчийн хэмжээ, үе шатыг сонсогч нь аялгууны өөрчлөлтийг анзаарахгүй байхад хүлээн авагч дамжуулсан өгөгдлийг гаргаж авах боломжтой байх ёстой.

Нотуудын хооронд унших: хөгжим доторх өгөгдөл дамжуулах систем
Зураг №3: анхны аялгууны Hi сегментийн спектр ба дэд дамжуулагч давтамжийн хэсэг.

Дотор нь кодлогдсон мэдээлэл бүхий аудио дохиог чанга яригчаар тоглуулах үед хүлээн авагч төхөөрөмжийн микрофон үүнийг бичдэг. Суулгасан OFDM тэмдэгтүүдийн эхлэлийн байрлалыг олохын тулд эхлээд бичлэгүүдийг зурвасын шүүлтүүрээр шалгах шаардлагатай. Ийм байдлаар дэд дамжуулагчийн хооронд хөгжмийн хөндлөнгийн дохио байхгүй дээд давтамжийн мужийг гаргаж авдаг. Та циклийн угтвар ашиглан OFDM тэмдгийн эхлэлийг олох боломжтой.

OFDM тэмдэгтүүдийн эхлэлийг илрүүлсний дараа хүлээн авагч нь өндөр давтамжийн домэйны код тайлах замаар хамгийн давамгайлсан нотуудын талаарх мэдээллийг авдаг. Нэмж дурдахад OFDM нь нарийн зурвасын хөндлөнгийн эх үүсвэрүүдэд нэлээд тэсвэртэй, учир нь тэдгээр нь зөвхөн зарим дэд дамжуулагчдад нөлөөлдөг.

Практик тестүүд

KRK Rokit 8 чанга яригч нь өөрчилсөн аялгууны эх сурвалж болж, Nexus 5X ухаалаг утас хүлээн авагч талын үүрэг гүйцэтгэсэн.

Нотуудын хооронд унших: хөгжим доторх өгөгдөл дамжуулах систем
Зураг №4: Бодит OFDM болон чанга яригч ба микрофоны хоорондох 5 метрийн дотор хэмжигдэх корреляцийн оргилуудын хоорондох ялгаа.

Ихэнх OFDM цэгүүд 0-ээс 25 мс-ийн хооронд байдаг тул та 66.6 ms мөчлөгийн угтвар дотор хүчинтэй эхлэлийг олох боломжтой. Хүлээн авагч (энэ туршилтанд ухаалаг утас) нь OFDM тэмдэгтүүдийг үе үе тоглуулж байгааг харгалзан үздэг бөгөөд энэ нь тэдний илрүүлэлтийг сайжруулдаг болохыг судлаачид тэмдэглэжээ.

Хамгийн түрүүнд шалгах зүйл бол зайны битийн алдааны хурдад (BER) үзүүлэх нөлөө юм. Үүнийг хийхийн тулд янз бүрийн төрлийн өрөөнд гурван туршилт хийсэн: хивс бүхий коридор, шалан дээр хулдаастай оффис, модон шалтай танхим.


Туршилтын объектоор Ван Хэлений "And The Cradle Will Rock" дууг сонгосон.

Дууны хэмжээг чанга яригчаас 2 м-ийн зайд ухаалаг утсаар хэмжсэн дууны түвшин 63 дБ байхаар тохируулсан.

Нотуудын хооронд унших: хөгжим доторх өгөгдөл дамжуулах систем
Зураг No5: Чанга яригч ба микрофоны хоорондох зайнаас хамаарч BER үзүүлэлтүүд (цэнхэр шугам - үзэгчид, ногоон - коридор, улбар шар - оффис).

Хонгилд 40 дБ-ийн дуу чимээг чанга яригчаас 24 метрийн зайд ухаалаг гар утас сонссон. Анги танхимд 15 м-ийн зайд дуу чимээ 55 дБ байсан бол 8 метрийн зайд албан тасалгаанд ухаалаг гар утсаар мэдрэгдэх дууны түвшин 57 дБ хүрчээ.

Үзлэгийн танхим болон оффис нь илүү цуурхалтай байдаг тул хожуу үеийн OFDM тэмдгийн цуурай нь мөчлөгийн угтварын уртаас давж, BER-ийг нэмэгдүүлдэг.

Цуурах чимээ* - олон тусгалын улмаас дууны эрч хүч аажмаар буурах.

Судлаачид өөрсдийн системийн олон талт байдлыг гурван жанрын 6 өөр дуунд хэрэглэснээр харуулсан (доорх хүснэгт).

Нотуудын хооронд унших: хөгжим доторх өгөгдөл дамжуулах систем
Хүснэгт No1: тестэнд ашигласан дуунууд.

Мөн хүснэгтийн өгөгдлөөр бид дуу бүрийн битийн хурд болон битийн алдааны түвшинг харж болно. Дифференциал BPSK (фазын ээлжийн товчлуур) нь ижил дэд дамжуулагчийг ашиглах үед илүү сайн ажилладаг тул өгөгдлийн хурд өөр байна. Зэргэлдээх сегментүүд нь ижил далдлах элементүүдийг агуулсан тохиолдолд энэ нь боломжтой юм. Тасралтгүй чанга дуунууд нь далдлах давтамж нь өргөн давтамжийн мужид илүү хүчтэй байдаг тул өгөгдлийг нуух оновчтой суурь болдог. Хурдан хэмнэлтэй хөгжим нь дүн шинжилгээ хийх цонхны тогтмол урттай тул OFDM тэмдгийг зөвхөн хэсэгчлэн далдлах боломжтой.

Дараа нь хүмүүс уг системийг туршиж эхэлсэн бөгөөд ямар аялгуу анхных, аль нь өөрчилсөнийг түүнд суулгасан мэдээллээр тодорхойлох ёстой байв. Энэ зорилгоор 12-р хүснэгтээс 1 секундын дууны хэсгүүдийг тусгай вэбсайтад байрлуулсан.

Эхний туршилтанд (E1) оролцогч бүрт өөрчилсөн эсвэл эх фрагментийг сонсохоор өгсөн бөгөөд уг фрагмент нь эх эсвэл өөрчлөгдсөн эсэхийг шийдэх ёстой байв. Хоёрдахь туршилтаар (E2) оролцогчид хоёр хувилбарыг хүссэнээрээ сонсож, аль нь эх, аль нь өөрчилсөн болохыг шийдэх боломжтой.

Нотуудын хооронд унших: хөгжим доторх өгөгдөл дамжуулах систем
Хүснэгт No2: E1 ба E2 туршилтын үр дүн.

Эхний туршилтын үр дүн нь хоёр үзүүлэлттэй байна: p(O|O) - анхны аялгууг зөв тэмдэглэсэн оролцогчдын хувь ба p(O|M) - аялгууны өөрчлөгдсөн хувилбарыг эх гэж тэмдэглэсэн оролцогчдын хувь.

Сонирхолтой нь, зарим оролцогчид судлаачдын үзэж байгаагаар зарим өөрчлөгдсөн аялгууг эх хувилбараас нь илүү анхных гэж үздэг. Хоёр туршилтын дундаж нь жирийн сонсогч ердийн аялгуу болон өгөгдөл суулгасан аялгуу хоёрын ялгааг анзаардаггүй болохыг харуулж байна.

Мэдээжийн хэрэг, хөгжмийн мэргэжилтнүүд, хөгжимчид өөрчлөгдсөн аялгуун дахь зарим алдаа, сэжигтэй элементүүдийг илрүүлэх боломжтой боловч эдгээр элементүүд нь таагүй байдал үүсгэхээр тийм ч чухал биш юм.

Одоо бид өөрсдөө туршилтанд оролцох боломжтой. Доорх нь ижил аялгууны хоёр хувилбар юм - анхны болон өөрчлөгдсөн. Та ялгааг сонсож чадах уу?

Дууны эх хувилбар
vs
Аяыг өөрчилсөн хувилбар

Судалгааны нарийн ширийн зүйлстэй илүү дэлгэрэнгүй танилцахын тулд би үзэхийг зөвлөж байна тайлан судалгааны бүлэг.

Та мөн судалгаанд ашигласан эх болон өөрчилсөн дууны аудио файлуудын ZIP архивыг татаж авах боломжтой энэ холбоос.

Эпилог

Энэхүү бүтээлд ETH Zurich-ийн төгсөх ангийн оюутнууд хөгжим доторх өгөгдөл дамжуулах гайхалтай системийг дүрсэлсэн байна. Үүний тулд тэд давтамжийн маскыг ашигласан бөгөөд энэ нь чанга яригчийн тоглосон аялгуунд өгөгдлийг оруулах боломжтой болсон. Энэхүү аялгуу нь төхөөрөмжийн микрофонд мэдрэгддэг бөгөөд энэ нь далд өгөгдлийг таньж, кодыг нь тайлж чаддаг бол энгийн сонсогч ялгааг нь ч анзаардаггүй. Ирээдүйд залуус аудио мэдээлэл оруулах илүү дэвшилтэт аргуудыг сонгон системээ хөгжүүлэхээр төлөвлөж байна.

Хэн нэгэн ер бусын, хамгийн чухал нь үр дүнтэй ямар нэг зүйлийг гаргаж ирэхэд бид үргэлж баяртай байдаг. Гэхдээ энэ шинэ бүтээлийг залуучууд бүтээсэн нь илүү их баяр баясгалан юм. Шинжлэх ухаанд насны хязгаарлалт байхгүй. Тэгээд ч залуучуудад шинжлэх ухаан уйтгартай санагдаж байвал буруу өнцгөөс нь харуулж байна гэсэн үг. Эцсийн эцэст, бидний мэдэж байгаагаар шинжлэх ухаан бол хэзээ ч гайхшрахаа больдог гайхалтай ертөнц юм.

Баасан гарагаас гадуур:


Бид хөгжим, эсвэл рок хөгжмийн тухай ярьж байгаа тул рок урсгалаар гайхалтай аялал хийх болно.


Хатан хаан, "Радио Га Га" (1984).

Уншсанд баярлалаа, сонирхож байгаарай, амралтын өдрөө сайхан өнгөрүүлээрэй залуусаа! 🙂

Бидэнтэй хамт байсанд баярлалаа. Манай нийтлэл танд таалагдаж байна уу? Илүү сонирхолтой контент үзэхийг хүсч байна уу? Захиалга өгөх эсвэл найзууддаа санал болгох замаар биднийг дэмжээрэй, Хабр хэрэглэгчдэд зориулсан 30% хямдралтай, анхан шатны түвшний серверүүдийн өвөрмөц аналогийг бид танд зориулан зохион бүтээжээ. VPS (KVM) E5-2650 v4 (6 цөм) 10GB DDR4 240GB SSD 1Gbps-ийн 20 ам.долларын үнэ эсвэл серверийг хэрхэн хуваалцах тухай бүх үнэн үү? (RAID1 болон RAID10, 24 хүртэлх цөм, 40 ГБ хүртэл DDR4-тэй байх боломжтой).

Dell R730xd 2 дахин хямд байна уу? Зөвхөн энд 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ 199 доллараас Нидерландад! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - 99 доллараас! тухай уншина уу Дэд бүтцийн корпорацийг хэрхэн барих вэ. нэг пенни нь 730 еврогийн үнэтэй Dell R5xd E2650-4 v9000 сервер ашиглах анги?

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх