Leughadh eadar na notaichean: an siostam tar-chuir dàta taobh a-staigh ceòl

Leughadh eadar na notaichean: an siostam tar-chuir dàta taobh a-staigh ceòl

Cuir an cèill dè na faclan nach urrainn a thoirt seachad; faireachdainn measgachadh farsaing de fhaireachdainnean eadar-fhighte ann an doineann de fhaireachdainnean; gus briseadh air falbh bhon talamh, na speuran agus eadhon an Cruinne-cè fhèin, a 'dol air turas far nach eil mapaichean, gun rathaidean, gun chomharran; cruthaich, innis agus cuir eòlas air sgeulachd slàn a bhios an-còmhnaidh gun samhail agus gun samhail. Faodar seo uile a dhèanamh le ceòl - ealain a tha air a bhith ann airson mìltean de bhliadhnaichean agus a bheir toileachas dha ar cluasan agus ar cridheachan.

Ach, faodaidh ceòl, no an àite obraichean ciùil, a bhith chan ann a-mhàin airson toileachas esthetigeach, ach cuideachd airson sgaoileadh fiosrachaidh a tha air a chòdachadh annta, airson inneal air choireigin agus do-fhaicsinneach don neach-èisteachd. An-diugh gheibh sinn eòlas air sgrùdadh gu math neo-àbhaisteach anns an robh e comasach do dh'oileanaich ceumnachaidh bho ETH Zurich, gun mhothachadh leis a 'chluas daonna, dàta sònraichte a thoirt a-steach do obraichean ciùil, air sgàth' s gu bheil an ceòl fhèin gu bhith na sheanal tar-chuir dàta. Dè dìreach a chuir iad an teicneòlas an gnìomh, a bheil na fuinn le agus às aonais an dàta freumhaichte gu math eadar-dhealaichte, agus dè a sheall deuchainnean practaigeach? Bidh sinn ag ionnsachadh mu dheidhinn seo bho aithisg an luchd-rannsachaidh. Rachaibh.

Bunait rannsachaidh

Canaidh an luchd-rannsachaidh an teicneòlas aca teicneòlas tar-chuir dàta fuaimneach. Nuair a chluicheas neach-labhairt fonn atharraichte, bidh neach ga fhaicinn mar rud àbhaisteach, ach, mar eisimpleir, faodaidh fòn cliste fiosrachadh còdaichte a leughadh eadar na loidhnichean, no an àite eadar na notaichean, mar sin a bhruidhinn. Bidh luchd-saidheans (leis gu bheil na daoine sin fhathast nan oileanaich ceumnachaidh a’ cur stad orra bho bhith nan luchd-saidheans) a’ gairm astar agus earbsachd an tar-chuir fhad ‘s a tha iad a’ cumail suas ìre nam paramadairean sin, ge bith dè am faidhle claisneachd taghte, mar an taobh as cudromaiche de bhuileachadh an dòigh gluasad dàta seo. Bidh psychoacoustics, a bhios a’ sgrùdadh taobhan saidhgeòlach agus fios-eòlasach de bheachd daonna air fuaimean, a’ cuideachadh le bhith a’ dèiligeadh ris a’ ghnìomh seo.

Faodaidh cridhe sgaoileadh dàta fuaimneach a bhith air ainmeachadh mar OFDM (iomadachadh roinn tricead orthogonal), a rinn, còmhla ri atharrachadh fo-ghiùlan gu ceòl stòr thar ùine, e comasach an fheum as motha a dhèanamh den speactram tricead tar-chuir airson sgaoileadh fiosrachaidh. Taing dha seo, bha e comasach astar tar-chuir de 412 bps a choileanadh thairis air astar suas ri 24 meatairean (ìre mearachd <10%). Dhearbh deuchainnean practaigeach le 40 saor-thoileach gu bheil e cha mhòr do-dhèanta an diofar eadar am fonn tùsail agus am fear anns an deach am fiosrachadh a chluinntinn.

Càite am faodar an teicneòlas seo a chuir an sàs ann an cleachdadh? Tha am freagairt aca fhèin aig luchd-rannsachaidh: tha cha mhòr a h-uile fòn cliste ùr-nodha, coimpiutairean-uchd agus innealan-làimhe eile uidheamaichte le microfònan, agus tha luchd-labhairt le ceòl cùl aig mòran àiteachan poblach (cafaidhean, taighean-bìdh, ionadan bhùthan, msaa). Faodaidh am fonn cùil seo, mar eisimpleir, dàta a thoirt a-steach airson ceangal ri lìonra Wi-Fi gun fheum air gnìomhan a bharrachd.

Tha feartan coitcheann sgaoileadh dàta fuaimneach air fàs soilleir dhuinn; a-nis gluaisidh sinn air adhart gu sgrùdadh mionaideach air structar an t-siostaim seo.

Tuairisgeul an t-siostam

Tha toirt a-steach dàta a-steach don fhonn a’ tachairt mar thoradh air falach tricead. Ann an sliotan ùine, thathas a’ comharrachadh triceadan fasgach agus tha fo-ghiùlan OFDM faisg air na h-eileamaidean brisidh sin air an lìonadh le dàta.

Leughadh eadar na notaichean: an siostam tar-chuir dàta taobh a-staigh ceòl
Ìomhaigh #1: Ag atharrachadh am faidhle tùsail gu comharra co-dhèanta (melody + data) air a ghluasad tro na luchd-labhairt.

An toiseach, tha an comharra claisneachd tùsail air a roinn ann an earrannan leantainneach airson mion-sgrùdadh. Tha gach earrann den leithid (Hi) de shampaill L = 8820, co-ionann ri 200 ms, air iomadachadh le uinneag* gus buaidhean crìche a lughdachadh.

Uinneag* Is e gnìomh cuideamachaidh a thathas a’ cleachdadh gus smachd a chumail air buaidhean mar thoradh air sidelobes ann an tuairmsean speurail.

An uairsin, chaidh na prìomh triceadan den chomharra tùsail a lorg anns an raon bho 500 Hz gu 9.8 kHz, a rinn e comasach tricead masgaidh fM,l fhaighinn airson an roinn seo. A bharrachd air an sin, chaidh dàta a ghluasad ann an raon beag bho 9.8 gu 10 kHz gus suidheachadh na subcarrers aig a’ ghlacadair a stèidheachadh. Chaidh crìoch àrd an raoin tricead a chaidh a chleachdadh a shuidheachadh gu 10 kHz air sgàth cho cugallach ‘s a tha microfònan fònaichean sgairteil aig triceadan àrda.

Chaidh triceadan masgaidh a dhearbhadh airson gach roinn sgrùdaichte leotha fhèin. A’ cleachdadh modh HPS (Co-sheirmeach Bathar Spectrum), chaidh na trì triceadan as motha a chomharrachadh agus an uairsin an cruinneachadh gu na notaichean as fhaisge air an sgèile chromatic harmonic. Seo mar a chaidh na prìomh notaichean fF,i = 1…3 fhaighinn, nan laighe eadar na h-iuchraichean C0 (16.35 Hz) agus B0 (30.87 Hz). Stèidhichte air an fhìrinn gu bheil na notaichean bunaiteach ro ìosal airson an cleachdadh ann an sgaoileadh dàta, chaidh na h-octaves nas àirde aca 500kfF, i a thomhas anns an raon 9.8 Hz ... 2 kHz. Bha mòran de na triceadan sin (fO,l1) nas fhollaisiche air sgàth nàdar an HPS.

Leughadh eadar na notaichean: an siostam tar-chuir dàta taobh a-staigh ceòl
Ìomhaigh #2: Octaves àireamhaichte fO,l1 airson na notaichean bunaiteach agus harmonics fH,l2 den tòn as làidire.

Chaidh an seata de octaves agus harmonics a thàinig às a sin a chleachdadh mar triceadan falaich, às an tàinig triceadan subcarrier OFDM fSC,k. Chaidh dà fho-ghiùlan a chuir a-steach gu h-ìosal agus os cionn gach tricead brisidh.

An uairsin, chaidh speactram na roinne claisneachd Hi a shìoladh aig tricead subcarrier fSC,k. Às deidh sin, chaidh samhla OFDM a chruthachadh stèidhichte air na pìosan fiosrachaidh ann am Bi, air sgàth 's gum faodadh an earrann co-dhèanta Ci a bhith air a ghluasad tron ​​​​neach-labhairt. Feumar meudan agus ìrean an fho-ghiùlan a thaghadh gus an urrainn don ghlacadair an dàta a chaidh a tharraing a thoirt a-mach fhad ‘s nach mothaich an neach-èisteachd atharrachaidhean san fonn.

Leughadh eadar na notaichean: an siostam tar-chuir dàta taobh a-staigh ceòl
Ìomhaigh Àir. 3: pàirt den speactram agus tricead subcarrier earrann Hi den fonn tùsail.

Nuair a thèid comharra claisneachd le fiosrachadh air a chòdachadh ann a chluich tro luchd-labhairt, bidh microfòn an inneal faighinn ga chlàradh. Gus suidheachadh tòiseachaidh samhlaidhean OFDM freumhaichte a lorg, feumaidh na clàran a bhith air an sìoladh le bandpass an toiseach. San dòigh seo, tha an raon tricead àrd air a thoirt a-mach, far nach eil comharran eadar-theachd ciùil eadar subcarrers. Gheibh thu toiseach samhlaidhean OFDM a’ cleachdadh ro-leasachan cearcallach.

Às deidh dha toiseach samhlaidhean OFDM a lorg, gheibh an neach-glacaidh fiosrachadh mu na notaichean as làidire tro dhì-chòdachadh àrainn tricead àrd. A bharrachd air an sin, tha OFDM gu math an aghaidh stòran casg bann caol, leis nach toir iad buaidh ach air cuid de na fo-ghiùlan.

Deuchainnean practaigeach

Bha an neach-labhairt KRK Rokit 8 mar thùs nam fuinn atharraichte, agus chluich am fòn cliste Nexus 5X pàirt a’ phàrtaidh faighinn.

Leughadh eadar na notaichean: an siostam tar-chuir dàta taobh a-staigh ceòl
Ìomhaigh #4: Eadar-dhealachadh eadar fìor OFDM agus stùcan co-dhàimh air a thomhas a-staigh aig 5m eadar neach-labhairt agus microfòn.

Tha a’ mhòr-chuid de phuingean OFDM anns an raon bho 0 gu 25 ms, gus an lorg thu toiseach tòiseachaidh dligheach taobh a-staigh ro-leasachan cearcallach 66.6 ms. Tha an luchd-rannsachaidh a’ toirt fa-near gu bheil an cuidhteas (anns an deuchainn seo, fòn cliste) a’ toirt fa-near gu bheil samhlaidhean OFDM air an cluich bho àm gu àm, a leasaicheas an lorg.

B’ e a’ chiad rud ri sgrùdadh a’ bhuaidh a bha aig astar air ìre mearachd bit (BER). Gus seo a dhèanamh, chaidh trì deuchainnean a dhèanamh ann an diofar sheòrsaichean de sheòmraichean: trannsa le brat-ùrlair, oifis le linoleum air an làr, agus talla-èisteachd le làr fiodha.


Chaidh an t-òran "And The Cradle Will Rock" le Van Halen a thaghadh mar chuspair na deuchainn.

Chaidh an ìre fuaim atharrachadh gus am biodh an ìre fuaim a chaidh a thomhas leis a’ fòn cliste aig astar 2 m bhon neach-labhairt aig 63 dB.

Leughadh eadar na notaichean: an siostam tar-chuir dàta taobh a-staigh ceòl
Ìomhaigh Àireamh 5: Comharran BER a rèir an astar eadar an neach-labhairt agus am micreofon (loidhne ghorm - luchd-èisteachd, uaine - trannsa, orains - oifis).

Anns an talla, chaidh fuaim 40 dB a thogail le fòn cliste aig astar suas ri 24 meatairean bhon neach-labhairt. Anns an t-seòmar-sgoile aig astar 15 m bha am fuaim 55 dB, agus san oifis aig astar 8 meatairean ràinig an ìre fuaim a chunnaic am fòn cliste 57 dB.

Leis gu bheil an talla-èisteachd agus an oifis nas ath-aithriseach, bidh mac-talla de shamhla OFDM fadalach nas àirde na fad ro-leasachan cearcallach agus ag àrdachadh am BER.

Ath-aithris* - lùghdachadh mean air mhean ann an dian-fuaim mar thoradh air na h-iomadh faileasan aige.

Sheall an luchd-rannsachaidh tuilleadh sùbailteachd an t-siostam aca le bhith ga chur an sàs ann an 6 òrain eadar-dhealaichte bho thrì gnèithean (clàr gu h-ìosal).

Leughadh eadar na notaichean: an siostam tar-chuir dàta taobh a-staigh ceòl
Clàr Àir. 1: òrain air an cleachdadh ann an deuchainnean.

Cuideachd, tro dhàta a’ bhùird, chì sinn an ìre ìre agus ìrean mearachd bit airson gach òran. Tha na h-ìrean dàta eadar-dhealaichte seach gu bheil BPSK eadar-dhealaichte (iuchrach gluasad ìre) ag obair nas fheàrr nuair a bhios na h-aon fo-innealan gan cleachdadh. Agus tha seo comasach nuair a tha na h-aon eileamaidean masgaidh ann am pàirtean faisg air làimh. Tha òrain a tha an-còmhnaidh àrd a’ toirt seachad am bunait as fheàrr airson falach dàta leis gu bheil na triceadan fasgach nas làidire an làthair thar raon tricead farsaing. Chan urrainn do cheòl aig astar luath ach gu ìre falachadh air samhlaidhean OFDM air sgàth fad stèidhichte na h-uinneige anailis.

An uairsin, thòisich daoine a 'dèanamh deuchainn air an t-siostam, a dh'fheumadh faighinn a-mach dè am fonn a bha tùsail agus a chaidh atharrachadh leis an fhiosrachadh a bha na bhroinn. Airson an adhbhair seo, chaidh earrannan 12-diog de dh'òrain bho chlàr Àireamh 1 a phostadh air làrach-lìn sònraichte.

Anns a’ chiad deuchainn (E1), chaidh criomag atharraichte no tùsail a thoirt do gach com-pàirtiche airson èisteachd ris agus bha aca ri co-dhùnadh an robh a’ chriomag tùsail no atharraichte. Anns an dàrna deuchainn (E2), b 'urrainn do chom-pàirtichean èisteachd ris an dà dhreach cho tric' sa bha iad ag iarraidh, agus an uairsin co-dhùnadh dè am fear a bha tùsail agus dè am fear a chaidh atharrachadh.

Leughadh eadar na notaichean: an siostam tar-chuir dàta taobh a-staigh ceòl
Clàr Àir. 2: toraidhean dheuchainnean E1 agus E2.

Tha dà thaisbeanair aig toraidhean a’ chiad deuchainn: p(O | O) - an àireamh sa cheud de chom-pàirtichean a chomharraich am fonn tùsail gu ceart agus p(O | M) - an àireamh sa cheud de chom-pàirtichean a chomharraich an dreach atharraichte den fonn mar thùs.

Gu inntinneach, bha cuid de chom-pàirtichean, a rèir an luchd-rannsachaidh, den bheachd gu robh cuid de na fuinn atharraichte nas tùsail na am fear tùsail fhèin. Tha cuibheasachd an dà dheuchainn a’ moladh nach mothaicheadh ​​an neach-èisteachd cuibheasach eadar-dhealachadh eadar fonn àbhaisteach agus fear anns an robh dàta freumhaichte.

Gu nàdarra, bidh e comasach dha eòlaichean ciùil agus luchd-ciùil cuid de mhearachdan agus eileamaidean amharasach a lorg anns na binneanan atharraichte, ach chan eil na h-eileamaidean sin cho cudromach gu bhith ag adhbhrachadh mì-chofhurtachd.

Agus a-nis faodaidh sinn fhìn pàirt a ghabhail anns an deuchainn. Gu h-ìosal tha dà dhreach den aon fonn - an tè tùsail agus an tè atharraichte. An cluinn thu an diofar?

An dreach tùsail den cheòl
vs
Tionndadh atharraichte den cheòl

Airson eòlas nas mionaidiche air nuances an sgrùdaidh, tha mi a’ moladh coimhead air aithisg buidheann rannsachaidh.

Faodaidh tu cuideachd tasglann ZIP de fhaidhlichean claisneachd de na puirt tùsail agus atharraichte a chaidh a chleachdadh san sgrùdadh a luchdachadh sìos aig an ceangal seo.

Epilogue

Anns an obair seo, thug oileanaich ceumnachaidh bho ETH Zurich cunntas air siostam tar-chuir dàta iongantach taobh a-staigh ceòl. Gus seo a dhèanamh, chleachd iad masgadh tricead, a rinn e comasach an dàta a chuir a-steach don fhonn a chluich an neach-labhairt. Tha am fonn seo air fhaicinn le microfòn an inneil, a tha ag aithneachadh an dàta falaichte agus ga dhì-chòdachadh, fhad ‘s nach mothaich an neach-èisteachd cuibheasach eadhon an diofar. Anns an àm ri teachd, tha na balaich an dùil an siostam aca a leasachadh, a’ taghadh dhòighean nas adhartaiche airson dàta a thoirt a-steach gu claisneachd.

Nuair a thig cuideigin suas le rudeigin neo-àbhaisteach, agus nas cudromaiche, rudeigin a tha ag obair, tha sinn an-còmhnaidh toilichte. Ach is e barrachd toileachas a th 'ann gun deach an innleachd seo a chruthachadh le daoine òga. Chan eil cuingealachaidhean aois aig saidheans. Agus ma tha daoine òga a 'faighinn saidheans sgìth, tha e air a thaisbeanadh bhon cheàrn ceàrr, mar sin a bhruidhinn. Às deidh na h-uile, mar a tha fios againn, tha saidheans na shaoghal iongantach nach sguir a bhith iongantach.

Dihaoine bhon mhullach:


Leis gu bheil sinn a’ bruidhinn air ceòl, no an àite ceòl roc, seo turas mìorbhaileach tro na raointean roc.


Banrigh, "Radio Ga Ga" (1984).

Tapadh leibh airson an leughadh, fuirich fiosrach, agus bi deagh dheireadh-seachdain agad guys! 🙂

Tapadh leibh airson fuireach còmhla rinn. An toil leat na h-artaigilean againn? A bheil thu airson susbaint nas inntinniche fhaicinn? Thoir taic dhuinn le bhith a’ cur òrdugh no a’ moladh do charaidean, Lasachadh de 30% airson luchd-cleachdaidh Habr air analog sònraichte de luchd-frithealaidh ìre inntrigidh, a chaidh a chruthachadh leinn dhut: An fhìrinn gu lèir mu VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps bho $ 20 no ciamar a roinn thu frithealaiche? (ri fhaighinn le RAID1 agus RAID10, suas ri 24 cores agus suas ri 40GB DDR4).

Dell R730xd 2 uair nas saoire? A-mhàin an seo 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV bho $199 anns an Òlaind! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - bho $99! Leugh mu dheidhinn Ciamar a thogail bun-structair Corp. clas le bhith a’ cleachdadh frithealaichean Dell R730xd E5-2650 v4 luach 9000 iùro airson sgillinn?

Source: www.habr.com

Cuir beachd ann