Teknika për rikrijimin e të folurit përmes analizës së dridhjeve të një llambë në një llambë varëse

Një grup studiuesish nga Universiteti Ben-Gurion i Negevit dhe Instituti i Shkencave Weizmann (Izrael) ka zhvilluar një teknikë Lamfon (PDF) për të rindërtuar bisedën dhe muzikën në ambiente të brendshme duke përdorur analizën e dridhjeve pasive të një llambë në një pajisje ndriçimi varëse. Një sensor elektro-optik i vendosur në rrugë u përdor si një analizues dhe, duke përdorur një teleskop, u drejtua në një llambë të dukshme nga dritarja. Eksperimenti u krye me llamba LED 12 vat dhe bëri të mundur organizimin e përgjimeve nga një distancë prej 25 metrash.

Teknika për rikrijimin e të folurit përmes analizës së dridhjeve të një llambë në një llambë varëse

Metoda funksionon për një llambë të varur. Dridhjet e zërit krijojnë ndryshime në presionin e ajrit, të cilat shkaktojnë mikrovibrime të një objekti të varur. Mikrovibrime të tilla çojnë në shtrembërime të dritës në kënde të ndryshme për shkak të zhvendosjes së rrafshit të shkëlqimit, i cili mund të zbulohet duke përdorur një sensor elektro-optik të ndjeshëm dhe të demodulohet në zë. Një teleskop u përdor për të kapur rrjedhën e dritës dhe për ta drejtuar atë te sensori. Sinjali i marrë nga sensori (Thorlabs PDA100A2 i bazuar në një fotodiodë) u shndërrua në formë dixhitale duke përdorur një konvertues 16-bit analog në dixhital ADC NI-9223.

Teknika për rikrijimin e të folurit përmes analizës së dridhjeve të një llambë në një llambë varëse

Ndarja e informacionit të lidhur me zërin nga sinjali i përgjithshëm optik u krye në disa faza, duke përfshirë filtrim band-stop, normalizimi, reduktimi i zhurmës dhe korrigjimi i amplitudës sipas frekuencës. Një skrip MATLAB u përgatit për të përpunuar sinjalin. Cilësia e restaurimit të zërit gjatë marrjes së parametrave nga një distancë prej 25 metrash doli të jetë e mjaftueshme për njohjen e të folurit përmes Google Cloud Speech API dhe përcaktimin e një kompozimi muzikor përmes shërbimeve Shazam dhe SoundHound.

Në eksperiment, zëri u riprodhua në dhomë në volumin maksimal për altoparlantët e disponueshëm, d.m.th. tingulli ishte dukshëm më i lartë se fjalimi normal. Llamba LED gjithashtu nuk u zgjodh rastësisht, por si ofrues i raportit më të lartë të sinjalit ndaj zhurmës (6.3 herë më i lartë se një llambë inkandeshente dhe 70 herë më e lartë se një llambë fluoreshente). Studiuesit shpjeguan se diapazoni i sulmit dhe ndjeshmëria mund të rritet duke përdorur një teleskop më të madh, një sensor me cilësi të lartë dhe një konvertues analog në dixhital 24 ose 32-bit (ADC); eksperimenti u krye duke përdorur një teleskop të dobishëm. një sensor i lirë dhe një ADC 16-bit. .

Teknika për rikrijimin e të folurit përmes analizës së dridhjeve të një llambë në një llambë varëse

Ndryshe nga metoda e propozuar më parë "mikrofon vizual“, i cili kap dhe analizon objektet vibruese në një dhomë, si një gotë me ujë ose një paketë çipi, Lamphone bën të mundur organizimin e dëgjimit në kohë reale, ndërsa një mikrofon vizual për të rindërtuar disa sekonda të folur kërkon llogaritje intensive që kërkojnë orë . Ndryshe nga metodat e bazuara në përdorimin folësit ose Hard disk si mikrofon, Lamphone mundëson kryerjen e një sulmi nga distanca, pa pasur nevojë të ekzekutohet malware në pajisjet në ambiente. Ndryshe nga sulmet duke përdorur lazer, Lamponi nuk kërkon ndriçim të objektit vibrues dhe mund të prodhohet në modalitetin pasiv.

Burimi: opennet.ru

Shto një koment