Səsin lokalizasiyası: beyin səs mənbələrini necə tanıyır

Səsin lokalizasiyası: beyin səs mənbələrini necə tanıyır

Ətrafımızdakı dünya beynimizin davamlı olaraq emal etdiyi hər cür məlumatla doludur. O, bu məlumatı hər biri öz siqnal payına cavabdeh olan hiss orqanları vasitəsilə qəbul edir: gözlər (görmə), dil (dad), burun (qoxu), dəri (toxunma), vestibulyar aparatlar (balans, kosmosda mövqe və hissiyyat hissi). çəki) və qulaqlar (səs). Bütün bu orqanlardan gələn siqnalları birləşdirərək, beynimiz ətrafımız haqqında dəqiq təsəvvür yarada bilər. Ancaq xarici siqnalların işlənməsinin bütün aspektləri bizə məlum deyil. Bu sirlərdən biri də səslərin mənbəyinin lokallaşdırılması mexanizmidir.

Nitq və Eşitmə Neyromühəndisliyi Laboratoriyasının (Nyu Cersi Texnologiya İnstitutu) alimləri səsin lokalizasiyasının sinir prosesinin yeni modelini təklif ediblər. Səsin qəbulu zamanı beyində dəqiq hansı proseslər baş verir, beynimiz səs mənbəyinin mövqeyini necə anlayır və bu araşdırma eşitmə qüsurları ilə mübarizədə necə kömək edə bilər. Bu barədə araşdırma qrupunun hesabatından öyrənirik. Get.

Tədqiqat bazası

Beynimizin hiss orqanlarımızdan aldığı məlumat həm mənbəyi, həm də işlənməsi baxımından bir-birindən fərqlənir. Bəzi siqnallar dərhal beynimizə dəqiq məlumat kimi görünür, bəziləri isə əlavə hesablama prosesləri tələb edir. Kobud desək, bir toxunuşu dərhal hiss edirik, amma bir səs eşitdikdə hələ də onun haradan gəldiyini tapmalıyıq.

Səsləri üfüqi müstəvidə lokallaşdırmaq üçün əsasdır interaural* vaxt fərqi (ITD-dən interaural vaxt fərqi) dinləyicinin qulağına çatan səslər.

İnterasual baza* - qulaqlar arasındakı məsafə.

Beyində bu prosesdən məsul olan xüsusi bir sahə (medial superior zeytun və ya MSO) var. MVO-da səs siqnalı qəbul edildiyi anda, interaural vaxt fərqləri neyronların reaksiya sürətinə çevrilir. ITD funksiyası kimi MBO çıxış sürət əyrilərinin forması hər bir qulaq üçün giriş siqnallarının çarpaz korrelyasiya funksiyasının formasına bənzəyir.

MBO-da məlumatın necə işləndiyi və şərh edildiyi tam aydın deyil, buna görə də bir neçə çox ziddiyyətli nəzəriyyələr mövcuddur. Səs lokalizasiyasının ən məşhur və əslində klassik nəzəriyyəsi Jeffress modelidir (Lloyd A. Jeffress). əsaslanır işarələnmiş xətt* detektor neyronları, hər bir qulaqdan gələn sinir girişlərinin binaural sinxronizasiyasına həssasdır, hər bir neyron müəyyən miqdarda ITD-yə maksimum dərəcədə həssasdır (1A).

İşarələnmiş xətt prinsipi* öz aksonları boyunca impulsların ötürülməsində eyni fizioloji prinsiplərdən istifadə edən müxtəlif sinirlərin necə fərqli hisslər yarada bildiyini izah edən fərziyyədir. Struktur olaraq oxşar sinirlər, mərkəzi sinir sistemindəki oxşar sinir siqnallarını müxtəlif yollarla deşifrə etməyə qadir olan unikal neyronlara qoşulduqları təqdirdə fərqli duyğu qavrayışları yarada bilər.

Səsin lokalizasiyası: beyin səs mənbələrini necə tanıyır
Şəkil №1

Bu model hesablama baxımından hər iki qulağa çatan səslərin qeyri-məhdud çarpaz korrelyasiyasına əsaslanan neyron kodlaşdırmaya bənzəyir.

Səsin lokalizasiyasının beynin müxtəlif yarımkürələrindən olan neyronların müəyyən populyasiyalarının reaksiya sürətindəki fərqlərə əsaslanaraq modelləşdirilə biləcəyini təklif edən bir model də var, yəni. interhemisferik asimmetriya modeli (1V).

İndiyə qədər iki nəzəriyyədən (modellərdən) hansının doğru olduğunu birmənalı şəkildə söyləmək çətin idi, çünki onların hər biri səsin intensivliyindən səs lokalizasiyasının müxtəlif asılılıqlarını proqnozlaşdırır.

Bu gün nəzərdən keçirdiyimiz araşdırmada tədqiqatçılar səslərin qavranılmasının sinir kodlaşdırmasına və ya fərdi sinir populyasiyalarının reaksiyasındakı fərqlərə əsaslandığını anlamaq üçün hər iki modeli birləşdirməyə qərar verdilər. 18-27 yaş arası insanların (5 qadın və 7 kişi) iştirak etdiyi bir neçə təcrübə aparılıb. İştirakçıların audiometriyası (eşitmə kəskinliyinin ölçülməsi) 25 və 250 Hz arasında 8000 dB və ya daha yüksək idi. Təcrübələrdə iştirak edən şəxs yüksək dəqiqliklə kalibrlənmiş xüsusi avadanlıqların yerləşdiyi səs izolyasiyalı otağa yerləşdirilib. İştirakçılar səs siqnalını eşitdikdən sonra onun gəldiyi istiqaməti göstərməli idilər.

Tədqiqatın nəticələri

Asılılığı qiymətləndirmək üçün lateralizasiya* etiketli neyronlara cavab olaraq səs intensivliyindən beyin fəaliyyəti, bayquş beyninin laminar nüvəsindəki neyronların reaksiya sürəti haqqında məlumatlar istifadə edilmişdir.

Yanallıq* - bədənin sol və sağ yarısının asimmetriyası.

Beyin fəaliyyətinin lateralizasiyasının müəyyən neyron populyasiyalarının reaksiya sürətindən asılılığını qiymətləndirmək üçün rhesus meymun beyninin aşağı kollikulusunun fəaliyyətindən alınan məlumatlar istifadə edilmişdir, bundan sonra müxtəlif yarımkürələrdən olan neyronların sürətindəki fərqlər əlavə olaraq hesablanmışdır. .

Detektor neyronlarının işarələnmiş xətt modeli, səsin intensivliyi azaldıqca, qəbul edilən mənbənin yanallığının yumşaq və yüksək səslərin nisbətinə bənzər orta dəyərlərə yaxınlaşacağını proqnozlaşdırır (1S).

Yarımferik asimmetriya modeli, öz növbəsində, səsin intensivliyi eşik səviyyəsinə yaxınlaşdıqca, qəbul edilən yanallığın orta xəttə doğru dəyişəcəyini göstərir (1D).

Daha yüksək ümumi səs intensivliyində lateralizasiyanın intensivliyin dəyişməz olacağı gözlənilir 1S и 1D).

Buna görə də, səs intensivliyinin səsin qəbul edilən istiqamətinə necə təsir etdiyini təhlil etmək bizə həmin anda baş verən proseslərin - eyni ümumi ərazidən olan neyronların və ya müxtəlif yarımkürələrin neyronlarının xarakterini dəqiq müəyyən etməyə imkan verir.

Aydındır ki, insanın ITD-ni ayırd etmək qabiliyyəti səsin intensivliyindən asılı olaraq dəyişə bilər. Bununla belə, alimlər deyirlər ki, həssaslığı ITD ilə əlaqələndirən əvvəlki tapıntıları və dinləyicilərin səsin intensivliyi funksiyası kimi səs mənbəyinin istiqamətinə dair mühakimələrini şərh etmək çətindir. Bəzi tədqiqatlar deyir ki, səsin intensivliyi sərhəd həddinə çatdıqda mənbənin qəbul edilən yanallığı azalır. Digər tədqiqatlar göstərir ki, intensivliyin qavrayışa heç bir təsiri yoxdur.

Başqa sözlə, elm adamları ədəbiyyatda ITD, səs intensivliyi və onun mənbəyinin istiqamətinin müəyyən edilməsi arasında əlaqə ilə bağlı çox az məlumat olduğuna "yumşaq" işarə edirlər. Elmi ictimaiyyət tərəfindən ümumiyyətlə qəbul edilən bir növ aksioma kimi mövcud olan nəzəriyyələr var. Buna görə də, eşitmə qavrayışının bütün nəzəriyyələrini, modellərini və mümkün mexanizmlərini praktikada ətraflı şəkildə sınaqdan keçirmək qərara alındı.

İlk təcrübə on normal eşitmə iştirakçılarından ibarət bir qrupda səs intensivliyinin bir funksiyası olaraq ITD əsaslı lateralizasiyanın öyrənilməsinə imkan verən psixofiziki paradiqmaya əsaslanırdı.

Səsin lokalizasiyası: beyin səs mənbələrini necə tanıyır
Şəkil №2

Səs mənbələri insanların ITD-ni tanıya bildiyi tezlik diapazonunun əksəriyyətini əhatə etmək üçün xüsusi olaraq tənzimlənmişdir, yəni. 300 ilə 1200 Hz arasında (2A).

Hər sınaqda dinləyici 375-dən 375 ms-ə qədər ITD dəyərləri aralığında sensasiya səviyyəsinin funksiyası kimi ölçülən qavranılan yanallığı göstərməli idi. Səs intensivliyinin təsirini müəyyən etmək üçün həm sabit, həm də təsadüfi səs intensivliyini özündə birləşdirən qeyri-xətti qarışıq effektlər modeli (NMLE) istifadə edilmişdir.

Cədvəl 2V təmsilçi dinləyici üçün iki səs intensivliyində spektral düz səs-küylə təxmin edilən yanallaşmanı nümayiş etdirir. Və cədvəl 2S bütün dinləyicilərin xam məlumatlarını (dairələrini) və quraşdırılmış NMLE modelini (sətirlərini) göstərir.

Səsin lokalizasiyası: beyin səs mənbələrini necə tanıyır
Cədvəl №1

Yuxarıdakı cədvəl bütün NLME parametrlərini göstərir. Alimlərin gözlədiyi kimi, qəbul edilən yanallığın artan ITD ilə artdığını görmək olar. Səs intensivliyi azaldıqca qavrayış getdikcə orta xəttə doğru dəyişdi (qrafikdə daxil edilmiş 2C).

Bu tendensiyalar interhemisferik fərqlər modelini dəstəkləyən ITD və səs intensivliyinin maksimum yanlıq dərəcəsinə əhəmiyyətli təsirlərini göstərən NLME modeli tərəfindən dəstəkləndi.

Bundan əlavə, təmiz tonlar üçün orta audiometrik həddlər qəbul edilən yanallığa az təsir göstərmişdir. Lakin səs intensivliyi psixometrik funksiyaların göstəricilərinə əhəmiyyətli dərəcədə təsir göstərməmişdir.

İkinci təcrübənin əsas məqsədi qıcıqlandırıcıların (səslərin) spektral xüsusiyyətləri nəzərə alınmaqla əvvəlki təcrübədə alınan nəticələrin necə dəyişəcəyini müəyyən etmək idi. Aşağı səs intensivliyində spektral düz səs-küyün yoxlanılması zərurəti ondan ibarətdir ki, spektrin hissələri eşidilməyə bilər və bu, səs istiqamətinin müəyyən edilməsinə təsir göstərə bilər. Nəticə etibarı ilə, birinci təcrübənin nəticələri, səsin intensivliyinin azalması ilə spektrin eşidilən hissəsinin eninin azala biləcəyi ilə səhvən səhv edilə bilər.

Buna görə də, əksinə, başqa bir təcrübə aparmaq qərarına gəldi A-çəkili* səs-küy

A-çəki* insan qulağının qəbul etdiyi nisbi yüksəkliyi nəzərə almaq üçün səs səviyyələrinə tətbiq edilir, çünki qulaq aşağı səs tezliklərinə daha az həssasdır. A-çəki dB-də ölçülmüş səs təzyiqi səviyyələrinə oktava diapazonlarında sadalanan dəyərlər cədvəlini arifmetik olaraq əlavə etməklə həyata keçirilir.

Qrafikdə 2D eksperimentin bütün iştirakçılarının xam məlumatlarını (dairələrini) və NMLE modelinə uyğun məlumatlarını (sətirlərini) göstərir.

Məlumatların təhlili göstərdi ki, səsin bütün hissələri təxminən bərabər eşidildikdə (həm birinci, həm də ikinci sınaqda), qəbul edilən yanallıq və ITD ilə yanallığın dəyişməsini izah edən qrafikdəki yamac səs intensivliyinin azalması ilə azalır.

Beləliklə, ikinci təcrübənin nəticələri birincinin nəticələrini təsdiqlədi. Yəni praktikada hələ 1948-ci ildə Ceffressin təklif etdiyi modelin düzgün olmadığı göstərilib.

Belə çıxır ki, səsin intensivliyi azaldıqca səsin lokalizasiyası pisləşir və Jeffress səslərin intensivliyindən asılı olmayaraq insanlar tərəfindən eyni şəkildə qəbul edildiyinə və işləndiyinə inanırdı.

Tədqiqatın nüansları ilə daha ətraflı tanış olmaq üçün baxmağı məsləhət görürəm alimlər hesabat verir.

Epiloq

Nəzəri fərziyyələr və onları təsdiqləyən praktiki təcrübələr göstərdi ki, məməlilərdə beyin neyronları səs siqnalının istiqamətindən asılı olaraq müxtəlif sürətlə aktivləşir. Beyin daha sonra səs mühitinin xəritəsini dinamik şəkildə qurmaq üçün prosesdə iştirak edən bütün neyronlar arasında bu sürətləri müqayisə edir.

Jeffressonun modeli əslində 100% səhv deyil, çünki o, bayquşlarda səs mənbəyinin lokalizasiyasını mükəmməl şəkildə təsvir etmək üçün istifadə edilə bilər. Bəli, bayquşlar üçün səsin intensivliyi əhəmiyyət kəsb etmir, hər halda onun mənbəyinin mövqeyini təyin edəcəklər. Lakin əvvəlki təcrübələr göstərdiyi kimi, bu model rhesus meymunları ilə işləmir. Buna görə də bu Jeffresson modeli bütün canlılar üçün səslərin lokalizasiyasını təsvir edə bilməz.

İnsan iştirakçıları ilə aparılan təcrübələr bir daha təsdiqlədi ki, səs lokalizasiyası müxtəlif orqanizmlərdə fərqli şəkildə baş verir. İştirakçıların çoxu səslərin aşağı intensivliyi səbəbindən səs siqnallarının mənbəyinin mövqeyini düzgün müəyyən edə bilməyiblər.

Alimlər hesab edirlər ki, onların işləri gördüyümüz və eşitdiyimiz arasında müəyyən oxşarlıqlar göstərir. Hər iki proses beynin müxtəlif hissələrində neyronların sürəti ilə, eləcə də bu fərqin qiymətləndirilməsi ilə həm kosmosda gördüyümüz cisimlərin mövqeyini, həm də eşitdiyimiz səs mənbəyinin mövqeyini təyin etməklə əlaqələndirilir.

Gələcəkdə tədqiqatçılar insanın eşitmə və görmə qabiliyyəti arasındakı əlaqəni daha ətraflı araşdırmaq üçün bir sıra eksperimentlər keçirəcəklər ki, bu da bizə beynimizin ətrafımızdakı dünyanın xəritəsini dinamik şəkildə necə dəqiq qurduğunu daha yaxşı anlamağa imkan verəcək.

Diqqətiniz üçün təşəkkür edirik, maraqlanın və hər kəsə xoş həftə keçirin! 🙂

Bizimlə qaldığınız üçün təşəkkür edirik. Məqalələrimiz xoşunuza gəlirmi? Daha maraqlı məzmun görmək istəyirsiniz? Sifariş verməklə və ya dostlarınıza tövsiyə etməklə bizə dəstək olun, developers üçün bulud VPS 4.99 dollardan, Bizim tərəfimizdən sizin üçün ixtira edilmiş giriş səviyyəli serverlərin unikal analoquna Habr istifadəçiləri üçün 30% endirim: VPS (KVM) E5-2650 v4 (6 nüvəli) 10GB DDR4 240GB SSD 1Gbps haqqında 20 dollardan bütün həqiqət və ya serveri necə paylaşmaq olar? (RAID1 və RAID10, 24 nüvəyə qədər və 40 GB DDR4 ilə mövcuddur).

Dell R730xd 2 dəfə ucuzdur? Yalnız burada 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV 199$-dan başlayan qiymətlərlə Hollandiyada! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - 99 dollardan! haqqında oxuyun İnfrastruktur korporasiyasını necə qurmaq olar. bir qəpik üçün 730 avro dəyərində Dell R5xd E2650-4 v9000 serverlərinin istifadəsi ilə sinif?

Mənbə: www.habr.com

Добавить комментарий