Lokalisasi suara: bagaimana otak mengenali sumber suara

Lokalisasi suara: bagaimana otak mengenali sumber suara

Dunia di sekitar kita dipenuhi dengan segala macam informasi yang terus diproses oleh otak kita. Ia menerima informasi ini melalui organ indera, yang masing-masing bertanggung jawab atas bagian sinyalnya: mata (penglihatan), lidah (rasa), hidung (penciuman), kulit (sentuhan), alat vestibular (keseimbangan, posisi dalam ruang dan indra). berat) dan telinga (suara). Dengan menggabungkan sinyal dari semua organ ini, otak kita dapat membangun gambaran akurat tentang lingkungan kita. Namun tidak semua aspek pemrosesan sinyal eksternal diketahui oleh kita. Salah satu rahasianya adalah mekanisme lokalisasi sumber suara.

Para ilmuwan dari Laboratory of Neuroengineering of Speech and Hearing (New Jersey Institute of Technology) telah mengusulkan model baru dari proses saraf lokalisasi suara. Proses persis apa yang terjadi di otak selama persepsi suara, bagaimana otak kita memahami posisi sumber suara, dan bagaimana penelitian ini dapat membantu memerangi gangguan pendengaran. Kami mempelajari hal ini dari laporan kelompok riset. Pergi.

Dasar penelitian

Informasi yang diterima otak kita dari indera kita berbeda satu sama lain, baik dari segi sumbernya maupun cara pengolahannya. Beberapa sinyal langsung muncul di otak kita sebagai informasi yang akurat, sementara sinyal lainnya memerlukan proses komputasi tambahan. Kasarnya kita langsung merasakan suatu sentuhan, namun ketika kita mendengar suatu suara, kita tetap harus mencari dari mana asalnya.

Dasar untuk melokalisasi suara pada bidang horizontal adalah antar-ural* perbedaan waktu (ITD dari perbedaan waktu antar-ural) terdengar sampai ke telinga pendengar.

Basis antar-aural* - jarak antar telinga.

Ada area tertentu di otak (medial superior olive atau MSO) yang bertanggung jawab untuk proses ini. Pada saat sinyal suara diterima di MVO, perbedaan waktu antar-ural diubah menjadi laju reaksi neuron. Bentuk kurva kecepatan keluaran MBO sebagai fungsi ITD menyerupai bentuk fungsi korelasi silang sinyal masukan masing-masing telinga.

Bagaimana informasi diproses dan ditafsirkan dalam MBO masih belum sepenuhnya jelas, itulah sebabnya terdapat beberapa teori yang sangat kontradiktif. Teori lokalisasi suara yang paling terkenal dan klasik adalah model Jeffress (Lloyd A. Jeffress). Hal ini didasarkan pada garis yang ditandai* neuron pendeteksi yang sensitif terhadap sinkronisasi binaural input saraf dari masing-masing telinga, dengan setiap neuron sensitif secara maksimal terhadap sejumlah ITD tertentu (1А).

Prinsip garis bertanda* adalah hipotesis yang menjelaskan bagaimana saraf yang berbeda, yang semuanya menggunakan prinsip fisiologis yang sama dalam mentransmisikan impuls di sepanjang aksonnya, mampu menghasilkan sensasi yang berbeda. Saraf yang serupa secara struktural dapat menghasilkan persepsi sensorik yang berbeda jika saraf tersebut terhubung ke neuron unik di sistem saraf pusat yang mampu memecahkan kode sinyal saraf serupa dengan cara berbeda.

Lokalisasi suara: bagaimana otak mengenali sumber suara
Gambar #1

Model ini secara komputasi mirip dengan pengkodean saraf, berdasarkan korelasi silang tak terbatas dari suara yang mencapai kedua telinga.

Ada juga model yang menyarankan bahwa lokalisasi suara dapat dimodelkan berdasarkan perbedaan kecepatan respons populasi neuron tertentu dari belahan otak yang berbeda, yaitu. model asimetri interhemispheric (1V).

Hingga saat ini, sulit untuk menyatakan secara pasti mana di antara kedua teori (model) tersebut yang benar, mengingat masing-masing teori tersebut memprediksi ketergantungan lokalisasi suara yang berbeda terhadap intensitas suara.

Dalam studi yang kami lihat hari ini, para peneliti memutuskan untuk menggabungkan kedua model untuk memahami apakah persepsi suara didasarkan pada kode saraf atau berdasarkan perbedaan respons populasi saraf individu. Beberapa percobaan dilakukan yang melibatkan orang-orang berusia 18 hingga 27 tahun (5 perempuan dan 7 laki-laki). Audiometri peserta (pengukuran ketajaman pendengaran) adalah 25 dB atau lebih tinggi antara 250 dan 8000 Hz. Peserta percobaan ditempatkan di ruangan kedap suara, di mana peralatan khusus ditempatkan, dikalibrasi dengan akurasi tinggi. Peserta harus, setelah mendengar sinyal suara, menunjukkan arah datangnya.

Hasil penelitian

Untuk menilai ketergantungan lateralisasi* aktivitas otak dari intensitas suara sebagai respons terhadap neuron berlabel, data kecepatan reaksi neuron di inti laminar otak burung hantu digunakan.

Lateralitas* - asimetri bagian tubuh kiri dan kanan.

Untuk menilai ketergantungan lateralisasi aktivitas otak pada kecepatan reaksi populasi neuron tertentu, data dari aktivitas kolikulus inferior otak monyet rhesus digunakan, setelah itu perbedaan kecepatan neuron dari belahan otak yang berbeda juga dihitung. .

Model garis yang ditandai dari neuron detektor memperkirakan bahwa ketika intensitas suara menurun, lateralitas sumber yang dirasakan akan menyatu ke nilai rata-rata yang serupa dengan rasio suara lembut dan keras (1S).

Model asimetri hemispheric, pada gilirannya, menunjukkan bahwa ketika intensitas suara menurun mendekati tingkat ambang batas, lateralitas yang dirasakan akan bergeser ke arah garis tengah (1D).

Pada intensitas suara keseluruhan yang lebih tinggi, lateralisasi diharapkan menjadi invarian intensitas (insets in 1S ΠΈ 1D).

Oleh karena itu, menganalisis bagaimana intensitas suara mempengaruhi arah suara yang dirasakan memungkinkan kita untuk secara akurat menentukan sifat proses yang terjadi pada saat itu - neuron dari area umum yang sama atau neuron dari belahan bumi yang berbeda.

Jelasnya, kemampuan seseorang untuk membedakan ITD dapat bervariasi tergantung pada intensitas suara. Namun, para ilmuwan mengatakan sulit untuk menafsirkan temuan sebelumnya yang menghubungkan sensitivitas terhadap ITD dan penilaian pendengar terhadap arah sumber suara sebagai fungsi dari intensitas suara. Beberapa penelitian mengatakan bahwa ketika intensitas suara mencapai ambang batas, lateralitas yang dirasakan dari sumbernya menurun. Penelitian lain menunjukkan bahwa tidak ada pengaruh intensitas terhadap persepsi sama sekali.

Dengan kata lain, para ilmuwan β€œdengan lembut” mengisyaratkan bahwa hanya ada sedikit informasi dalam literatur mengenai hubungan antara ITD, intensitas suara, dan penentuan arah sumbernya. Ada teori-teori yang ada sebagai semacam aksioma, yang diterima secara umum oleh komunitas ilmiah. Oleh karena itu, diputuskan untuk menguji secara rinci semua teori, model dan kemungkinan mekanisme persepsi pendengaran dalam praktiknya.

Eksperimen pertama didasarkan pada paradigma psikofisik yang memungkinkan studi tentang lateralisasi berbasis ITD sebagai fungsi intensitas suara dalam kelompok yang terdiri dari sepuluh peserta dengan pendengaran normal.

Lokalisasi suara: bagaimana otak mengenali sumber suara
Gambar #2

Sumber suara secara khusus disetel untuk mencakup sebagian besar rentang frekuensi di mana manusia dapat mendeteksi ITD, yaitu. dari 300 hingga 1200 Hz (2А).

Pada setiap percobaan, pendengar harus menunjukkan lateralitas yang dirasakan, diukur sebagai fungsi tingkat sensasi, pada rentang nilai ITD dari 375 hingga 375 ms. Untuk menentukan pengaruh intensitas suara, digunakan model efek campuran nonlinier (NMLE) yang mencakup intensitas suara tetap dan acak.

Grafik. 2V menunjukkan perkiraan lateralisasi dengan derau datar secara spektral pada dua intensitas suara untuk perwakilan pendengar. Dan jadwalnya 2S menunjukkan data mentah (lingkaran) dan model NMLE yang dipasang (garis) dari semua pendengar.

Lokalisasi suara: bagaimana otak mengenali sumber suara
Tabel 1

Tabel di atas menunjukkan semua parameter NLME. Dapat dilihat bahwa persepsi lateralitas meningkat seiring dengan meningkatnya ITD, seperti yang diperkirakan para ilmuwan. Ketika intensitas suara menurun, persepsi semakin bergeser ke arah garis tengah (dimasukkan ke dalam grafik 2C).

Tren ini didukung oleh model NLME, yang menunjukkan pengaruh ITD dan intensitas suara yang signifikan terhadap derajat lateralitas maksimum, yang mendukung model perbedaan interhemispheric.

Selain itu, rata-rata ambang audiometri untuk nada murni mempunyai pengaruh yang kecil terhadap lateralitas yang dirasakan. Namun intensitas bunyi tidak berpengaruh nyata terhadap indikator fungsi psikometrik.

Tujuan utama percobaan kedua adalah untuk menentukan bagaimana hasil yang diperoleh pada percobaan sebelumnya akan berubah jika fitur spektral rangsangan (suara) diperhitungkan. Kebutuhan untuk menguji kebisingan datar secara spektral pada intensitas suara rendah adalah bahwa bagian dari spektrum mungkin tidak terdengar dan hal ini dapat mempengaruhi penentuan arah suara. Oleh karena itu, hasil percobaan pertama dapat disalahartikan sebagai fakta bahwa lebar bagian spektrum yang dapat didengar dapat berkurang seiring dengan menurunnya intensitas suara.

Oleh karena itu, diputuskan untuk melakukan percobaan lain, tetapi menggunakan kebalikannya berbobot A* kebisingan

A-penimbangan* diterapkan pada tingkat suara untuk memperhitungkan kenyaringan relatif yang dirasakan oleh telinga manusia, karena telinga kurang sensitif terhadap frekuensi suara rendah. Pembobotan A diterapkan dengan menambahkan tabel nilai yang tercantum dalam pita oktaf secara aritmatika ke tingkat tekanan suara yang diukur dalam dB.

Di grafik 2D menunjukkan data mentah (lingkaran) dan data yang disesuaikan dengan model NMLE (garis) dari semua peserta eksperimen.

Analisis data menunjukkan bahwa ketika semua bagian suara terdengar kira-kira sama (baik pada percobaan pertama dan kedua), lateralitas yang dirasakan dan kemiringan grafik yang menjelaskan perubahan lateralitas dengan ITD menurun seiring dengan menurunnya intensitas suara.

Dengan demikian, hasil percobaan kedua membenarkan hasil percobaan pertama. Artinya, dalam praktiknya terbukti bahwa model yang dikemukakan Jeffress pada tahun 1948 tidaklah benar.

Ternyata lokalisasi suara memburuk seiring dengan menurunnya intensitas suara, dan Jeffress percaya bahwa suara dirasakan dan diproses oleh manusia dengan cara yang sama, terlepas dari intensitasnya.

Untuk kenalan yang lebih detail dengan nuansa penelitian, saya sarankan untuk melihatnya laporan para ilmuwan.

Bagian terakhir dr suatu karya sastra

Asumsi teoretis dan eksperimen praktis yang membenarkannya telah menunjukkan bahwa neuron otak pada mamalia diaktifkan pada kecepatan yang berbeda-beda bergantung pada arah sinyal suara. Otak kemudian membandingkan kecepatan ini antara semua neuron yang terlibat dalam proses tersebut untuk secara dinamis membangun peta lingkungan suara.

Model Jeffresson sebenarnya tidak 100% salah, karena model ini dapat digunakan untuk menggambarkan dengan sempurna lokalisasi sumber suara pada burung hantu gudang. Ya, bagi burung hantu, intensitas suara tidak menjadi masalah, bagaimanapun, mereka akan menentukan posisi sumbernya. Namun, model ini tidak dapat diterapkan pada monyet rhesus, seperti yang ditunjukkan oleh eksperimen sebelumnya. Oleh karena itu, model Jeffresson ini tidak dapat menggambarkan lokalisasi suara pada semua makhluk hidup.

Eksperimen dengan partisipan manusia sekali lagi menegaskan bahwa lokalisasi suara terjadi secara berbeda pada organisme yang berbeda. Banyak peserta yang tidak dapat menentukan dengan tepat posisi sumber sinyal suara karena rendahnya intensitas suara.

Para ilmuwan percaya bahwa penelitian mereka menunjukkan kesamaan tertentu antara cara kita melihat dan mendengar. Kedua proses tersebut berhubungan dengan kecepatan neuron di berbagai bagian otak, serta penilaian perbedaan ini untuk menentukan posisi benda yang kita lihat di ruang angkasa dan posisi sumber suara yang kita dengar.

Di masa depan, para peneliti akan melakukan serangkaian eksperimen untuk mengkaji lebih detail hubungan antara pendengaran dan penglihatan manusia, yang akan memungkinkan kita untuk lebih memahami bagaimana sebenarnya otak kita secara dinamis membangun peta dunia di sekitar kita.

Terima kasih atas perhatiannya, tetap penasaran dan semoga minggumu menyenangkan semuanya! πŸ™‚

Terima kasih untuk tetap bersama kami. Apakah Anda menyukai artikel kami? Ingin melihat konten yang lebih menarik? Dukung kami dengan melakukan pemesanan atau merekomendasikan kepada teman, cloud VPS untuk pengembang mulai $4.99, Diskon 30% untuk pengguna Habr pada analog unik dari server level awal, yang kami ciptakan untuk Anda: Seluruh kebenaran tentang VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps dari $20 atau bagaimana cara berbagi server? (tersedia dengan RAID1 dan RAID10, hingga 24 core dan hingga 40GB DDR4).

Dell R730xd 2 kali lebih murah? Hanya disini 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV dari $199 di Belanda! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - mulai $99! Membaca tentang Bagaimana membangun infrastruktur corp. kelas dengan penggunaan server Dell R730xd E5-2650 v4 senilai 9000 euro untuk satu sen?

Sumber: www.habr.com

Tambah komentar