科学者は脳内インプラントを使用して心の音声を再現することに成功した

自分の声で話す能力を失った人は、さまざまな音声合成装置を使用する傾向があります。 最新のテクノロジーは、単純なキーボード入力から一目でわかるテキスト入力や特殊なディスプレイに至るまで、この問題に対して多くの解決策を提供しています。 ただし、既存のソリューションはどれも非常に時間がかかり、患者の状態が重篤であればあるほど、入力にかかる時間が長くなります。 この問題は、脳に直接取り付けられた特別な電極インプラントの形で実装されるニューラル インターフェイスを使用することで間もなく解決される可能性があります。これにより、脳の活動を最大限の精度で読み取り、システムが音声に解釈できるようになります。私たちが理解できること。

科学者は脳内インプラントを使用して心の音声を再現することに成功した

カリフォルニア大学サンフランシスコ校の研究者らは、 ネイチャー誌の記事 25月XNUMX日、彼らはインプラントを使って人の心の音声をどのように音声化することができたかを説明した。 伝えられるところによると、音声はいくつかの場所で不正確でしたが、文章は完全に再現でき、そして最も重要なことに、外部のリスナーが理解できました。 これには、記録された脳信号の分析と比較に何年もかかりましたが、この技術はまだ実験室の外で使用する準備ができていません。 しかし、この実験は「脳だけを使って音声を解読し、再現できる」ことを示した、と脳と音声の科学者ゴパラ・アヌマンチパリは言う。

「新しい研究で説明された技術は、最終的に人々が自由に話す能力を回復することを約束します」とボストン大学の神経科学者フランク・ギュンサーは説明する。 「これらすべての人々にとって、これの重要性を誇張することはできません...自分のニーズを伝えられず、コミュニティと交流することができないのは信じられないほど孤立しており、悪夢です。」

すでに述べたように、何らかの方法で単語を入力することに依存する既存の音声ツールは退屈で、多くの場合、10 分あたり XNUMX 単語しか生成されません。 以前の研究で、科学者たちはすでに脳信号を使用して、母音や個々の単語などの音声の小さな塊を解読していましたが、新しい研究よりも語彙が限られていました。

アヌマンチパリ氏は、神経外科医のエドワード・チャン氏および生物工学者のジョシュ・チャーティエ氏とともに、てんかんの治療の一環として一時的に脳に電極グリッドを埋め込まれたXNUMX人の被験者を研究した。 これらの人々は自分で話すことができたので、研究者たちは被験者が文章を話すときの脳活動を記録することができました。 次に研究チームは、唇、舌、顎、喉頭を制御する脳信号と実際の声道の動きを相関させました。 これにより、科学者は各人に固有の仮想音声装置を作成することができました。

次に研究者らは、仮想ボイスボックスの動きを音に変換しました。 この方法を使用すると、「音声が改善され、より自然になりました」とシャルティエ氏は言います。 再構成された単語の約 70% は、合成音声を解釈するよう求められた聴取者にとって理解可能でした。 たとえば、被験者が「げっ歯類を遠ざけるために三毛猫を飼ってください」と言おうとすると、聞き手には「ウサギを遠ざけるために三毛猫がいる」と聞こえます。 全体的に、「シュ(シュ)」など、いくつかの音が良く聞こえました。 「ブッ」や「プッ」など、他の音はより柔らかく聞こえました。

このテクノロジーは、人が声道をどのように使用するかを知ることに依存しています。 しかし、多くの人は、脳卒中、声道の損傷、またはルー・ゲーリッグ病(スティーブン・ホーキング博士も患っていた)などの理由で原則として話すことができないため、この情報や脳の活動を単に得ることができません。

ジョンズ医科大学の神経科学者であり神経工学者でもあるマーク・スルツキー氏は、「これまでで最も大きなハードルは、デコーダを構築する音声のサンプルがない場合に、どうやってデコーダを構築するかということだ」と語る。 シカゴのノースウェスタン大学のファインバーグ氏。

しかし、いくつかのテストで研究者らは、仮想声道の動きを音に変換するために使用されたアルゴリズムが人によって類似していることを発見し、異なる人の間で再利用できる可能性があり、おそらくまったく話せない人でもアルゴリズムを再利用できることを発見しました。

しかし現時点では、発声装置の働きに応じた脳信号の活動の普遍的なマップを編集することは、発声装置が長い間活動していない人々がそれを使用するには十分に困難な作業のように見えます。



出所: 3dnews.ru

コメントを追加します