並非先聽見聲音後理解語義 大腦語音處理可“多線程”工作

副標題:

來源:科技日報 | 2021-09-09 10:22:57
科技日報 | 2021-09-09 10:22:57
原標題:
正在加載

小電極陣列收集聽覺皮層神經信號的方式,通俗來講就是通過電極直接捕獲皮層表面的神經信號,由於外側顳上回暴露在外側顳葉,因此可通過皮層腦電圖記錄方法獲取。

——倪廣健 天津大學醫學部副主任、智慧醫學工程教育部工程研究中心副主任

大腦是如何聽懂語言的?幾十年來,科學家們一直認為聽覺皮層中的語音處理就像工廠的流水線一樣,按照先後不同處理工序串聯在一起,最終轉化成有意義的單詞。

然而這一理論近日遭到了挑戰,一項發表在《細胞》雜誌上的研究結果表明,大腦對聽覺和語言的處理是並行進行的。

這種語音處理的並行性質推翻了長期以來的相關假設,可能會為醫生提供新的思路,以治療患有閱讀障礙等問題的兒童,幫助他們順利識別語音。

傳統假設中大腦如何“聽懂”語言

“人腦在聽覺環境中處理語音信息時,傳統理論認為聽覺皮質處理信息的過程是自上而下的。當含有語意的聲音傳到耳中,耳蝸將其轉換成電信號,在初級聽覺皮層分析聲譜,在次級聽覺區域提取音素,在外側和腹側顳葉皮層提取單詞,頂葉和額葉區域基於語法和語義屬性並結合時間信息,進行單詞順序推斷並最終理解句子的含義。”天津大學醫學部副主任、智慧醫學工程教育部工程研究中心副主任倪廣健介紹。

“語音感知的經典層次模型是假設聲音信息首先在初級聽覺皮層接收,然後通過與外側顳上回連接轉化為更複雜的表徵。”倪廣健説,這是因為先前有關聽覺機制的研究主要基於解剖模型,認為大腦遵循一種從初級到高級的層次漸進處理模式,高級聽覺區域對複雜的語音和音樂有更強的反應。

一直以來,這一理論缺乏直接證據的支持,因為它需要整個聽覺皮層在極高時空分辨率的條件下記錄詳細的神經生理學信息。但是初級聽覺皮層位於大腦額葉和顳葉的深處,因此想進行探究並不容易。

此次最新研究對人類初級和次級聽覺皮層功能組織的研究結論與先前一致,但在赫氏回和顳上回的起始區發現了早期獨立處理的證據,而非傳統認為的遵循語音簡單串行的皮層處理層次。可以確定的是,皮層前部和中部顳上回,具有明顯的並行處理和潛在的長潛伏期串行處理,説明聽覺皮層具有分佈式的專業處理單元,每個單元代表了語音信號中不同的聲學和語音線索,它們的組合創造了豐富的語音理解體驗。

非侵入技術探究大腦受限於時空分辨率

目前,已有一些較為成熟的非侵入式技術用於研究大腦處理聽覺信息,例如具有較高空間分辨率的近紅外光譜NRIS、功能性核磁共振成像fMRI、腦磁圖MEG等,以及具有較高時間分辨率的腦電EEG等。

倪廣健舉例説,比如近紅外光譜通過測量血氧含量表徵聽覺皮層的代謝狀況,就可以有效反映外界刺激下聽覺皮層的變化情況,具有噪聲低、抗環境干擾性強、成本相對較低、安全便攜、易於使用等優點。

功能性核磁共振成像可探索大腦處理聽覺信息的過程,通過核磁共振造影來測量神經元活動所引發的血液動力的改變,實現對特定大腦活動皮層區域進行定位,具有準確定位某些區域或某些疾病發病區域(如癲癇的病灶)的優勢,在腦神經科學領域應用相對較為廣泛。

“在靜息狀態下腦部自發的低頻活動的同步化現象廣泛存在於聽覺系統內,因此功能性核磁共振成像能夠提供人類聽覺皮層不同功能和解剖區域如何相互作用的更完整的圖像,適合用於研究不同腦區之間的功能連接性。”倪廣健説。

另一方面,具有高時間分辨率的腦電技術因為與人工耳蝸的兼容性也使得腦電逐漸展現了臨床聽覺客觀評估研究的能力和潛力,使得大規模探索臨床人工耳蝸患者聽覺處理模式成為可能。

然而,上述非侵入式技術在空間分辨率和時間分辨率上往往無法兼具。倪廣健表示,單獨採用某一種非侵入性技術探索聽覺信息的處理過程時,會受限于有限的時間—空間分辨率,無法更好地探究局部異質神經元間的映射結果,因此無法具體回答語音表徵問題。《細胞》雜誌發表的新研究通過植入小電極陣列,創新性地突破了這一局限。

植入電極可繪製聽覺區域特徵編碼圖

在此次發表的新研究中,小電極陣列被放置在受研究者的整個聽覺皮層中收集神經信號。有9名患者參與了實驗。因為需要切除腦部腫瘤或定位引發癲癇的病灶,這些患者接受了神經外科手術。與此同時,他們同意讓醫生在手術過程中將微電極陣列放置在他們的聽覺皮層,收集神經信號,用於分析語言功能和定位癲癇,以及研究聽覺皮層如何處理語音信息。

“小電極陣列收集聽覺皮層神經信號的方式,通俗來講就是通過電極直接捕獲皮層表面的神經信號,由於外側顳上回暴露在外側顳葉,因此可通過皮層腦電圖記錄方法獲取。”倪廣健認為,植入式電極克服了以往採用功能性核磁共振成像技術研究時不能很好探明腹側溝回等腦溝的問題。

在這個新研究中,皮層腦電圖的高時間分辨率,能夠探測赫氏回上的初級聽覺皮層到顳上回的層次結構與聽語音和音調數據的一致程度。

“其從左顳平面的636個電極部位和顳上回獲取顱內記錄,與以前的顱內手術方法是不同的。”倪廣健解釋,以前的顱內手術方法每次僅從這些區域中的一個區域進行零碎取樣,而此顯微手術進入外側裂可同時記錄人類聽覺皮層所有區域對語音的高度異質性反應。

此外,該工作採用的高密度電極網格使得同時記錄人類顳葉聽覺皮層多個亞區的神經活動成為可能,因此能夠確定聽覺信息處理的流程,以及發現語音信號中的線索是如何跨聽覺皮層進行映射的。

“這種分析需要對自然語音和實驗控制的簡單聲音刺激的神經反應進行採樣,同時對所有皮層聽覺區域進行採樣,在初級和高階聽覺區域繪製一張全面的特徵編碼圖,從而能夠對信息流模型和皮層表徵轉換進行有意義的評估。”倪廣健説。

在這項研究中,當為參與者播放短語和句子時,位於顳上回中的某些區域的反應速度與初級聽覺皮層一樣快,這表明這兩個區域同時開始處理聲學信息。

倪廣健介紹,該工作還進一步評估了每個區域在語音處理中的作用,探索激活的時間和順序,每個區域中簡單和複雜聲音表徵的性質,以及它們在功能性和外科消融的語音理解中的因果作用。

“植入電極的方式在大腦的其他研究領域中已有不少成功典範,例如腦控打字,準確率已達到90%以上;基於皮層腦電的語音重構,句子的整體準確率已達到60%;腦控機器人,解碼運動狀態實現機械臂的控制等等。”倪廣健表示,植入電極有助於採集到高質量的神經電活動,具有較高的時空分辨率,比較適合機制機理方向的研究,從而探明腦部或者神經性系統疾病的成因及提供治療手段。而非侵入式技術則由於其無創的特點,具有更加廣泛的應用場景。

編輯:朱書青 責任編輯:
點擊收起全文
掃一掃 分享到微信
|
熱點推薦
正在閱讀:並非先聽見聲音後理解語義 大腦語音處理可“多線程”工作
掃一掃 分享到微信
手機看
掃一掃 手機繼續看
A- A+