人與人交往中,說(shuō)話(huà)表達是最基本的能力和方式,可世界上有許多人因患有神經(jīng)疾病而喪失語(yǔ)言能力,目前迫切需要開(kāi)發(fā)出一些特定的通訊設備來(lái)幫助這些「有口難言」群體進(jìn)行溝通交流。發(fā)表在《Nature》雜志上的兩篇文章[1][2]表明,因嚴重癱瘓而無(wú)法說(shuō)話(huà)的人有可能通過(guò)植入式腦機接口(BCI)進(jìn)行交流溝通,通過(guò)BCI交流的速度遠高于其他交流方式。Willett等人開(kāi)發(fā)出一種使用電極穿透大腦皮層記錄大腦活動(dòng)的設備,而Metzger及其同事則開(kāi)發(fā)出一種把電極放置在大腦皮層表面的新型設備。這些研究標志著(zhù)BCI技術(shù)發(fā)展的轉折點(diǎn),該技術(shù)旨在幫助喪失語(yǔ)言能力的人恢復溝通能力。


神經(jīng)系統疾病會(huì )麻痹與言語(yǔ)和肢體功能相關(guān)的肌肉,同時(shí)影響認知功能,最終可能導致閉鎖綜合征。在這種情況下,個(gè)人無(wú)法進(jìn)行交流,只能通過(guò)眨眼或最小的動(dòng)作來(lái)回答問(wèn)題。有多種系統可以替代和增強通信技術(shù),來(lái)幫助閉鎖綜合癥患者進(jìn)行交流,但是尚不完善。與正常溝通交流(每分鐘約150個(gè)字)相比,這些系統說(shuō)話(huà)的速度要慢得多(通常每分鐘只能達到幾個(gè)字),然而腦機接口有解決這些問(wèn)題的潛力。


1969年,Macaca mulatta發(fā)表的一篇論文首次證明可以訓練獼猴增加單個(gè)神經(jīng)元的活動(dòng),從而使其做出意愿行為。人類(lèi)實(shí)驗開(kāi)始于1990年代末,當時(shí)將電極連接到一名因運動(dòng)神經(jīng)元?。∥s側索硬化癥,俗稱(chēng)漸凍癥)引起的閉鎖綜合征患者的神經(jīng)元上。隨后在2006年進(jìn)行的一項研究中,毫米級電極陣列(稱(chēng)為微電極)被植入脊髓損傷患者的大腦中。這種微電極陣列(MEA)通過(guò)記錄運動(dòng)皮層中數百個(gè)神經(jīng)元的活動(dòng)控制機械臂,運動(dòng)皮層在大腦中負責控制自主運動(dòng)。之后,MEA被用于實(shí)現通信,例如譯碼筆跡。


自1999年以來(lái),腦電圖(EEG)技術(shù)(即沿著(zhù)頭皮放置電極以記錄大腦中的電活動(dòng)),一直被用來(lái)幫助癱瘓患者進(jìn)行交流(通過(guò)控制自定義的拼寫(xiě)軟件來(lái)實(shí)現)。大約在同一時(shí)間,人們發(fā)現在大腦放置小型圓盤(pán)電極(直徑為2-3毫米)可以獲得比使用頭皮電極質(zhì)量更好的信號,這種記錄大腦活動(dòng)的方法被稱(chēng)為皮質(zhì)電圖(ECoG)。


本世紀初,ECoG開(kāi)始用于接受手術(shù)治療后的耐藥性癲癇患者,以記錄與語(yǔ)言和肢體運動(dòng)相關(guān)的大腦信號。這最終促成了首個(gè)全嵌入式ECoG設備的開(kāi)發(fā),使閉鎖綜合癥患者能夠在家中就使用打字程序。迄今為止,約有50名不同程度癱瘓的患者通過(guò)植入BCI進(jìn)行交流,其中大多數人使用MEA。


Metzger等人報告了一名癱瘓受試者的研究結果,該患者在17年前曾得過(guò)一次腦干中風(fēng),這導致她從此不能說(shuō)清楚話(huà)。作者的BCI系統包含一個(gè)植入了253個(gè)ECoG電極的硅片,每個(gè)電極都記錄了數千個(gè)神經(jīng)元的平均活動(dòng)。該裝置通過(guò)手術(shù)植入大腦感覺(jué)運動(dòng)皮層左側的“面部區域”,也就是負責控制口腔,面部肌肉和聲道的皮層。這項研究建立在之前的ECoG記錄報告的基礎上,其中包括在另一名腦干中風(fēng)患者身上植入的類(lèi)似BCI的記錄。

大腦對文本的解碼,第一種方法是通過(guò)循環(huán)神經(jīng)網(wǎng)絡(luò )與語(yǔ)言模型這兩個(gè)系統的組合實(shí)現的,循環(huán)神經(jīng)網(wǎng)絡(luò )(RNN,人工神經(jīng)網(wǎng)絡(luò )的一種)的網(wǎng)絡(luò )運行的算法可破譯與發(fā)音器(聲道的一部分)運動(dòng)相關(guān)的大腦活動(dòng);語(yǔ)言模型以每分鐘78個(gè)單詞的速度從一組單詞(1024個(gè))中組成句子(組成的單詞錯誤率為25.5%)。第二種方法是,可以通過(guò)直接將大腦信號翻譯成合成語(yǔ)音,單詞詞匯量為1024個(gè)時(shí),合成單詞錯誤率為54.4%;單詞詞匯量為119個(gè)時(shí),合成單詞錯誤率為8.2%,詞匯量較少錯誤率會(huì )降低。此外,BCI還嘗試對面部表情進(jìn)行解碼,并通過(guò)數字人像進(jìn)行再現,從而為文本或語(yǔ)音提供視覺(jué)反饋,極大地豐富了參與者的交流能力??傮w而言,與之前報道的ECoG、BCI相比,該設備在詞匯量、通信速度和語(yǔ)音解碼的多功能性方面都有很大改進(jìn)。


Willett等人報道了使用兩個(gè)MEA(共包含128個(gè)電極)來(lái)記錄無(wú)法清晰說(shuō)話(huà)的漸凍癥患者的大腦感覺(jué)運動(dòng)皮層左側的“面部區域”的神經(jīng)元活動(dòng)。與Metzger及其同事的設備一樣,RNN和語(yǔ)言模型可以將大腦信號轉化為文本,并針對不同的詞匯量進(jìn)行訓練和測試。通過(guò)該設備,受試者能夠以平均每分鐘62個(gè)單詞的速度進(jìn)行交流,在125000個(gè)單詞的詞匯量中,單詞錯誤率為23.8%;在50個(gè)單詞的詞匯量中,單詞錯誤率為9.1%。

RNN是通過(guò)訓練受試者嘗試說(shuō)出顯示器上顯示的260-480個(gè)句子的方法來(lái)收集神經(jīng)活動(dòng)記錄,整個(gè)訓練過(guò)程平均每天耗時(shí)140分鐘,持續8天。Willett及其同事的實(shí)驗分析表明,減少訓練不會(huì )過(guò)多影響結果。重要的是,作者觀(guān)察到,從一個(gè)被廣泛認為對語(yǔ)音生成至關(guān)重要的大腦區域(稱(chēng)為布洛卡區)記錄到的神經(jīng)活動(dòng)無(wú)法被解碼,這引發(fā)了該區域是否包含對語(yǔ)音解碼有用的信息的疑問(wèn)。


這兩份報道為使用植入式腦機接口(BCI)恢復通信的理論提供了有力證據,但在廣泛使用前,仍需要進(jìn)一步解決幾個(gè)問(wèn)題。首先,這兩項研究中使用的語(yǔ)音模型都是對可以微弱發(fā)音受試者的模擬語(yǔ)音進(jìn)行訓練和測試,現在還需要更多的研究來(lái)證明對無(wú)法發(fā)音受試者的療效,如閉鎖綜合征(包括漸凍癥晚期)。另一個(gè)問(wèn)題是,這兩種設備都需要通過(guò)數百個(gè)電極進(jìn)行高帶寬記錄,這些電極必須通過(guò)一個(gè)穿透皮膚的"基座"連接到外部放大器,這在外觀(guān)上并不美觀(guān)。后續需要開(kāi)發(fā)出可完全植入的無(wú)線(xiàn)BCI,以復刻或超越這些研究中所報告的性能。


此外,目前只選擇了技能強的研究人員參與到所報道的腦機接口的培訓工作,因此在家庭環(huán)境中,對于沒(méi)經(jīng)驗的護理人員來(lái)說(shuō)不太適用。未來(lái)還需要類(lèi)似的、只需極少或無(wú)需研究人員干預即可運行的有效腦機接口系統。這需要以用戶(hù)為中心的原則,在臨床人群中進(jìn)行廣泛的開(kāi)發(fā)和測試。目前還不清楚用戶(hù)對他人語(yǔ)音的感知是否會(huì )導致從大腦到文本的解碼錯誤,因為越來(lái)越多的證據表明,語(yǔ)音感知除語(yǔ)音生成外,還會(huì )激活感覺(jué)運動(dòng)皮層。


最后,目前還需要觀(guān)察MEA和ECoG這兩種設備在實(shí)際應用中的安全性和長(cháng)期有效性方面,是否可以滿(mǎn)足用戶(hù)的需求。MEA可從一小塊皮層區域中捕捉到豐富的功能信息,但信號往往不穩定,需要頻繁更新語(yǔ)音解碼模型。此外,電極材料的降解和裝置的組裝可能會(huì )限制MEA的使用壽命。與MEA相比,ECoG電極需要植入的面積更大,但ECoG電極位于皮質(zhì)組織外部,雖然會(huì )引起表層組織反應,但通常能在長(cháng)時(shí)間內提供較好的信號質(zhì)量。


這兩種腦機接口裝置代表了神經(jīng)科學(xué)和神經(jīng)工程學(xué)研究的重大進(jìn)步,對于緩解因癱瘓性神經(jīng)損傷和疾病而失聲的人的痛苦有巨大的潛力。即使是最基本的腦機接口系統,也能讓用戶(hù)在輔助技術(shù)軟件中選擇字母或圖標,為他們的日常生活帶來(lái)極大的便利。綜上所述,能夠進(jìn)行交流的腦機接口系統(如本文討論的系統)有望產(chǎn)生更大的影響。