雞尾酒會效應是什麼?|仿生神經網路改變 Zoom?未來生醫 Meeting 研討會變成如何?

Modified by Photo by Pawel Chu on Unsplash

Modified by Photo by Pawel Chu on Unsplash

大家最近過好嗎 🤍

轉眼之間今年即將要結束了,2020 年是我們生活發生巨變的一年,2020 年所發生的這一切,相信會是未來被記載在歷史教科書上的重要事件,也會是歷經過 COVID-19 武漢肺炎的我們所具有的共同記憶。

我身邊很多人都跟我說,彷彿生活中的一切自從今年三月份的那一天起(紐約疫情開始爆發,大家開始 WFH 的那一天),全部就都停滯不動了。

若要說到有哪些東西可以代表 2020 年,我想 Zoom meeting 絕對會是前三名,然後以下這三句話,絕對是今年大家聽到最多的英文句子沒有之一——

  • Can you hear me now?

  • Let me share my screen.

  • You’re muted. 

😂

而關於 Zoom,相信有用過的大家一定同意,吵雜的背景音、或是同時多人一起聊天講話的場景是非常干擾且惱人的。

但不曉得你有沒有想過一個問題,為何在各種 Party、酒會⋯⋯等更加嘈雜的環境下,我們人類的大腦卻可以使我們無礙地與對方聊天談話,不受背景音量的干擾?甚至,當有人呼喊我們時,我們的聽覺系統可以精準地定位聲音的來源?

今天想要跟你分享的生物新知識,正是想跟你介紹我們大腦聽覺系統的這個能力,也就是所謂的—— 雞尾酒會效應(Cocktail Party Effect)

而且更進一步,一個來自 University of Washington 的研究團隊,他們正在研發透過人工神經網路與 Machine learning,讓機器可以學會我們大腦的這項能力,並且在未來可能可以應用在麥克風、喇叭、甚至是各式各樣的 Zoom meeting 上 🤓

Photo by Antenna on Unsplash

Photo by Antenna on Unsplash

雞尾酒效應是什麼?

想像一下你身處在以下這個場景——

某一個晚上你正在朋友的晚宴 party 上,所有人都盛裝出席,現場觥籌交錯,甚至還有爵士樂隊現場演奏。

但是不曉得你有沒有過這個很奇妙的經驗就是,即使 party 現場環境如此嘈雜,我們卻還是可以很清楚地與旁邊的友人聊天交談,而不會受到背景音的干擾與影響。仿佛我們的大腦具有一種特殊的能力,可以自動地把背景雜音過濾掉,讓我們可以專注在真正重要的對話內容上。

這樣的能力與現象正是被稱為—— 雞尾酒會效應(Cocktail Party Effect),或者,也有人稱之為 Selective attention 或 Selective hearing。

當然隨著我們年齡的增長,或者是環境音量的提高;我們大腦處理背景雜訊的能力會逐漸下降,而背景聲音的干擾程度也會越來越大。

但是我們的大腦究竟是怎麼做到的呢?我們的大腦如何去分辨不同的聲音訊號來源呢?

刊登在 Nature Neuroscience 的這篇研究提出,即使環境背景音與對話的聲音是混雜在一起的,我們的大腦可能可以,下意識地「拆解」這些進入聽覺系統的訊號,然後根據這些訊號的特性,分門別類歸納出不同的訊號來源,哪些是背景音?哪些是對話的聲音?於是,我們便可以選擇性地忽略掉那些背景音,進而專注在真正的對話聲音上。

也就是說,雖然不若視覺我們可以主動地關閉接收訊號(也就是閉上眼睛不去看 🙈);然而關於聽覺,儘管不能閉上耳朵不去聽,但我們的大腦卻具有這樣的能力,可以選擇性地去注意那些環境中真正重要的訊號,然後自動忽略掉其他不必要的背景雜音。

其實許多鳥類、兩棲類、哺乳類動物的大腦也都具備有這個過濾背景雜音的能力。

仔細想想,這項能力或許可以說是動物生存的最重要能力之一吧,生存在野外的動物們,必須要能夠過濾掉自然界中的那些背景雜音,像是蟲鳴、流水、樹葉聲⋯⋯等等,然後把大腦的注意力分配專注在真正重要的聲音上,像是敵人獵食者的聲音、求偶的聲音⋯⋯等等。

另外關於 Cocktail Party Effect,我自己還有一個非常深刻的經驗就是,在某一個晚宴上(現場的背景音樂沒有很吵但是我周遭的人講話很吵都像用吼的一樣哈哈哈)我朋友突然用中文叫我,雖然當時他的聲音沒有很大,但是那一刻我卻聽得無比清楚。

像是這種在非母語環境下,來自母語訊號的刺激,也正是 Cocktail Party Effect 的典型例子之一 🤓

Photo by Markus Winkler on Unsplash

Photo by Markus Winkler on Unsplash

Machine learning 讓機器也具有 cocktail party ability

人類大腦的 Cocktail Party Effect 聽起來很棒,那如果機器也學會的話會怎樣呢?

就在前幾週,Science 的這篇新聞,報導了一個來自 University of Washington 的研究團隊,他們寫出了一套 algorithm,利用仿生人工神經網路,試圖讓機器去學習,去辨認出人聲對話與環境背景音的差異,來讓機器模擬出人類大腦的 Cocktail Party Effect。

若你有興趣的話,可以去這裡看看他們的研究發表。

大致上來說,他們的研究成果顯示,他們的 algorithm 除了可以過濾掉那些背景環境的雜音以外,更特別的是,在極度嘈雜的環境下,他們還可以更進一步地讓機器幾乎精準定位人聲的聲音來源

也就是說,若是在兩個人同時講話的場合,這個 algorithm 可以分辨出不同的聲音來源,精準到 3.7 角度以內的位置差異,甚至,這個機器可以在八個人同時講話的場合,把八個不同人聲的聲音分辨出來,並且定位各個聲音的位置來源 😎

Ok 這聽起來很酷,那這樣的科技未來可以應用在什麼地方呢?

除了各種耳機、音響、喇叭、助聽設備以外,你第一個想到的應該就是 Zoom meeting 了吧~

關於生醫研究人員,未來的 Meeting 會變得如何?

未來,若 Zoom meeting 結合了剛剛跟你說的 Cocktail Party Effect by machine learning 的技術,相信會對我們生活中的各種 meeting、lecture、seminar 有更多的幫助。

但是重點是,就算有了更多的科技輔助,未來的這些 meeting 究竟會變得如何呢?

更精確地說,往日生醫研究者們的那些 seminar、conference、retreat、lecturer⋯⋯等等各種會議與研討會,在疫情過後,會變得如何呢?

縱使 in-person conference 的許多重要元素是永遠無法被 Zoom 所取代的,像是各種 social events、coffee break、afterparty⋯⋯等等,但現在大家已經漸漸習慣 virtual meeting 也將近一年了,未來即使疫情趨緩,我想,virtual meeting 也可以預見地,會持續地在未來各式各樣的生醫 conference、seminar 當中,繼續扮演一定程度的重要角色。

所以,未來不管是生醫研討會的舉辦者們、或是生醫研討會的參與者們如你如我,善用各種 virtual meeting 的優勢與資源,就算在後疫情時代、就算之後大家都接種了疫苗,virtual meeting 也絕對仍會是生醫研究者們的重要課題。

即使很多人說,彷彿生活中的一切自從今年三月份的那一天起全都停滯不動了,但我們的世界確實是在持續改變的,在疫情趨緩、一切生活變回正常之前,更多新的「正常」相信仍會在明年陸陸續續出現,適應這些改變、善用這些改變,希望我們一起,在未來新的這一年,持續克服這些艱難的挑戰! 💪🏼

謝謝你看到最後!你覺得疫情過後的世界會變得怎樣呢?歡迎在底下留言/私訊我,告訴我你的任何想法 😉

關注我的 Facebook 與 Instagram,我會每週帶你讀一篇生物學新知識,與那些平常的紐約生活 ✨

Reference

  1. Narayan, R. et al. Cortical interference effects in the cocktail party problem. Nat Neurosci 10, 1601–1607 (2007)

  2. Hutson, M. Trouble hearing in a crowded room? New ‘cone of silence’ could help. Science (2020)

  3. Jenrungrot, T. et al., The Cone of Silence: Speech Separation by Localization. 34th Conference on Neural Information Processing Systems, NeurIPS 2020. (Oral)

THE BIOLOGIST|紐約生

 


如果覺得還不錯,記得分享給親朋好友唷!