🌵當紀錄片與新聞採訪只剩翻譯聲:配音為何會抹去原音的重量

當紀錄片與新聞採訪只剩翻譯聲:配音為何會抹去原音的重量
很久沒寫這種偏心得的文章了,不過這個題目我真的想講很久。
不知道大家有沒有看過那種國際新聞的採訪片段?我這裡講的比較是美國那一套,像 CNN 或 BBC 這種英語新聞節目。老實說,我已經不太記得自己第一次看到的是哪一台、哪一則新聞了,但有一種不對勁的感覺我記到現在。
就是畫面上的人明明在說話,我卻幾乎聽不到他的聲音。我聽到的,反而是一層很生硬的英文配音,直接把被採訪者原本的聲音整個蓋掉。
我那時候真的很不習慣。因為對我來說,我想聽到的從來不只是「他說了什麼」,還包括「他到底是怎麼說的」。有些語言我明明一句也聽不懂,但我還是會想知道,當地人真實講話的聲音到底是什麼樣子。
比如說,俄國電影裡的俄語常常給人一種比較低沉的感覺,我就會好奇,現實生活裡的俄國人講話也真的是這種感覺嗎?又或者一些我根本不熟悉的國家,當地人的聲音、節奏、口氣,到底是什麼樣子?如果這些都被整段配掉,那觀眾其實只剩下資訊,少掉的反而是跟一個真實的人接觸的感覺。
所以後來我再看國際新聞專題、人物紀錄片,常常都會有同一種感覺:畫面裡的人明明在說話,可是你聽到的聲音卻完全不像他。那已經不是單純「翻譯之後比較好懂」而已,而是另一個人直接接管了本來屬於他的語氣、節奏、呼吸和停頓。
對劇情片來說,配音可以是一種成熟的在地化手段;但放到國際新聞採訪、紀錄片、證詞與歷史素材裡,問題就敏感得多。因為這些內容不只是傳遞資訊,它們也在保存「誰說了這句話,以及他是怎麼說的」。
配音不是原罪,爭議點是「新聞與紀錄片的原音整個消失」
先講清楚,我不是反對所有配音。
對兒童內容、識字門檻較高的觀眾,或需要降低閱讀負擔的情境,配音本來就有它的價值。它讓更多人能走進作品,也讓影音內容真正跨過語言門檻。
但如果主題是新聞採訪或紀錄片,常見的選項其實不只一種:
- 字幕:保留原音,讓觀眾自己讀翻譯。
- 旁白式 voice-over:翻譯聲音蓋在上面,但原講者的聲音仍隱約可聽見。
- 全配音:以目標語完整取代原音,觀眾幾乎聽不到原本的說話聲。
真正讓我有意見的,通常就是第三種。當原音被整個抽掉時,觀眾接收到的就不再是「被翻譯過的本人」,而比較像是「另一個人重新演給你聽的一段內容」。
我覺得那種不對勁很直接。不是因為翻譯不好懂,也不是因為我反對字幕或配音,而是因為被訪者本人好像直接被靜音了。
為什麼新聞採訪與紀錄片特別不能忽略原音
1. 聲音本身就是人物的一部分
一個人的口音、停頓、呼吸急促、講到某個字時的顫抖,都是資訊。那不只是情緒,也可能透露出他的社會背景、壓力狀態、文化位置,甚至是他與鏡頭之間的距離感。
如果一位受訪者原本說話很慢、很小心,經過配音後變成一種俐落、流暢、漂亮的敘述,內容也許沒變,但人物已經變了。
2. 沉默、猶豫、卡頓,都是證詞的一部分
劇情片可以追求流暢,但新聞採訪與紀錄片常常反而需要保留粗糙。
有時候最有力的片段,反而不是一句漂亮的結論,而是在回答前的那一秒沉默、吞口水的聲音,或一句講到一半又改口的話。這些細節很難被完整翻譯,卻正是新聞採訪與紀錄片之所以讓人相信「這是真人真事」的重要原因。
3. 翻譯永遠不是透明玻璃
任何翻譯都有取捨,配音更是如此。它不只轉換字義,還會替原說話者決定語氣:這句話要憤怒一點、溫柔一點、堅定一點,還是更中性一點?
一旦聲音被換掉,翻譯就不只是橋梁,而開始介入表演。對小說或動畫來說,這也許可以接受;但對新聞採訪與紀錄片來說,這一步往往太重。
那為什麼平台和電視台還是愛用配音?
因為配音的優點也是真的存在。
第一,它確實比較好看,或者更準確地說,比較好跟。不是每個人都習慣一邊讀字幕、一邊看畫面。對長輩、小孩、通勤中的觀眾,或閱讀速度比較慢的人來說,配音本來就能降低門檻。這也是為什麼有些市場會長期偏好配音內容,因為很多人根本不是正襟危坐在那邊看,他們可能是一邊做家事、一邊聽節目,或者只是單純不想一直盯著字幕。
第二,它也比較符合某些市場的習慣。不同國家本來就對字幕和配音有不同接受度。對有些觀眾來說,只要聽不懂原語,觀看節奏就會被打斷。美國新聞與紀錄節目裡常見的 overdub 風格,某種程度上就是這種習慣的延伸。它預設觀眾想要快速接收內容,而不是停下來聽原本的語氣、口音和細節。
第三,它對平台來說是可以標準化的流程。尤其當內容量龐大、上架速度又快時,配音很容易被當成一種「更完整的本地化服務」。
而且這種邏輯其實不只存在於國際新聞。我們自己也不是完全沒有類似的東西,只是場景不太一樣。像有些配音韓劇,某種程度上就是讓家庭主婦可以一邊做家事、一邊追劇。不對,講更準一點,是一邊做家事、一邊聽韓劇。又或者周星馳電影在華語世界的傳播,某種程度上也真的被很強的配音推得更遠。
所以我真的不是要把配音講成壞東西。配音有它的用途,有時候甚至很成功。只是當題材從娛樂轉到新聞採訪、紀錄片、證詞這些非虛構內容時,我覺得判準就不能完全一樣了。
也就是說,新聞採訪與紀錄片配音之所以會一直存在,不是因為業界不知道原音重要,而是因為易懂、效率和市場習慣,常常在決策上贏過真實感。
AI 配音時代,這場爭議只會更尖銳
過去要做一條配音音軌,至少還需要演員、錄音和後製。現在,AI 正在把這件事變得更快、更便宜,也更容易大規模複製。
這聽起來很進步,因為它確實可能帶來更多語言版本,讓更多觀眾看見作品。但問題也正出在這裡:當「替換聲音」變得幾乎沒有成本時,保存原音反而更容易被當成可有可無的選項。
對劇情片來說,AI 配音的討論還可以放在效率與表演品質上;但對新聞採訪與紀錄片來說,它直接碰到的是倫理問題。
如果受訪者是一位倖存者、一位移工、一位戰地平民,或一位歷史事件的親歷者,那麼他的聲音不只是媒介,而是證言的一部分。你可以翻譯他的話,但若連他的呼吸與口氣都用更「順耳」的聲音取代,新聞採訪與紀錄片就都很容易從記錄現場,滑向重新包裝現場。
更好的做法,不是二選一
所以與其把問題簡化成「字幕派」對「配音派」,我比較傾向把它看成分開處理。
我認為至少有三個原則值得被當成底線:
新聞採訪、紀錄片、證詞場景,預設應保留原音。
最理想的做法是原音加字幕;若考量可看性,也應優先選擇能聽見原講者聲音的 voice-over。若必須提供全配音,也應保留原音音軌可切換。
讓觀眾自行選擇,不要替所有人預先決定「哪一種理解方式比較好」。對我來說,最理想的狀態從來不是把配音全部取消,而是至少保留「我要不要切回原聲」這個選項。老實說,我到現在也還會好奇,很多平台到底有沒有真的把這個選項做好。AI 生成或 AI 輔助的配音,應明確標示。
這不只是技術透明,也是對觀眾信任的基本尊重。
真正好的在地化,不是把外來的聲音磨到沒有稜角,而是幫觀眾跨過語言門檻之後,仍然能聽見那個人原本的樣子。
結語:翻譯應該是橋,不是橡皮擦
新聞採訪與紀錄片最珍貴的地方,在於它們讓我們遇見世界上原本不會遇見的人。那份相遇不只靠畫面,也靠聲音。聲音裡有階級、有歷史、有情緒、有脆弱,甚至有一個人不願被修飾的真相。
所以,問題從來不是「要不要翻譯」,而是「翻譯要不要把原本的人一起擦掉」。
如果配音讓更多人看見作品,那當然值得肯定;但只要作品屬於非虛構、屬於真實人物、屬於證詞與記錄,我仍然會希望原音被保留下來。
如果真的要配,我甚至不反對做得更細緻一些。至少可以盡量去貼近被訪者原本的口氣、語氣、情緒,甚至保留一點口音感,而不是用一種過度平整、誰都一樣的標準聲線把所有人重新講一遍。
但講到底,比起追求一個「更像」的配音,我更在意的還是不要把原音徹底消掉。
因為在新聞採訪與紀錄片裡,聽見一個人怎麼說話,很多時候就等於聽見他是誰。