🌵當紀錄片與新聞採訪只剩翻譯聲：配音為何會抹去原音的重量

2026-03-25 Documentary News Subtitles Media AI

我想談的不只是紀錄片，也包括國際新聞採訪。當配音把受訪者原本的聲音整個蓋掉，失去的往往不只是語言，而是人物本身的真實感。

Cover Image

當紀錄片與新聞採訪只剩翻譯聲：配音為何會抹去原音的重量

很久沒寫這種偏心得的文章了，不過這個題目我真的想講很久。

不知道大家有沒有看過那種國際新聞的採訪片段？我這裡講的比較是美國那一套，像 CNN 或 BBC 這種英語新聞節目。老實說，我已經不太記得自己第一次看到的是哪一台、哪一則新聞了，但有一種不對勁的感覺我記到現在。

就是畫面上的人明明在說話，我卻幾乎聽不到他的聲音。我聽到的，反而是一層很生硬的英文配音，直接把被採訪者原本的聲音整個蓋掉。

我那時候真的很不習慣。因為對我來說，我想聽到的從來不只是「他說了什麼」，還包括「他到底是怎麼說的」。有些語言我明明一句也聽不懂，但我還是會想知道，當地人真實講話的聲音到底是什麼樣子。

比如說，俄國電影裡的俄語常常給人一種比較低沉的感覺，我就會好奇，現實生活裡的俄國人講話也真的是這種感覺嗎？又或者一些我根本不熟悉的國家，當地人的聲音、節奏、口氣，到底是什麼樣子？如果這些都被整段配掉，那觀眾其實只剩下資訊，少掉的反而是跟一個真實的人接觸的感覺。

所以後來我再看國際新聞專題、人物紀錄片，常常都會有同一種感覺：畫面裡的人明明在說話，可是你聽到的聲音卻完全不像他。那已經不是單純「翻譯之後比較好懂」而已，而是另一個人直接接管了本來屬於他的語氣、節奏、呼吸和停頓。

對劇情片來說，配音可以是一種成熟的在地化手段；但放到國際新聞採訪、紀錄片、證詞與歷史素材裡，問題就敏感得多。因為這些內容不只是傳遞資訊，它們也在保存「誰說了這句話，以及他是怎麼說的」。

配音不是原罪，爭議點是「新聞與紀錄片的原音整個消失」

先講清楚，我不是反對所有配音。

對兒童內容、識字門檻較高的觀眾，或需要降低閱讀負擔的情境，配音本來就有它的價值。它讓更多人能走進作品，也讓影音內容真正跨過語言門檻。

但如果主題是新聞採訪或紀錄片，常見的選項其實不只一種：

字幕：保留原音，讓觀眾自己讀翻譯。
旁白式 voice-over：翻譯聲音蓋在上面，但原講者的聲音仍隱約可聽見。
全配音：以目標語完整取代原音，觀眾幾乎聽不到原本的說話聲。

真正讓我有意見的，通常就是第三種。當原音被整個抽掉時，觀眾接收到的就不再是「被翻譯過的本人」，而比較像是「另一個人重新演給你聽的一段內容」。

我覺得那種不對勁很直接。不是因為翻譯不好懂，也不是因為我反對字幕或配音，而是因為被訪者本人好像直接被靜音了。

為什麼新聞採訪與紀錄片特別不能忽略原音

1. 聲音本身就是人物的一部分

一個人的口音、停頓、呼吸急促、講到某個字時的顫抖，都是資訊。那不只是情緒，也可能透露出他的社會背景、壓力狀態、文化位置，甚至是他與鏡頭之間的距離感。

如果一位受訪者原本說話很慢、很小心，經過配音後變成一種俐落、流暢、漂亮的敘述，內容也許沒變，但人物已經變了。

2. 沉默、猶豫、卡頓，都是證詞的一部分

劇情片可以追求流暢，但新聞採訪與紀錄片常常反而需要保留粗糙。

有時候最有力的片段，反而不是一句漂亮的結論，而是在回答前的那一秒沉默、吞口水的聲音，或一句講到一半又改口的話。這些細節很難被完整翻譯，卻正是新聞採訪與紀錄片之所以讓人相信「這是真人真事」的重要原因。

3. 翻譯永遠不是透明玻璃

任何翻譯都有取捨，配音更是如此。它不只轉換字義，還會替原說話者決定語氣：這句話要憤怒一點、溫柔一點、堅定一點，還是更中性一點？

一旦聲音被換掉，翻譯就不只是橋梁，而開始介入表演。對小說或動畫來說，這也許可以接受；但對新聞採訪與紀錄片來說，這一步往往太重。

那為什麼平台和電視台還是愛用配音？

因為配音的優點也是真的存在。

第一，它確實比較好看，或者更準確地說，比較好跟。不是每個人都習慣一邊讀字幕、一邊看畫面。對長輩、小孩、通勤中的觀眾，或閱讀速度比較慢的人來說，配音本來就能降低門檻。這也是為什麼有些市場會長期偏好配音內容，因為很多人根本不是正襟危坐在那邊看，他們可能是一邊做家事、一邊聽節目，或者只是單純不想一直盯著字幕。

第二，它也比較符合某些市場的習慣。不同國家本來就對字幕和配音有不同接受度。對有些觀眾來說，只要聽不懂原語，觀看節奏就會被打斷。美國新聞與紀錄節目裡常見的 overdub 風格，某種程度上就是這種習慣的延伸。它預設觀眾想要快速接收內容，而不是停下來聽原本的語氣、口音和細節。

第三，它對平台來說是可以標準化的流程。尤其當內容量龐大、上架速度又快時，配音很容易被當成一種「更完整的本地化服務」。

而且這種邏輯其實不只存在於國際新聞。我們自己也不是完全沒有類似的東西，只是場景不太一樣。像有些配音韓劇，某種程度上就是讓家庭主婦可以一邊做家事、一邊追劇。不對，講更準一點，是一邊做家事、一邊聽韓劇。又或者周星馳電影在華語世界的傳播，某種程度上也真的被很強的配音推得更遠。

所以我真的不是要把配音講成壞東西。配音有它的用途，有時候甚至很成功。只是當題材從娛樂轉到新聞採訪、紀錄片、證詞這些非虛構內容時，我覺得判準就不能完全一樣了。

也就是說，新聞採訪與紀錄片配音之所以會一直存在，不是因為業界不知道原音重要，而是因為易懂、效率和市場習慣，常常在決策上贏過真實感。

AI 配音時代，這場爭議只會更尖銳

過去要做一條配音音軌，至少還需要演員、錄音和後製。現在，AI 正在把這件事變得更快、更便宜，也更容易大規模複製。

這聽起來很進步，因為它確實可能帶來更多語言版本，讓更多觀眾看見作品。但問題也正出在這裡：當「替換聲音」變得幾乎沒有成本時，保存原音反而更容易被當成可有可無的選項。

對劇情片來說，AI 配音的討論還可以放在效率與表演品質上；但對新聞採訪與紀錄片來說，它直接碰到的是倫理問題。

如果受訪者是一位倖存者、一位移工、一位戰地平民，或一位歷史事件的親歷者，那麼他的聲音不只是媒介，而是證言的一部分。你可以翻譯他的話，但若連他的呼吸與口氣都用更「順耳」的聲音取代，新聞採訪與紀錄片就都很容易從記錄現場，滑向重新包裝現場。

更好的做法，不是二選一

所以與其把問題簡化成「字幕派」對「配音派」，我比較傾向把它看成分開處理。

我認為至少有三個原則值得被當成底線：

新聞採訪、紀錄片、證詞場景，預設應保留原音。
最理想的做法是原音加字幕；若考量可看性，也應優先選擇能聽見原講者聲音的 voice-over。
若必須提供全配音，也應保留原音音軌可切換。
讓觀眾自行選擇，不要替所有人預先決定「哪一種理解方式比較好」。對我來說，最理想的狀態從來不是把配音全部取消，而是至少保留「我要不要切回原聲」這個選項。老實說，我到現在也還會好奇，很多平台到底有沒有真的把這個選項做好。
AI 生成或 AI 輔助的配音，應明確標示。
這不只是技術透明，也是對觀眾信任的基本尊重。

真正好的在地化，不是把外來的聲音磨到沒有稜角，而是幫觀眾跨過語言門檻之後，仍然能聽見那個人原本的樣子。

結語：翻譯應該是橋，不是橡皮擦

新聞採訪與紀錄片最珍貴的地方，在於它們讓我們遇見世界上原本不會遇見的人。那份相遇不只靠畫面，也靠聲音。聲音裡有階級、有歷史、有情緒、有脆弱，甚至有一個人不願被修飾的真相。

所以，問題從來不是「要不要翻譯」，而是「翻譯要不要把原本的人一起擦掉」。

如果配音讓更多人看見作品，那當然值得肯定；但只要作品屬於非虛構、屬於真實人物、屬於證詞與記錄，我仍然會希望原音被保留下來。

如果真的要配，我甚至不反對做得更細緻一些。至少可以盡量去貼近被訪者原本的口氣、語氣、情緒，甚至保留一點口音感，而不是用一種過度平整、誰都一樣的標準聲線把所有人重新講一遍。

但講到底，比起追求一個「更像」的配音，我更在意的還是不要把原音徹底消掉。

因為在新聞採訪與紀錄片裡，聽見一個人怎麼說話，很多時候就等於聽見他是誰。