
? ? 人工智能(AI)的快速發展給氣象科技領域帶來了革命性的影響,包括雷達圖像識別、決策服務材料撰寫、預報大模型等等。接著上一期AI寫作的話題,這一期小編結合多年來給作者們翻譯和潤色稿件的經歷探討使用機器翻譯或AI翻譯進行氣象論文翻譯的問題。
???1.什么是機器翻譯,什么是AI翻譯?
? ? 機器翻譯是基于計算機程序自動將一種自然語言文本轉換成另一種自然語言的過程。機器翻譯先后經歷了三個發展階段,技術基礎分別是規則方法、統計方法、深度學習。根據技術原理可分為基于規則的機器翻譯(RBMT)、統計機器翻譯(SMT)和神經機器翻譯(NMT)三種主要類型。RBMT和SMT就是傳統的機器翻譯,NMT也就是常說的AI翻譯。換句話說,AI翻譯就是最新階段的機器翻譯。
2.常見的機器翻譯工具有哪些?機器翻譯的優缺點?
國內常用的機器翻譯工具有google翻譯、DeepL、百度翻譯、騰訊翻譯君、智能翻譯官等等;此外,Deepseek和Chatgpt等大模型也集成了語言翻譯功能(其原理和NMT類似)。這些機器翻譯工具目前基本更新到了第三代,以機器學習和神經網絡為主要技術基礎,也就是AI翻譯的階段。
評價機器翻譯質量的好壞,一個最直接的標準,就是看它有多接近人工翻譯。AI翻譯、SMT、RBMT,機器翻譯一代比一代進步,翻譯質量逐步向人工翻譯靠攏,并有很多自身的優點。例如,處理速度快,能夠迅速完成大量文本的初步翻譯工作;且成本低廉、費用低。AI翻譯比前2代機器翻譯具備更強的上下文理解能力,能夠提供更準確、流暢的翻譯結果。
但三代的機器翻譯仍存在很多共性的問題,特別是在專業學術領域文章的翻譯上。
? ? 缺點:
(1)專業詞匯誤差大:山東的德州翻譯為美國的德州;副高翻譯為sub-high。
(2)語境理解不足:常誤解復雜句式、歧義或文化特定表達,錯誤斷句、導致邏輯錯誤。
(3)直譯:對照字面意思由中到英(一一映射),不是先理解了中文再用英文寫出來。常導致復雜啰嗦,且不會變通的添加連接詞使文章邏輯通順。
(4)錯誤遺傳:作者中文寫作的一些筆誤被繼承到英文中,引發讓人哭笑不得的錯誤。
(5)學術風格欠缺:譯文生硬,缺乏學術寫作的流暢性和規范性,語言AI化,沒人味。
(6)格式問題:圖題表題、公式符號、參考文獻格式不規范。
(7)文字重復率高:機器翻譯有統計因素在里面,容易導致過高的重復率,而被直接拒稿。
(8)惰性和依賴:個人的英文寫作水平將一直低于AI,限制了個人水平的提高。一篇只花了幾分鐘機器翻譯的文章,對編輯的耐心也是極大的考驗。
3.機器翻譯效果示例

以上示例是文章引言中的一句話,嘗試用AI工具翻譯了下,發現存在的問題還是不少的。一個最直觀的感受就是直譯,原本中文較長的一句話,翻譯過來還是一句英文,但這句英文太長了,分句太多,讀起來很別扭,機器沒能根據中文的邏輯層次將英文分為多個句子。另一個明顯存在的問題,就是專業詞匯的“死板翻譯”,如例子中的“副高”。結尾還有1個莫名奇妙的Types,汗......就這短短一句中文,機器翻譯大概有10多個不當之處。于是咱自己又花了10幾分鐘修改,早知道還不如自己直接翻譯。

就這短短一句中文,機器翻譯大概有10多個不當之處。于是咱自己又花了10幾分鐘修改,早知道還不如自己直接翻譯。修改如下:

?以上內容筆者又嘗試使用DeepSeek翻譯,并指定了氣象論文場景。結果比DeepL錯誤少一些,但仍存在不少共性的問題,結果如下。

4.英文寫作和翻譯中,如何結合使用人工翻譯和AI翻譯工具?(1)首先建議有一定水平的作者,考慮直接寫英文。
(2)如果作者先寫了中文,建議作者自己對照中文,逐字逐句地翻譯英文。
(3)對AI工具的利用,主要體現在疑難詞匯的查詢。此外,大模型提供的語言翻譯功能中,可以提出語言場景,比如氣象論文,有助于語料庫的對應選擇,能提高翻譯的準確度。當然,最后需要人工來逐字逐句的審核校對。
(4)人工翻譯過程中,多去檢索同行文獻,看看其他作者類似的專業詞匯和句子結構是如何使用的,這比直接抄機器翻譯的靠譜得多。
(5)經費充足的作者,可以請既懂科學問題又有豐富寫作經驗的科研人員幫忙翻譯。
總的來看,在氣象科技論文翻譯方面,目前的翻譯水平:RBMT(專業翻譯工具)(大模型)<人工翻譯。隨著未來AI水平的繼續提高,機器翻譯的準確性會進一步提高,并逐步逼近人工翻譯。
但對我們氣象學者來說,由于機器的局限性,最終還需要人工翻譯來把關。更好的把AI和人工結合起來,才能更高效、更準確、更科學的包裝好咱們的論文。颶風翻譯的老師們有著數千篇氣象SCI論文的人工翻譯經驗,涵蓋了氣象及相關交叉學科的各個分支,大家翻譯過程中遇到問題的歡迎隨時溝通交流。