機器翻譯能幫你多少?行業(yè)數(shù)據(jù)趨勢
所在位置: 翻譯公司 > 新聞資訊 > 行業(yè)新聞 / 日期:2017-08-31 13:48:53 / 來源:網(wǎng)絡
云翻譯平臺的一個優(yōu)點是數(shù)據(jù)集中。這就意味著可以俯瞰某些語言行業(yè)數(shù)據(jù)趨勢,如機器翻譯 ( MT ) 的用法及有效性。目前,大數(shù)據(jù)只是剛剛滲透進入翻譯工具中,開發(fā)人員仍在學習如何使用它。我相信,未來所有的云工具都將會基于用戶統(tǒng)計信息開發(fā)分析和預測功能,類似于自由職業(yè)市場Upwork那樣在特定領域中,遴選出頂尖 10% 的自由職業(yè)者。然而,現(xiàn)在我們已經(jīng)可以做的是發(fā)現(xiàn)有用趨勢,證實假設,破除迷信。
作為一名研究人員,我很高興在本年初將數(shù)據(jù)工具引入到了 Memsource 中。以下是一些我們努力收集的此行業(yè)數(shù)據(jù)集合中值得注意的信息。
機器翻譯杠桿:只有 5-20% 的機器翻譯結果是可以直接使用的
為了第一個研究,我和同事決定觀測機器翻譯,以評估它能在多大程度上幫助專業(yè)譯者。行業(yè)研究機構調(diào)查指出,多達 30% 的翻譯公司使用機器翻譯。這點不難理解:目前稅前利潤如此之低,企業(yè)希望努力節(jié)省每一分成本,提升利益能力。同時,在很多翻譯對話論壇中,譯者集體抵制機器翻譯的怒火足以融化鍵盤。
我瀏覽了收集到的數(shù)據(jù),看它們是否可以為雙方各自的主張?zhí)峁┲С帧?/p>
分析顯示,只有5-20%的原生機器翻譯結果好得無需任何更改即可使用。多達40%的機器翻譯結果,在經(jīng)過編輯后可以使用,在80%的翻譯語段中,機器翻譯可以自動填充數(shù)據(jù)。
在上面的圖表中(點擊圖片放大),匹配率表示譯文和機器翻譯引擎所給建議之間的相似性:
- 匹配率 100%:專業(yè)人工翻譯與機器翻譯所給建議完全相同的語段
- 匹配率 85-95%:機器翻譯結果在編輯后足以采用。
- 匹配率 50-75%:機器翻譯對于單個字詞的自動填充很有用,但不適用于整個語段
- 匹配率 0 表示:語段與人工翻譯結果的相關性只有 0-49%
請注意:只能跟蹤用戶首次啟用機器翻譯的項目,然后進行譯后編輯之后再分析。這意味著,這里的樣本約有 3800 萬單詞。
機器翻譯在翻譯法語、英語、西班牙語、葡萄牙語時可更好地發(fā)揮作用
數(shù)據(jù)結果表明,法語,葡萄牙語,西班牙語和英語機器翻譯引擎具有最高的潛在機器翻譯利用率。英譯法的翻譯質(zhì)量尤其突出,其中超過 20% 的翻譯是完全匹配機器翻譯所給建議,幾乎90%的語段與機器翻譯結果有一定相似性。
相比之下,俄語,波蘭語和韓語的利用率很低,模糊匹配低于 40%,甚至 20%,完全匹配只有 5%。
這種差異的出現(xiàn)可能和語言的類型分類有關。法語,葡萄牙語,西班牙語和英語是分析型語言,就是說這些語言依賴于詞序以及例如是或?qū)⑦@樣的輔助詞來傳達意思。另一方面,俄語,波蘭語和韓語是綜合型的,就是說這些語言更多地使用屈折變化。機器翻譯仍然致力于處理那些細微差別。
32% 的項目使用機器翻譯
正如在其他CAT工具中一樣,在 Memsource 中,用戶可以添加機器翻譯引擎,以便在逐段瀏覽文本時快速獲得參考譯文。這個過程稱為交互式機器翻譯譯后編輯,這與傳統(tǒng)譯后編輯的區(qū)別在于譯者不必每段都使用機器翻譯。如果機器翻譯錯誤較多,他們就重新翻譯。
在機器翻譯引擎的選擇上,譯者通常使用通用引擎,比如谷歌翻譯或微軟翻譯。因此,本研究首先針對此類引擎的翻譯效果,而非對特定術語和主題領域進行微調(diào)的定制引擎的翻譯效果。
如上所述,不是每個人都喜愛機器翻譯。譯者和語言服務公司認為,機器翻譯有時會降低翻譯質(zhì)量或干擾譯者的注意力和自制力,這樣不利于譯者追求完美的譯文。Memsource 中只有約32%的項目啟用了機器翻譯。這個數(shù)字之所以有這么高,也是因為機器翻譯的開啟選項被設置為默認值。
報道顯示,大約兩年前,48% 的項目應用了機器翻譯。從那時起,我們系統(tǒng)的平均翻譯量已經(jīng)從每月 1 億字增長到 6-8 億字,而機器翻譯項目的份額卻下降了。我預測,這意味著我們的譯者用戶群越來越能代表整個翻譯行業(yè)。Memsource 曾是幾個專業(yè)技術公司主導的翻譯工具,如今用戶遍布翻譯領域。這有助于說明百分比下降的原因。
接下來會如何?
MT 使用量會增加嗎?這是毫無疑問的。如今的在線對話需要快速翻譯。與高質(zhì)量相比,客戶需要的是更快的周轉(zhuǎn)時間。用 Facebook 的著名口號來說,就是比完美更重要的是完成。
與此同時,機器翻譯的準確度在不斷提高,然而仍然沒有達到人類的水準,但它正在朝此方向進步。因此,也就有了更多關于啟用機器翻譯的爭論。
以上內(nèi)容是收集的數(shù)據(jù)中的一些發(fā)現(xiàn)。我們期待在未來幾個月能分享更多!
相關閱讀 Relate
最新文章 Recent
熱點文章 Recent
- 一帶一路官方譯法并不是“O 10-31
- 小語種中不可翻譯的詞語有哪 10-10
- CATTI三級筆譯能接活兒 11-18
- 女翻譯一般工資多少呢?高不 11-14
- 會展的主辦方、承辦方、協(xié)辦 01-18
- 英文論文(外文文獻)翻譯成 10-29
- 在翻譯過程中會遇到哪些困難 10-28
- 翻譯官是什么職業(yè)_現(xiàn)場翻譯 11-13
- 中文翻譯蒙古文_在線蒙語翻 06-19
- MTPE是什么翻譯模式 05-07