機(jī)器翻譯能幫你多少?行業(yè)數(shù)據(jù)趨勢(shì)
所在位置: 翻譯公司 > 新聞資訊 > 行業(yè)新聞 / 日期:2017-08-31 13:48:53 / 來源:網(wǎng)絡(luò)
云翻譯平臺(tái)的一個(gè)優(yōu)點(diǎn)是數(shù)據(jù)集中。這就意味著可以俯瞰某些語言行業(yè)數(shù)據(jù)趨勢(shì),如機(jī)器翻譯 ( MT ) 的用法及有效性。目前,大數(shù)據(jù)只是剛剛滲透進(jìn)入翻譯工具中,開發(fā)人員仍在學(xué)習(xí)如何使用它。我相信,未來所有的云工具都將會(huì)基于用戶統(tǒng)計(jì)信息開發(fā)分析和預(yù)測(cè)功能,類似于自由職業(yè)市場(chǎng)Upwork那樣在特定領(lǐng)域中,遴選出頂尖 10% 的自由職業(yè)者。然而,現(xiàn)在我們已經(jīng)可以做的是發(fā)現(xiàn)有用趨勢(shì),證實(shí)假設(shè),破除迷信。
作為一名研究人員,我很高興在本年初將數(shù)據(jù)工具引入到了 Memsource 中。以下是一些我們努力收集的此行業(yè)數(shù)據(jù)集合中值得注意的信息。
機(jī)器翻譯杠桿:只有 5-20% 的機(jī)器翻譯結(jié)果是可以直接使用的
為了第一個(gè)研究,我和同事決定觀測(cè)機(jī)器翻譯,以評(píng)估它能在多大程度上幫助專業(yè)譯者。行業(yè)研究機(jī)構(gòu)調(diào)查指出,多達(dá) 30% 的翻譯公司使用機(jī)器翻譯。這點(diǎn)不難理解:目前稅前利潤(rùn)如此之低,企業(yè)希望努力節(jié)省每一分成本,提升利益能力。同時(shí),在很多翻譯對(duì)話論壇中,譯者集體抵制機(jī)器翻譯的怒火足以融化鍵盤。
我瀏覽了收集到的數(shù)據(jù),看它們是否可以為雙方各自的主張?zhí)峁┲С帧?/p>
分析顯示,只有5-20%的原生機(jī)器翻譯結(jié)果好得無需任何更改即可使用。多達(dá)40%的機(jī)器翻譯結(jié)果,在經(jīng)過編輯后可以使用,在80%的翻譯語段中,機(jī)器翻譯可以自動(dòng)填充數(shù)據(jù)。
在上面的圖表中(點(diǎn)擊圖片放大),匹配率表示譯文和機(jī)器翻譯引擎所給建議之間的相似性:
- 匹配率 100%:專業(yè)人工翻譯與機(jī)器翻譯所給建議完全相同的語段
- 匹配率 85-95%:機(jī)器翻譯結(jié)果在編輯后足以采用。
- 匹配率 50-75%:機(jī)器翻譯對(duì)于單個(gè)字詞的自動(dòng)填充很有用,但不適用于整個(gè)語段
- 匹配率 0 表示:語段與人工翻譯結(jié)果的相關(guān)性只有 0-49%
請(qǐng)注意:只能跟蹤用戶首次啟用機(jī)器翻譯的項(xiàng)目,然后進(jìn)行譯后編輯之后再分析。這意味著,這里的樣本約有 3800 萬單詞。
機(jī)器翻譯在翻譯法語、英語、西班牙語、葡萄牙語時(shí)可更好地發(fā)揮作用
數(shù)據(jù)結(jié)果表明,法語,葡萄牙語,西班牙語和英語機(jī)器翻譯引擎具有最高的潛在機(jī)器翻譯利用率。英譯法的翻譯質(zhì)量尤其突出,其中超過 20% 的翻譯是完全匹配機(jī)器翻譯所給建議,幾乎90%的語段與機(jī)器翻譯結(jié)果有一定相似性。
相比之下,俄語,波蘭語和韓語的利用率很低,模糊匹配低于 40%,甚至 20%,完全匹配只有 5%。
這種差異的出現(xiàn)可能和語言的類型分類有關(guān)。法語,葡萄牙語,西班牙語和英語是分析型語言,就是說這些語言依賴于詞序以及例如是或?qū)⑦@樣的輔助詞來傳達(dá)意思。另一方面,俄語,波蘭語和韓語是綜合型的,就是說這些語言更多地使用屈折變化。機(jī)器翻譯仍然致力于處理那些細(xì)微差別。
32% 的項(xiàng)目使用機(jī)器翻譯
正如在其他CAT工具中一樣,在 Memsource 中,用戶可以添加機(jī)器翻譯引擎,以便在逐段瀏覽文本時(shí)快速獲得參考譯文。這個(gè)過程稱為交互式機(jī)器翻譯譯后編輯,這與傳統(tǒng)譯后編輯的區(qū)別在于譯者不必每段都使用機(jī)器翻譯。如果機(jī)器翻譯錯(cuò)誤較多,他們就重新翻譯。
在機(jī)器翻譯引擎的選擇上,譯者通常使用通用引擎,比如谷歌翻譯或微軟翻譯。因此,本研究首先針對(duì)此類引擎的翻譯效果,而非對(duì)特定術(shù)語和主題領(lǐng)域進(jìn)行微調(diào)的定制引擎的翻譯效果。
如上所述,不是每個(gè)人都喜愛機(jī)器翻譯。譯者和語言服務(wù)公司認(rèn)為,機(jī)器翻譯有時(shí)會(huì)降低翻譯質(zhì)量或干擾譯者的注意力和自制力,這樣不利于譯者追求完美的譯文。Memsource 中只有約32%的項(xiàng)目啟用了機(jī)器翻譯。這個(gè)數(shù)字之所以有這么高,也是因?yàn)闄C(jī)器翻譯的開啟選項(xiàng)被設(shè)置為默認(rèn)值。
報(bào)道顯示,大約兩年前,48% 的項(xiàng)目應(yīng)用了機(jī)器翻譯。從那時(shí)起,我們系統(tǒng)的平均翻譯量已經(jīng)從每月 1 億字增長(zhǎng)到 6-8 億字,而機(jī)器翻譯項(xiàng)目的份額卻下降了。我預(yù)測(cè),這意味著我們的譯者用戶群越來越能代表整個(gè)翻譯行業(yè)。Memsource 曾是幾個(gè)專業(yè)技術(shù)公司主導(dǎo)的翻譯工具,如今用戶遍布翻譯領(lǐng)域。這有助于說明百分比下降的原因。
接下來會(huì)如何?
MT 使用量會(huì)增加嗎?這是毫無疑問的。如今的在線對(duì)話需要快速翻譯。與高質(zhì)量相比,客戶需要的是更快的周轉(zhuǎn)時(shí)間。用 Facebook 的著名口號(hào)來說,就是比完美更重要的是完成。
與此同時(shí),機(jī)器翻譯的準(zhǔn)確度在不斷提高,然而仍然沒有達(dá)到人類的水準(zhǔn),但它正在朝此方向進(jìn)步。因此,也就有了更多關(guān)于啟用機(jī)器翻譯的爭(zhēng)論。
以上內(nèi)容是收集的數(shù)據(jù)中的一些發(fā)現(xiàn)。我們期待在未來幾個(gè)月能分享更多!
相關(guān)閱讀 Relate
最新文章 Recent
熱點(diǎn)文章 Recent
- 一帶一路官方譯法并不是“O 10-31
- 小語種中不可翻譯的詞語有哪 10-10
- CATTI三級(jí)筆譯能接活兒 11-18
- 女翻譯一般工資多少呢?高不 11-14
- 會(huì)展的主辦方、承辦方、協(xié)辦 01-18
- 英文論文(外文文獻(xiàn))翻譯成 10-29
- 在翻譯過程中會(huì)遇到哪些困難 10-28
- 翻譯官是什么職業(yè)_現(xiàn)場(chǎng)翻譯 11-13
- 中文翻譯蒙古文_在線蒙語翻 06-19
- MTPE是什么翻譯模式 05-07