唐能翻譯牛:
術(shù)語提取和管理是翻譯工作中非常重要的一個環(huán)節(jié), 如何正確地提取術(shù)語, 我們看看Tmxmall的一者君是如何說的。
一者君在前幾期教程中介紹了如何利用MultiTerm新建術(shù)語庫,添加、批量導(dǎo)入與導(dǎo)出術(shù)語,那么如何在現(xiàn)有文檔中如何提取出術(shù)語呢?這就需要用到MultiTerm中的一款配套工具——SDL MultiTerm Extract。利用該款軟件,我們可以從翻譯文檔或翻譯記憶庫中根據(jù)自身的需要提取出術(shù)語,構(gòu)建自己的術(shù)語表。下面我們以國務(wù)院2017年政府工作報告雙語翻譯記憶庫為例,為大家展示雙語的術(shù)語提取。
step
1
打開SDL Multiterm Extract后,點擊File→New Project來新建項目,并選擇所要創(chuàng)建的項目類型,為項目命名并選擇存放路徑,項目默認(rèn)存儲在SDL Multiterm Extract文件夾里的Extract Projects中。
單語術(shù)語提取項目:提取一個或多個單語文檔中的術(shù)語
雙語術(shù)語提取項目:從雙語文檔中提取出雙語對照的術(shù)語
翻譯項目:用來翻譯現(xiàn)有術(shù)語庫中的術(shù)語,所以創(chuàng)建這個項目時本身要有術(shù)語庫
QA項目:這個項目可以幫助你檢測文檔或術(shù)語庫中術(shù)語的使用情況,評估和改進這些術(shù)語翻譯的質(zhì)量。
詞典編譯項目:從雙語平行文本中提取出詞典。
我們?nèi)粘3J褂玫膭t是前兩種項目類型;
step
2
點擊下一步,可以選擇術(shù)語庫。創(chuàng)建翻譯項目和QA項目時必須有術(shù)語庫,而提取單語術(shù)語和雙語術(shù)語則無需選擇術(shù)語庫,只需選擇源語言和目標(biāo)語言即可;
step
3
點擊下一步,點擊Browse添加待提取術(shù)語的文件;
step
4
點擊下一步,進入排除術(shù)語的向?qū)Ы缑妗N覀兛梢赃x擇“Exclude termbase”,排除某個已有術(shù)語庫中的術(shù)語,也可以選擇“Exclude file”排除自己動手創(chuàng)建的排除詞匯或術(shù)語的文件。如果不希望排除,也可以直接略過此步驟。我們選擇排除MlutiTerm自帶的樣本術(shù)語庫基本詞匯;
step
5
點擊下一步,彈出“Term extraction settings”界面。這里可以根據(jù)自己的需要設(shè)置術(shù)語短、長有幾個單詞,提取術(shù)語的很大數(shù)量,以及噪音值調(diào)整。Silence值越高,提取的術(shù)語數(shù)量相對較少,質(zhì)量越高;Noise值越高,則提取出的術(shù)語數(shù)量較多,質(zhì)量相對較低。我們這里舉例來將2個單詞以上5個單詞以下(包含兩個單詞和五個單詞的詞語)的詞語提取出來作為術(shù)語;并把噪音值調(diào)高,以便擴大提取術(shù)語的范圍。
設(shè)置完成后,點擊“Stopword Lists”,加載原文和譯文的停用詞表;
停用詞指的是計算機進行檢索時自動過濾到的一些虛詞和非檢索詞,這些詞大多沒有實際語意。MultiTerm里為我們提供部分語種的停用詞表,而中文的停用詞表則需要我們根據(jù)需要自行去網(wǎng)上搜索。
step
6
點擊下一步,設(shè)置詞頻,然后點擊下一步至完成,完成項目創(chuàng)建。
step
7
確認(rèn)提取后,彈出確認(rèn)提取術(shù)語界面;系統(tǒng)過自動基于上述制定的規(guī)則進行初步術(shù)語提取。
step
8
初步提取完成之后,右擊鼠標(biāo),可對提取的候選術(shù)語進行編輯并刪除無用、提取錯誤的詞組;點擊“Concordance”還可以查看術(shù)語在翻譯記憶庫中的句對語境??稍谏戏健癋ilter”對術(shù)語進行過濾顯示。
step
9
完成步驟之后,即可對術(shù)語進行導(dǎo)出。點擊file→Export,選擇需要導(dǎo)出的格式??蛇x擇導(dǎo)出到現(xiàn)有術(shù)語庫中、xml術(shù)語庫文件及左右兩列(Tab delimited)的txt文本文檔,點擊下一步,選擇導(dǎo)出存放路徑。之后一路下一步直至完成即可。這樣,術(shù)語提取就全部完成了,可以將制作完成的術(shù)語導(dǎo)入術(shù)語庫或Trados中進行使用了。
單語術(shù)語的操作流程與提取雙語的操作流程相同,只需在新建項目時選擇單語術(shù)語提取項目即可。
在翻譯記憶庫中提取雙語術(shù)語時,還有更簡單的方式哦。Tmxmall與語智云帆術(shù)語寶強強聯(lián)合,您只需訪問Tmxmall在線對齊(http://www.tmxmall.com/aligner),選擇單文檔對齊將tmx文件導(dǎo)入,然后點擊“提取術(shù)語”,設(shè)置詞頻、源語言和目標(biāo)語言。系統(tǒng)會自動根據(jù)智能算法為您提取術(shù)語哦??芍苯釉诰W(wǎng)頁上對術(shù)語進行編輯與刪除。提取后的術(shù)語可選擇導(dǎo)出下載Excel表格、同步到Tmxmall私有云術(shù)語庫或術(shù)語寶中哦。
溫馨提示:術(shù)語提取頁面有可能被瀏覽器攔截,請在提取前將瀏覽器設(shè)置中“廣告過濾”關(guān)閉,谷歌Chrome瀏覽器在“設(shè)置-隱私設(shè)置-內(nèi)容設(shè)置”中選擇“允許彈出新彈窗”即可。
本文轉(zhuǎn)自:tmxmall(微信公眾號ID: tmxmall),歡迎前往訂閱!