首先說明下,語料庫全部詞條已經免費上傳至雲端,後續我們也將會一直保持開放狀態,至於獨立的資料詞庫 (.tmx) 翻譯記憶庫檔案,暫不提供公開連結下載,原因就不多說,繼續往下看。
此 WordPress 翻譯記憶庫中的全部詞條內容是由薇曉朵及文派翻譯 (WP Chinese Translation) 團隊提供。
一、如何獲取?
1 、如果你是教育或科研機構,可聯絡薇曉朵客服獲取免費版的 WordPress 行業中文 TMX 語料庫檔案 (近 25 萬詞條) 僅簡體,對於商業使用,只需告知具體用途和進行權利確認即可。
2 、如果你是商業組織及同行,我們接受專案合作及採購,WordPress 行業中文翻譯詞庫已有近百萬詞條語句 (僅簡體,含繁體為兩百多萬條),包含了薇曉朵 2012 ~ 2022 年這十年間的全部人工校對翻譯詞條。
商業翻譯包含了薇曉朵全部 WordPress 商業專案翻譯詞條,整體詞庫採購的基礎費用在五位數以上,如有需要,也可提供獨立翻譯系統和託管式長期訂閱服務,非誠勿擾。
3 、如果你是普通使用者和愛好者,那麼只需要下載 Poedit 軟體,按照正常工作步驟去翻譯你需要的主題外掛即可,不出意外,未來的一段時間裡,你能獲取到很多的精準翻譯建議詞條,大部分將會是來自文派翻譯。
二、為何釋出?
免費提供的語料庫是所有使用者都可以在 WordPress.org / WordPress 翻譯 (WPfanyi.com) 站點公開下載的免費主題、外掛的整體翻譯記憶語料庫。經過測試,新主題外掛翻譯的準確度可以達到 85% 以上相對來說質量還是不錯的,並且最重要的這是純淨且未被汙染的新資料庫。
對於普通使用者來說實際上影響並不大,我們做此次操作的目的在於去稀釋掉去年被破壞的 WordPress 線上協同詞庫,20 萬條詞庫說多不多,說少也不少,事實上,由於 WordPress 行業圈子太小,國內外也不會有第二個如此巨量且高精度的人工校對語料庫。
三、從何而來?
要說這麼多詞條 100% 都是薇曉朵原創翻譯的就有些吹噓了,也不切實際,100 多萬條詞庫大概有 60% 是源於過去十多年的人工翻譯積累,剩下的一些其實是透過收集和機器模糊翻譯+人工匹配而來,也就是說這裡面我們不會保證 100% 的精準度,但 85% 以上的準確度還是有的。
使用我們的翻譯記憶庫,如果是翻譯 WordPress 主題外掛的話,那麼過去人工手動需要 5 小時的工作,可能你在 5 分鐘內就能完成。
另外說下,去年我們關閉了商業翻譯庫的 WordPress 詞條貢獻後就已經自建了翻譯伺服器。
同時這次也思考權衡了很久,不公開語料庫的下載地址,是不想這次新貢獻的這 20 多萬條人工翻譯又被玩壞了,至於後續的翻譯效果和效率改善有無,我也就拭目以待吧。
發表回覆