您的位置: 首頁(yè) > 新聞 > 時(shí)事焦點(diǎn) > 新聞詳情

機(jī)翻勝人工?谷歌用算法和大數(shù)據(jù)取代語(yǔ)言學(xué)家

時(shí)間:2013-09-25 21:30:09
  • 來(lái)源:互聯(lián)網(wǎng)
  • 作者:ishmael
  • 編輯:ChunTian

 

你能想象一個(gè)致力于打破語(yǔ)言障礙的項(xiàng)目小組里竟然沒(méi)有一位語(yǔ)言學(xué)家嗎?但是谷歌就是這么做了,這家公司打算依靠算法和大數(shù)據(jù)最終“干掉”語(yǔ)言學(xué)家。

谷歌是一家極度看重算法、充滿工程師文化的公司,但或許你還是會(huì)為此而感到驚奇——他們認(rèn)為翻譯是一個(gè)數(shù)學(xué)和統(tǒng)計(jì)學(xué)方面的問(wèn)題。最近,位于谷歌總部的谷歌翻譯團(tuán)隊(duì)正迅速擴(kuò)張,他們新招了數(shù)名德國(guó)計(jì)算機(jī)科學(xué)家,但卻沒(méi)有招收一名語(yǔ)言學(xué)家。

谷歌翻譯部門主管Franz Josef Och同樣也是德國(guó)計(jì)算機(jī)科學(xué)家出身,他不但并不精通語(yǔ)言學(xué),甚至并不擅長(zhǎng)語(yǔ)言學(xué)習(xí)。他認(rèn)為,機(jī)翻的關(guān)鍵在對(duì)數(shù)學(xué)、統(tǒng)計(jì)和編程方面的擅長(zhǎng)。

谷歌翻譯團(tuán)隊(duì)并不會(huì)去模仿人工翻譯的方式,這就是他們沒(méi)有去開(kāi)發(fā)字典、定義語(yǔ)法結(jié)構(gòu)和規(guī)則的原因。事實(shí)上,語(yǔ)法規(guī)則對(duì)目前的計(jì)算機(jī)來(lái)說(shuō)仍然難以掌控。谷歌更著重于以大數(shù)據(jù)和統(tǒng)計(jì)的方式入手,翻譯系統(tǒng)會(huì)不斷地調(diào)整翻譯結(jié)果的相關(guān)性并自我學(xué)習(xí)如何處理數(shù)十億的文字。通過(guò)這種方式,計(jì)算機(jī)最終能不斷優(yōu)化翻譯結(jié)果。

以大數(shù)據(jù)方式做翻譯的一個(gè)好處是,翻譯系統(tǒng)會(huì)隨著數(shù)據(jù)的積累而不斷地改善。谷歌翻譯目前已經(jīng)支持71種語(yǔ)言的互譯,去年用戶的使用次數(shù)已經(jīng)達(dá)到2億次。此外,索引全球網(wǎng)頁(yè)的谷歌還能夠依靠互聯(lián)網(wǎng)上已經(jīng)存在的翻譯內(nèi)容改善自己的翻譯系統(tǒng)。

盡管如此,依賴算法的翻譯系統(tǒng)仍然遠(yuǎn)遠(yuǎn)無(wú)法做到像人工翻譯那么精準(zhǔn)。句法、語(yǔ)調(diào)、歧義都是自動(dòng)翻譯軟件很難處理的問(wèn)題。谷歌翻譯的翻譯結(jié)果仍然只能幫助人們對(duì)陌生語(yǔ)言進(jìn)行大致上的理解,有時(shí)候得到的翻譯結(jié)果很難讓人通順地閱讀下來(lái)。

此外,谷歌翻譯在不同的語(yǔ)系之間的翻譯結(jié)果質(zhì)量也各不相同。例如,英語(yǔ)和西班牙語(yǔ)之間的互譯翻譯質(zhì)量良好,英語(yǔ)和日語(yǔ)之間的互譯不怎么樣,英語(yǔ)和德語(yǔ)之間的互譯則非常糟糕。

盡管如此,機(jī)翻有一個(gè)人工翻譯難以做到的優(yōu)勢(shì)——它讓更多的人接觸到了更多的信息。試想一下如果你舉著手機(jī)就可以與世界上任何語(yǔ)種的任何人交流,那會(huì)是多么棒的體驗(yàn)。

0

玩家點(diǎn)評(píng) 0人參與,0條評(píng)論)

收藏
違法和不良信息舉報(bào)
分享:

熱門評(píng)論

全部評(píng)論

他們都在說(shuō) 再看看
3DM自運(yùn)營(yíng)游戲推薦 更多+