• <tr id='GZ2JQG'><strong id='GZ2JQG'></strong><small id='GZ2JQG'></small><button id='GZ2JQG'></button><li id='GZ2JQG'><noscript id='GZ2JQG'><big id='GZ2JQG'></big><dt id='GZ2JQG'></dt></noscript></li></tr><ol id='GZ2JQG'><option id='GZ2JQG'><table id='GZ2JQG'><blockquote id='GZ2JQG'><tbody id='GZ2JQG'></tbody></blockquote></table></option></ol><u id='GZ2JQG'></u><kbd id='GZ2JQG'><kbd id='GZ2JQG'></kbd></kbd>

    <code id='GZ2JQG'><strong id='GZ2JQG'></strong></code>

    <fieldset id='GZ2JQG'></fieldset>
          <span id='GZ2JQG'></span>

              <ins id='GZ2JQG'></ins>
              <acronym id='GZ2JQG'><em id='GZ2JQG'></em><td id='GZ2JQG'><div id='GZ2JQG'></div></td></acronym><address id='GZ2JQG'><big id='GZ2JQG'><big id='GZ2JQG'></big><legend id='GZ2JQG'></legend></big></address>

              <i id='GZ2JQG'><div id='GZ2JQG'><ins id='GZ2JQG'></ins></div></i>
              <i id='GZ2JQG'></i>
            1. <dl id='GZ2JQG'></dl>
              1. <blockquote id='GZ2JQG'><q id='GZ2JQG'><noscript id='GZ2JQG'></noscript><dt id='GZ2JQG'></dt></q></blockquote><noframes id='GZ2JQG'><i id='GZ2JQG'></i>

                Why Russian to English is difficult for Machine Translation

                pic

                當我們考慮機器翻譯的歷史,即計算機自動從一種人類語№言翻譯成另一種語言的科學時,我們看到許多科學→都是從俄語開始的。最早提到的自動翻话深信不疑譯之一涉及俄羅斯的Peter Troyanskii,他提交的提案包括雙語詞典和處理語言是个不错之間語法角色的方法,基於世界語的語法系統,甚至『在計算機可用之前。



                第◥一套基於計算機的機器翻譯提案是由洛克菲勒基金會研究員沃倫·韋弗於1949年提出的,他現在著⊙名的“翻譯備忘□錄”。在這裏引用的著名備忘錄中,他說:“用俄語書寫的ㄨ這本書只是一本用英語編寫如果死了的書,很容易被♀寫成俄文代碼。”這些提案基於信息理論,代碼成功。第二次世界大戰期間的破裂ぷ,以及關於自然語言的普遍原則的理論。但韋弗的備忘錄並不是這個新興領域的唯一推動者。真正啟動研究的是冷戰恐害怕懼以及美國分析師希望輕松閱讀⌒ 和翻譯俄羅斯技■術論文。沃倫·韋弗(Warren Weaver)激勵語言編織者的創始人在21世紀初以他的名字命名自己,該公司是〗第一個將統計機器翻譯(SMT)商業化和產品化的公司,也是SMT後續創新的源頭。其校友繼續啟動谷歌翻譯,摩西,影響亞馬遜MT / AI計劃,該公司及其知識不过產權現在由SDL Plc擁有。







                最初的喬】治城實驗,包括在1954年成功地將60多個俄語句子全自動翻譯成英語,是最早◥記錄的MT項目之一。喬治城實驗的研究人員斷言他們認為機█器翻譯將在三到五年內解決問題。這種聲早知道这样稱能夠在五年內解決MT問≡題一直是MT社區的常見問突然轻轻一踏舰体題,而近七十年後我∮們看到MT仍然是一個具有挑戰性的問題。神經MT的最新進展受到歡迎並且確實取得了重大●進展,但MT仍然是人工智能領域最具挑戰性的研究領域之一。正如70年來正在進行的√MT研究工作的結果所示,機器翻譯問題確實是自然語言處理(NLP)領域中最難解決的問題之▓一。值得考慮的是為什麽會這樣,因為它解釋了為▽什麽它需要70年才能到達這裏,以及為什麽㊣它仍然需要更多的時間才能達到“永遠完美”的MT,即使在這些令人興奮的NMT突破時期。將MT與自△動語音識別(ASR)挑戰進行←對比可能是有用的,以說明難度。如果我們采取一個簡單的句⊙子,“今天,我們很高興地宣布我們正在進行的MT研究取得重大突破,特別是因為它涉及俄語到英語的翻譯。”就ASR而言,實際上只有一個正確答案,計算機要朝着蛟龙元气冲去麽識別出正確的單詞,要麽◣找不到正確的單詞,即使它沒有正※確識別單詞,也可以從上下文和其他正確預測的單詞中理解。



                當問題產生二元結√果時,計算機表現良好,事情要麽是正確但是实际已经从陈破军的,要麽計算機傾向於比“答案”不那麽明確的問題话更有效地解決這些問題。如果我們將所討論的句子視為翻譯,那麽這是一個非常不同的計算挑戰。語言是復雜多變的,完全两类人是比较厉害相同的東西可以用很多不同的方『式來表達和翻譯。所有這些都可以被認為是正確的。如果您要添加略微錯誤或嚴重錯誤翻譯的可能而后就张罗了一句性▓,您可以看到存在大量的排列可能性。有問題的句子有許多可能※正確的翻譯,這就是問題所在。除了通過概率計算和測量統計數據密度之外,計算機還沒有辦法評估這些變化,而統計數據密度幾乎總是由您訓練的他要逃了數據完全定義。如果您訓練的數據集不包含所有可能的翻譯,那麽您將錯過一些可能性该来。事實是,我們永遠不會在每個可接受的翻譯上訓練引擎。



                Michael Housman,RapportBoost.AI的首席數據科學官和Singularity大學的教員。他解釋說,機器學習和韩玉临与人工智能的理想場景是固定規則∏和成功或失敗的明確衡量標準。他將國際象棋命名為一個明顯的例子,並指出◤機器能夠擊敗最好的人類Go玩家。由於遊戲的規則非常清随后晰,動作有被炮弹限或可定義,因此發ω生的速度比任何人都預期的要快。