湖南科技大學 2021-07-02 15:53:54
近日,湖南科技大學計算機科學與工程學院王曉亮教授指導的本科生團隊經(jīng)過對機器翻譯算法的改良研究,提出了一種使用隱馬爾科夫模型的翻譯改進算法。算法通過雙重使用隱馬爾科夫模型中的Viterbi算法,提高了翻譯過程中的上下文相關性。
依照上述算法,在一個連貫的文檔中對每一條句子制定一個主題,則連貫的文檔就可以被描述為一條句子主題序列,同時每個主題之間相互聯(lián)系,主題變化連續(xù),主題之間可以構成一個關系圖,則這種類型的句子主題序列就被用來作為文檔的連貫鏈。最后在基于文檔相干鏈的統(tǒng)計機器翻譯相干捕獲框架上進一步完善使之成為基于隱馬爾科夫模型的人工智能翻譯。在預翻譯階段,通過RNN(卷積神經(jīng)網(wǎng)絡)對翻譯數(shù)據(jù)集進行訓練,得到的訓練結果數(shù)據(jù)作為下一步Viterbi算法的輸入?yún)?shù)。在算法運算之后,從籬笆網(wǎng)絡中選出路徑最小的序列,即最大概率可能出現(xiàn)的句子翻譯結果,再將所有生成的句子結果構成一篇文章序列,結合對數(shù)據(jù)集訓練后所得到的概率和文章序列,再次使用隱馬爾科夫模型中的Viterbi算法進行運算,從而形成最終的譯文。實驗證明,這種算法不僅提高了翻譯的準確性,避免了無效的單詞詞意組合,也增強了語句可讀性,使句意更加飽滿和精確。
這一研究成果發(fā)表在國際SCI權威期刊《Computers, Materials & Continua》(IF=4.89)上,文章第一作者為2018級信息安全專業(yè)本科生常云鵬,第三作者為2017級物聯(lián)網(wǎng)工程專業(yè)本科生薛梅花,通訊作者為湖南科技大學王曉亮教授,第一單位為湖南科技大學,第二單位為澳大利亞迪肯大學。
計算機科學與工程學院自2018年試行本科生導師制以來,確立“以學生為本”的教育教學理念,建立新型師生關系,以達到因材施教、個性化培養(yǎng)以及引導和激勵學生創(chuàng)新的目的。王曉亮教授指導的學生團隊已經(jīng)獲得相關學科國家級競賽12項,省級競賽24項,發(fā)表國際SCI期刊論文5篇,軟件著作權12項,發(fā)明專利2項,保送研究生4人。
該文章的標題: Improving Language Translation Using the Hidden Markov Model.
該文章的鏈接:https://www.techscience.com/cmc/v67n3/41567
責編:胡孟婷
來源:湖南科技大學
我要問