湖南科技大學(xué) 2021-07-02 15:53:54
近日,湖南科技大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院王曉亮教授指導(dǎo)的本科生團(tuán)隊(duì)經(jīng)過(guò)對(duì)機(jī)器翻譯算法的改良研究,提出了一種使用隱馬爾科夫模型的翻譯改進(jìn)算法。算法通過(guò)雙重使用隱馬爾科夫模型中的Viterbi算法,提高了翻譯過(guò)程中的上下文相關(guān)性。
依照上述算法,在一個(gè)連貫的文檔中對(duì)每一條句子制定一個(gè)主題,則連貫的文檔就可以被描述為一條句子主題序列,同時(shí)每個(gè)主題之間相互聯(lián)系,主題變化連續(xù),主題之間可以構(gòu)成一個(gè)關(guān)系圖,則這種類(lèi)型的句子主題序列就被用來(lái)作為文檔的連貫鏈。最后在基于文檔相干鏈的統(tǒng)計(jì)機(jī)器翻譯相干捕獲框架上進(jìn)一步完善使之成為基于隱馬爾科夫模型的人工智能翻譯。在預(yù)翻譯階段,通過(guò)RNN(卷積神經(jīng)網(wǎng)絡(luò))對(duì)翻譯數(shù)據(jù)集進(jìn)行訓(xùn)練,得到的訓(xùn)練結(jié)果數(shù)據(jù)作為下一步Viterbi算法的輸入?yún)?shù)。在算法運(yùn)算之后,從籬笆網(wǎng)絡(luò)中選出路徑最小的序列,即最大概率可能出現(xiàn)的句子翻譯結(jié)果,再將所有生成的句子結(jié)果構(gòu)成一篇文章序列,結(jié)合對(duì)數(shù)據(jù)集訓(xùn)練后所得到的概率和文章序列,再次使用隱馬爾科夫模型中的Viterbi算法進(jìn)行運(yùn)算,從而形成最終的譯文。實(shí)驗(yàn)證明,這種算法不僅提高了翻譯的準(zhǔn)確性,避免了無(wú)效的單詞詞意組合,也增強(qiáng)了語(yǔ)句可讀性,使句意更加飽滿和精確。
這一研究成果發(fā)表在國(guó)際SCI權(quán)威期刊《Computers, Materials & Continua》(IF=4.89)上,文章第一作者為2018級(jí)信息安全專(zhuān)業(yè)本科生常云鵬,第三作者為2017級(jí)物聯(lián)網(wǎng)工程專(zhuān)業(yè)本科生薛梅花,通訊作者為湖南科技大學(xué)王曉亮教授,第一單位為湖南科技大學(xué),第二單位為澳大利亞迪肯大學(xué)。
計(jì)算機(jī)科學(xué)與工程學(xué)院自2018年試行本科生導(dǎo)師制以來(lái),確立“以學(xué)生為本”的教育教學(xué)理念,建立新型師生關(guān)系,以達(dá)到因材施教、個(gè)性化培養(yǎng)以及引導(dǎo)和激勵(lì)學(xué)生創(chuàng)新的目的。王曉亮教授指導(dǎo)的學(xué)生團(tuán)隊(duì)已經(jīng)獲得相關(guān)學(xué)科國(guó)家級(jí)競(jìng)賽12項(xiàng),省級(jí)競(jìng)賽24項(xiàng),發(fā)表國(guó)際SCI期刊論文5篇,軟件著作權(quán)12項(xiàng),發(fā)明專(zhuān)利2項(xiàng),保送研究生4人。
該文章的標(biāo)題: Improving Language Translation Using the Hidden Markov Model.
該文章的鏈接:https://www.techscience.com/cmc/v67n3/41567
責(zé)編:胡孟婷
來(lái)源:湖南科技大學(xué)
我要問(wèn)