原著論文不該成為訓(xùn)練人工智能的免費(fèi)工具

  南方都市報(bào)   2024-08-18 08:06:34

日前,知網(wǎng)警告AI搜索初創(chuàng)公司秘塔科技,未經(jīng)許可在AI搜索結(jié)果中呈現(xiàn)學(xué)術(shù)文獻(xiàn)題目、目錄及摘要內(nèi)容,構(gòu)成嚴(yán)重侵權(quán)。對(duì)此,秘塔科技表示疑惑和不理解。此外,國(guó)際著名期刊《自然》(《Nature》)雜志編輯伊麗莎白?吉普尼最近在一篇文章中指出,當(dāng)前有越來(lái)越多的學(xué)術(shù)出版商正在將研究論文授權(quán)給科技公司,用于訓(xùn)練人工智能模型。有學(xué)術(shù)出版商借此賺取了2300萬(wàn)美元,而作者卻收入為零。

人工智能日漸成為眾人所皆知的新鮮事物和先進(jìn)技術(shù)。大語(yǔ)言模型(LLM)通常依賴從互聯(lián)網(wǎng)上抓取的大量數(shù)據(jù)進(jìn)行訓(xùn)練。學(xué)術(shù)論文因其內(nèi)容豐富、信息密度高,相比大量普通數(shù)據(jù)更有價(jià)值,是AI訓(xùn)練中的重要數(shù)據(jù)來(lái)源。

這看似比較正常,畢竟,引用前人研究成果能增強(qiáng)論文的說(shuō)服力和可信度,參考文獻(xiàn)也是一篇合格的學(xué)術(shù)論文必不可少的部分。但這一現(xiàn)象實(shí)際涉及到嚴(yán)肅的知識(shí)產(chǎn)權(quán)問(wèn)題。根據(jù)《著作權(quán)法》,著作權(quán)人對(duì)作品享有發(fā)表權(quán)、署名權(quán)、發(fā)行權(quán)、保護(hù)作品完整權(quán)、信息網(wǎng)絡(luò)傳播權(quán)、改編權(quán)、匯編權(quán)等權(quán)利。作者授權(quán)的出版社也享有相應(yīng)的權(quán)利。

當(dāng)然,著作權(quán)也受到相應(yīng)的限制。具有相應(yīng)情形的,使用作品是可以不向作者支付報(bào)酬,但應(yīng)當(dāng)指明作者姓名或者名稱、作品名稱。如為個(gè)人學(xué)習(xí)、研究或者欣賞,使用他人已經(jīng)發(fā)表的作品;為介紹、評(píng)論某一作品或者說(shuō)明某一問(wèn)題,在作品中適當(dāng)引用他人已經(jīng)發(fā)表的作品;為報(bào)道新聞,在報(bào)紙、期刊、廣播電臺(tái)、電視臺(tái)等媒體中不可避免地再現(xiàn)或者引用已經(jīng)發(fā)表的作品;為學(xué)校課堂教學(xué)或者科學(xué)研究,翻譯、改編、匯編、播放或者少量復(fù)制已經(jīng)發(fā)表的作品,供教學(xué)或者科研人員使用;圖書(shū)館、檔案館等為陳列或者保存版本的需要,復(fù)制本館收藏的作品;免費(fèi)表演已經(jīng)發(fā)表的作品,該表演未向公眾收取費(fèi)用,也未向表演者支付報(bào)酬,且不以營(yíng)利為目的。

由上可知,合理使用他人的作品,應(yīng)具有公益性和非營(yíng)利性。如果基于營(yíng)利目的而“免費(fèi)”使用他人的作品,顯然構(gòu)成侵權(quán)。就以訓(xùn)練人工智能為例,企業(yè)訓(xùn)練人工智能的目的是提高商業(yè)價(jià)值,以便在激烈的市場(chǎng)競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì)。當(dāng)然,如果注明了作者,為網(wǎng)絡(luò)用戶提供搜索服務(wù)時(shí)也鏈接了原文,提升了原文的知名度、下載量和引用量,則屬于合理使用,不構(gòu)成侵權(quán)。

需要說(shuō)明的是,雖然一些期刊和出版社已經(jīng)“買斷”了版權(quán),注明出版社有發(fā)表權(quán)和傳播權(quán),但不代表出版社具有完全取代作者的權(quán)利??傮w上看,訓(xùn)練人工智能有利于科技進(jìn)步,但相關(guān)公司不能因此免費(fèi)地、毫無(wú)限制地使用作品,仍應(yīng)在《著作權(quán)法》框架內(nèi)運(yùn)行,不能打著科技創(chuàng)新的旗號(hào)侵權(quán)。

文|史洪舉

責(zé)編:李傳新

一審:李傳新

二審:段涵敏

三審:楊又華

來(lái)源:南方都市報(bào)

我要問(wèn)