建設(shè)生態(tài)環(huán)境行業(yè)大模型,加快數(shù)字生態(tài)文明建設(shè)

秦超     2025-02-08 16:01:29

生態(tài)環(huán)境行業(yè)大模型(以下簡稱大模型)可對水質(zhì)實(shí)時(shí)監(jiān)測并分析相關(guān)數(shù)據(jù),有效提高污水處理效率和資源回用率,而這只是大模型助力科學(xué)治污等業(yè)務(wù)應(yīng)用場景中的一個(gè)。

當(dāng)前,數(shù)據(jù)分析模型、AI應(yīng)用蓬勃發(fā)展,為什么需要建設(shè)生態(tài)環(huán)境行業(yè)大模型?大模型是否能滿足生態(tài)環(huán)境行業(yè)各類復(fù)雜、多元且專業(yè)的業(yè)務(wù)化需求?

打造大模型庫,構(gòu)建數(shù)字生態(tài)文明基座

“大模型的發(fā)展,將推動(dòng)各類AI應(yīng)用在更廣泛領(lǐng)域創(chuàng)新應(yīng)用?!鄙鷳B(tài)環(huán)境部信息中心大數(shù)據(jù)發(fā)展部主任,國家重點(diǎn)研發(fā)項(xiàng)目“基于生態(tài)環(huán)境大模型的土壤地下水監(jiān)測監(jiān)管與風(fēng)險(xiǎn)預(yù)計(jì)體系”首席科學(xué)家黃明祥博士說,其深度學(xué)習(xí)的技術(shù)特點(diǎn),使之具備了龐大的參數(shù)規(guī)模和復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),因而能夠處理更加復(fù)雜的任務(wù)。

大模型的發(fā)展,是AI不斷進(jìn)步的縮影。隨著AlexNet在圖像識別上的成功,視覺技術(shù)在目標(biāo)識別和目標(biāo)檢測等方面日趨成熟,而深度學(xué)習(xí)技術(shù)的進(jìn)一步發(fā)展,特別是Transformer架構(gòu)的提出,使得大語言模型(LLM)也取得了突破,BERT、GPT等模型在語言理解、翻譯、文本生成等方面展現(xiàn)出了強(qiáng)大能力,并成為AI 發(fā)展的關(guān)鍵驅(qū)動(dòng)器。當(dāng)前,全球范圍內(nèi)已涌現(xiàn)出了諸如ChatGPT、Claude、通義千問、訊飛星火、ChatGLM等眾多通用大模型,特別是DeepSeek國產(chǎn)自主大模型以其高性能、低成本、強(qiáng)推理優(yōu)異表現(xiàn),打破國外技術(shù)封鎖,成為當(dāng)前國內(nèi)外關(guān)注的焦點(diǎn)。

“但通用大模型對行業(yè)專有知識的掌握存在局限?!秉S明祥說。

通用大模型強(qiáng)調(diào)具備提供高效且共性化服務(wù)的能力,但面對行業(yè)專有知識,仍然面臨不熟悉相關(guān)法律法規(guī)和標(biāo)準(zhǔn)、難以準(zhǔn)確把握各種指標(biāo)的具體含義等困境。

“不僅如此,各地生態(tài)環(huán)境系統(tǒng)的數(shù)字化發(fā)展水平不均衡,相互間的數(shù)據(jù)模型、AI應(yīng)用也難以打通,這為全國數(shù)字生態(tài)文明建設(shè)帶來阻礙?!秉S明祥說,我們的辦法是充分解耦,即把各類模型、數(shù)據(jù)庫拆分成通用的基礎(chǔ)單元提高其互通性,在經(jīng)過深入優(yōu)化調(diào)整和訓(xùn)練后,搭建起來大模型的基礎(chǔ)設(shè)施和開放平臺(tái)。

目前,大模型已搭建完成基礎(chǔ)模型庫,可涵蓋通用大模型、代碼大模型、向量模型、語音模型、OCR大模型等。2024年7月3日,由生態(tài)環(huán)境部信息中心與浙江省生態(tài)環(huán)境廳在浙江杭州宣布生態(tài)環(huán)境大數(shù)據(jù)創(chuàng)新應(yīng)用研究示范基地成立,旨在進(jìn)一步深化生態(tài)環(huán)境大數(shù)據(jù)應(yīng)用。隨后,生態(tài)環(huán)境部信息中心還陸續(xù)在廣東省廣州市、陜西省西安市不斷深化生態(tài)環(huán)境信息化頂層設(shè)計(jì),推動(dòng)生態(tài)環(huán)境數(shù)字化治理應(yīng)用場景創(chuàng)新。

在此基礎(chǔ)上,各地已經(jīng)開發(fā)應(yīng)用的人工智能(AI)、智能模型和生態(tài)環(huán)境數(shù)據(jù)都可以無縫并入大模型,而各級生態(tài)環(huán)境主管部門也可在此基礎(chǔ)上專注業(yè)務(wù)水平提高,開發(fā)符合各自業(yè)務(wù)需求的行業(yè)應(yīng)用。

豐富的數(shù)據(jù)、實(shí)際的應(yīng)用經(jīng)驗(yàn),是大模型發(fā)展迭代的關(guān)鍵。黃明祥說:“為實(shí)現(xiàn)能力共建、數(shù)據(jù)資源共用以及業(yè)務(wù)領(lǐng)域共贏,降低重復(fù)建設(shè)成本,我們邀請了科研院所及工程單位等組成研發(fā)專家團(tuán)隊(duì),推動(dòng)生態(tài)環(huán)境行業(yè)內(nèi)相關(guān)企事業(yè)單位、科研院所之間互聯(lián)互通?!?/p>

“大模型的‘基座’作用,將為生態(tài)環(huán)境全行業(yè)打造一個(gè)開放、互聯(lián)、智能的生態(tài)環(huán)境數(shù)字化生態(tài)系統(tǒng),加快全國數(shù)字生態(tài)文明建設(shè)?!鄙鷳B(tài)環(huán)境大數(shù)據(jù)創(chuàng)新基地負(fù)責(zé)人王健說,目前大模型已經(jīng)進(jìn)入技術(shù)驗(yàn)證階段并將于近期投入試運(yùn)行。

數(shù)據(jù)分層、分類,實(shí)現(xiàn)生態(tài)環(huán)境全行業(yè)梯級利用

大模型旨在構(gòu)建一個(gè)全面、高效的生態(tài)環(huán)境數(shù)據(jù)處理、溯源推理和智能協(xié)作平臺(tái),及周邊生態(tài)應(yīng)用和系統(tǒng),“將形成知識驅(qū)動(dòng)業(yè)務(wù)應(yīng)用的生態(tài)環(huán)境領(lǐng)域典型模式”。黃明祥說。

目前,環(huán)評領(lǐng)域、執(zhí)法領(lǐng)域、第三方服務(wù)監(jiān)管、智能環(huán)保設(shè)備研究、綠色智慧產(chǎn)業(yè)發(fā)展、標(biāo)準(zhǔn)規(guī)范適用性審查、安全、運(yùn)維等行業(yè)應(yīng)用及端側(cè)設(shè)備、綠色產(chǎn)業(yè)等,都已納入了生態(tài)環(huán)境大模型的頂層規(guī)劃,并形成了“1+5+N”整體架構(gòu)。“后續(xù),可根據(jù)不同行政層級,開發(fā)不同的業(yè)務(wù)場景應(yīng)用?!秉S明祥說。

“1+5+N”的規(guī)劃布局中,“1”指以網(wǎng)絡(luò)支撐和算力支撐為基礎(chǔ),構(gòu)建一套生態(tài)環(huán)境基礎(chǔ)設(shè)施平臺(tái);“5”指規(guī)劃并逐步建設(shè)生態(tài)數(shù)據(jù)中心、能力研發(fā)平臺(tái)、資源集成平臺(tái)、服務(wù)集成平臺(tái)、服務(wù)共享平臺(tái)等五大核心平臺(tái),作為架構(gòu)的基座;“N”則指在此基礎(chǔ)上,打造案卷評查、數(shù)字環(huán)評、智能問答、精準(zhǔn)問數(shù)、文書生成等眾多基礎(chǔ)應(yīng)用及行業(yè)應(yīng)用,以滿足多樣化的業(yè)務(wù)需求。

比如,執(zhí)法案卷評查任務(wù)量龐大、質(zhì)量不一,且存在人工抽查局限性、個(gè)人主觀判斷偏差、評審規(guī)則與法律標(biāo)準(zhǔn)變動(dòng)頻繁等問題。通過生態(tài)環(huán)境大模型的 AI智能識別案卷功能,包括結(jié)構(gòu)化信息精確提取、長文本語義信息的深度解析與提取、手寫字體及印章信息有效識別,與人工審查相結(jié)合,提升案卷質(zhì)量評估工作的效率與成效,發(fā)揮事前預(yù)防、事中控制、事后監(jiān)督的綜合管理職能。

再如,通過開發(fā)特定領(lǐng)域的智能體,利用AI技術(shù)自動(dòng)讀取數(shù)據(jù),調(diào)用相關(guān)領(lǐng)域的專業(yè)模型,并結(jié)合外部典型案例數(shù)據(jù)集與歷史趨勢演變分析,可提出最有可能的根因分析結(jié)果。在應(yīng)用中加強(qiáng)專業(yè)模型微調(diào)、典型案例及歷史經(jīng)驗(yàn)的持續(xù)學(xué)習(xí)與優(yōu)化,智能體將有望成為科學(xué)治污的智能決策核心。

“下一步,大模型將協(xié)調(diào)更多算力資源并規(guī)劃利用智算平臺(tái),實(shí)現(xiàn)各類算力資源的有效整合與容器化部署管理?!秉S明祥說。

“生態(tài)環(huán)境大模型的順利運(yùn)行,不僅有助于整合海量生態(tài)環(huán)境數(shù)據(jù),為科學(xué)決策和精細(xì)化管理提供支撐,還將幫助更好地理解和應(yīng)對氣候變化條件下的生態(tài)環(huán)境變化,助力構(gòu)建監(jiān)管聯(lián)動(dòng)的調(diào)度體系,進(jìn)而服務(wù)生態(tài)環(huán)境全行業(yè)業(yè)務(wù)需求?!蓖踅≌f。

責(zé)編:肖靜

一審:肖靜

二審:張馬良

三審:熊佳斌

我要問