国产亚洲精品成人AA片_国产偷倩在线播放456_青娱乐国产手线观看视频_日本熟妇色xxxxx,_国产精品特黄一级国产大片_婷婷被公交车猛烈进出视频_国产桃色精品无码视频_日本久久久久久久久久加勒比 _亚洲综合久久成人A片红豆_亚洲中文无码国产

鐵甲工程機(jī)械網(wǎng)> 工程機(jī)械資訊> 行業(yè) > 大語言模型發(fā)展研究及其在防洪“四預(yù)”平臺(tái)智能交互的應(yīng)用探討

大語言模型發(fā)展研究及其在防洪“四預(yù)”平臺(tái)智能交互的應(yīng)用探討

語音播報(bào)
點(diǎn)擊播放

大語言模型發(fā)展研究及其在防洪“四預(yù)”平臺(tái)智能交互的應(yīng)用探討

Development of large language models and their application in intelligent interaction on the “four pres” platform

郭磊,馮鈞,直偉,周思源

(1.廣東省水利水電科學(xué)研究院,510635,廣州;2.河口水利技術(shù)國家地方聯(lián)合工程實(shí)驗(yàn)室,510635,廣州;3.廣東省粵港澳大灣區(qū)水安全保障工程技術(shù)研究中心,510635,廣州;4.河海大學(xué),211100,南京)

摘要:大語言模型(LLMs)是近年來人工智能領(lǐng)域的重大突破,依托Transformer架構(gòu)與自注意力機(jī)制,在超大規(guī)模參數(shù)下涌現(xiàn)出接近人類的自然語言理解能力,為人類認(rèn)知、思考、判斷和決策提供輔助。當(dāng)前大語言模型在垂直細(xì)分領(lǐng)域的應(yīng)用已成為熱點(diǎn),特別是基于MOE融合架構(gòu)的DeepSeek開源發(fā)布,為行業(yè)大模型應(yīng)用提供了更為便捷的技術(shù)路徑,進(jìn)一步推動(dòng)了相關(guān)研究熱潮?!八念A(yù)”是基于數(shù)字孿生水利建設(shè)的新型水利智能業(yè)務(wù)應(yīng)用,具有專業(yè)性強(qiáng)、業(yè)務(wù)鏈條長、系統(tǒng)架構(gòu)復(fù)雜等特點(diǎn),功能完備,但在易用性方面仍有優(yōu)化空間?;诖笳Z言模型的理解和推理能力分析,首次提出了大模型智能交互L0至L3級分類體系,以意圖識別和智能調(diào)用為切入點(diǎn),研究其支撐“四預(yù)”平臺(tái)的交互應(yīng)用場景和實(shí)現(xiàn)技術(shù)路徑,提出了通過優(yōu)化“預(yù)設(shè)內(nèi)容”和疊加具體問題增強(qiáng)大模型輸出確定性的方法,并在通用大模型上進(jìn)行測試,探索大模型智能調(diào)用“四預(yù)”平臺(tái)專業(yè)模型的路徑,為提升防洪“四預(yù)”的交互友好性提供了可行方案,同時(shí)也為大語言模型在水利智能業(yè)務(wù)中的深度應(yīng)用提供參考。

關(guān)鍵詞:大語言模型;ChatGPT;DeepSeek;防洪“四預(yù)”;意圖識別;模型驅(qū)動(dòng);垂直領(lǐng)域大模型;專業(yè)小模型

作者簡介:郭磊,黨委副書記,教授級高級工程師,主要研究方向?yàn)橹腔鬯?、水文水資源、水力學(xué)及河流動(dòng)力學(xué)等。

基金項(xiàng)目:廣東省水利科技創(chuàng)新項(xiàng)目“廣東省大中型水庫汛期水位動(dòng)態(tài)控制與洪水資源安全利用關(guān)鍵技術(shù)研究”。

DOI:10.3969/j.issn.1000-1123.2025.05.003

研究背景

1.總體思路

防洪“四預(yù)”基于數(shù)字孿生水利建設(shè)基礎(chǔ),融合前端感知、數(shù)據(jù)底板、模型平臺(tái)、知識平臺(tái)等功能模塊,實(shí)現(xiàn)預(yù)報(bào)、預(yù)警、預(yù)演、預(yù)案,為防洪決策提供支撐。其在實(shí)際防洪調(diào)度中仍需完善,一是因平臺(tái)系統(tǒng)交互復(fù)雜、業(yè)務(wù)流程鏈路長、專業(yè)性強(qiáng)、使用體驗(yàn)不友好,通常需信息技術(shù)和水利專業(yè)人員配合使用,影響了平臺(tái)推廣和擴(kuò)展;二是專家經(jīng)驗(yàn)和歷史場景較難直接融入“四預(yù)”平臺(tái),如模型需由專業(yè)人員根據(jù)實(shí)際條件設(shè)定規(guī)則后才能調(diào)用,要求專業(yè)人員充分理解具體場景并熟練掌握模型特性;三是需要專家對模型計(jì)算結(jié)果進(jìn)行判斷,提出參數(shù)修改意見等;四是數(shù)據(jù)底板建設(shè)效用尚未全部發(fā)揮,如基礎(chǔ)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、監(jiān)測數(shù)據(jù)等工作成果較為扎實(shí),但是構(gòu)架于其上的應(yīng)用功能智慧化不足。綜上,需基于現(xiàn)有“四預(yù)”平臺(tái)框架,優(yōu)化交互方式,耦合專家經(jīng)驗(yàn)和歷史場景,充分挖掘數(shù)據(jù)和模型價(jià)值等,為防洪決策提供更好支撐。

大語言模型具備3個(gè)重要功能:語言理解和表達(dá)、知識存儲(chǔ)和查詢、推理。語言理解和表達(dá)使其具備意圖識別能力,知識存儲(chǔ)和查詢使其具備行業(yè)領(lǐng)域?qū)I(yè)技能,推理則使其具備判斷、決策等高階智能。對防洪“四預(yù)”平臺(tái)而言,語言理解和表達(dá)可輔助交互操作,知識存儲(chǔ)和查詢可用于“四預(yù)”平臺(tái)的業(yè)務(wù)鏈條存儲(chǔ)、專家經(jīng)驗(yàn)和歷史場景存儲(chǔ)、知識圖譜構(gòu)建等,推理則可用于“四預(yù)”平臺(tái)體系輔助決策。

基于大語言模型以上基本能力特征,分析大語言模型應(yīng)用技術(shù)路徑,探索利用大語言模型輔助防洪“四預(yù)”平臺(tái)的交互驅(qū)動(dòng),以意圖識別和智能調(diào)用為切入點(diǎn),分析大語言模型交互的優(yōu)勢和不足,為后續(xù)大語言模型在更深層次、更廣范圍實(shí)現(xiàn)對“四預(yù)”平臺(tái)的輔助使用提供借鑒。

大語言模型發(fā)展及特點(diǎn)

1.大模型的發(fā)展

大語言模型屬于大模型的一種。2022年11月30日ChatGPT的發(fā)布引發(fā)大模型研發(fā)熱潮,經(jīng)過近2年的技術(shù)進(jìn)化和快速迭代,大模型種類、數(shù)量、能力等均呈現(xiàn)暴發(fā)式增長,其推理能力、參數(shù)優(yōu)化、架構(gòu)、多模態(tài)支持等方面都在不斷進(jìn)化,應(yīng)用場景日漸豐富。當(dāng)前,綜合類大模型國外有OpenAI公司OpenAI o1、Gpt-4o,Anthropic公司的Claude,谷歌公司的Gemini,Meta公司的Llama等;國內(nèi)有文心大模型、Qwen、GLM、云雀、Kimi、豆包、星火等。特別是2025年年初DeepSeek的R1版本發(fā)布,刺激了大模型技術(shù)和性能的快速提升,促使各行各業(yè)加速智能布局和迭代,推動(dòng)大模型的廣泛應(yīng)用。截至2025年1月底,全國已有302個(gè)生成式人工智能服務(wù)通過國家網(wǎng)信辦備案。另外,人工智能也寫入政府工作報(bào)告,明確要“深化大數(shù)據(jù)、人工智能等研發(fā)應(yīng)用,開展‘人工智能+’行動(dòng)”。由此可見,無論是政界、學(xué)界、技術(shù)界還是社會(huì)公眾都極大關(guān)注人工智能特別是大模型發(fā)展。探索大模型在行業(yè)領(lǐng)域的應(yīng)用成為當(dāng)前研究的重點(diǎn)和熱點(diǎn),并預(yù)期對各行業(yè)規(guī)則和業(yè)態(tài)產(chǎn)生革命性或顛覆性深刻影響。

2.分類及能力

就通用大模型而言,其泛化性(訓(xùn)練樣本集之外的表現(xiàn)能力)、專業(yè)性(特定領(lǐng)域問題的準(zhǔn)確性和效率)和經(jīng)濟(jì)性(投入產(chǎn)出比)之間存在“不可能三角”,另外靈活性和安全性方面也存在一定不足。為促進(jìn)應(yīng)用落地,在通用大模型基礎(chǔ)上進(jìn)行優(yōu)化和改造,形成適應(yīng)特定場景的垂直領(lǐng)域大模型和專業(yè)小模型是大模型應(yīng)用的路徑之一。通用大模型具有全面知識能力,重在知識“廣度”;垂直領(lǐng)域大模型在領(lǐng)域內(nèi)具有更多數(shù)據(jù)和知識訓(xùn)練,重在知識“深度”;專業(yè)小模型則更加聚焦行業(yè)領(lǐng)域單項(xiàng)能力或縮小模型規(guī)模,重在應(yīng)用“靈活度”。一般而言,通用大模型作為底座和基礎(chǔ),垂直領(lǐng)域大模型在其上通過微調(diào)融入行業(yè)知識、邏輯和專家經(jīng)驗(yàn),具備行業(yè)“廣而深”特點(diǎn),而專業(yè)小模型則是在垂直領(lǐng)域大模型基礎(chǔ)上,通過微調(diào)、量化和蒸餾等技術(shù),將其轉(zhuǎn)變成小模型,使其具備垂直領(lǐng)域大模型基本能力,但減少模型量以增加應(yīng)用靈活程度。各類模型分類與關(guān)系如下表和下圖所示。

大模型分類及特點(diǎn)

模型關(guān)系

就能力而言,通用大模型屬于“全科醫(yī)生”,覆蓋全領(lǐng)域知識,遵循規(guī)?;▌t(Scaling Law),其通用能力也不斷增強(qiáng)。在翻譯、棋類等某些領(lǐng)域,通用大模型甚至超過了當(dāng)前人類的能力水平。垂直領(lǐng)域大模型屬于“專科醫(yī)生”,聚焦在某特定領(lǐng)域,具有較高的專業(yè)性和精度,其能力可能超過行業(yè)專家平均水平。專業(yè)小模型雖規(guī)模最小,像個(gè)“赤腳醫(yī)生”,能力可能高于通用大模型而低于垂直領(lǐng)域大模型,但是其實(shí)用性、靈活性更高。當(dāng)前通用大模型仍持續(xù)進(jìn)化和迭代,能力不斷增強(qiáng),領(lǐng)域覆蓋能力不斷提升,未來實(shí)現(xiàn)通用人工智能(AGI)充滿無限可能。各類模型能力范圍如下圖所示。

各類模型能力范圍

3.不足及趨勢

(1)不足和風(fēng)險(xiǎn)

一是大模型的不確定性增加了應(yīng)用難度。實(shí)際場景通常要求高度確定性,而大模型作為巨量參數(shù)的數(shù)學(xué)概率模型,其輸出存在不可控的隨機(jī)性,相較于嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)模型或機(jī)理模型,可能帶來更高的不確定性和風(fēng)險(xiǎn)。

二是“不可解釋性”給使用者帶來疑惑。大模型因其“黑盒模型”的不可解釋性存在“幻覺”、偏差、公平性、知識產(chǎn)權(quán)、意識形態(tài)等風(fēng)險(xiǎn),影響在特定行業(yè)的應(yīng)用。

三是“數(shù)據(jù)”問題。數(shù)據(jù)來源、質(zhì)量及內(nèi)容安全難以保障,行業(yè)模型還存在數(shù)據(jù)“霸權(quán)”“倫理”等問題。

(2)發(fā)展趨勢

一是繼續(xù)提升通用大模型能力是主要趨勢。通用模型技術(shù)能力提升依然是角逐的主戰(zhàn)場,隨著通用模型能力增強(qiáng),各類模型融合統(tǒng)一是未來趨勢,DeepSeek-R1和Grok3的發(fā)布將加速模型融合。

二是輕量化依然是重要應(yīng)用發(fā)力點(diǎn)。C端(消費(fèi)端)應(yīng)用是行業(yè)快速發(fā)展的主賽道,而輕量化是C端應(yīng)用的前提。

三是跨模態(tài)是發(fā)展方向。更多高階應(yīng)用,如預(yù)測能力、決策能力等需要跨模態(tài)能力的支持。

四是研究中心逐步向高階認(rèn)知智能轉(zhuǎn)變。大模型在“聽、說、看”等感知領(lǐng)域已接近或超越了人類水平,在理解、思考和創(chuàng)造等認(rèn)知領(lǐng)域取得顯著進(jìn)展,大模型研究重心逐步向認(rèn)知智能轉(zhuǎn)變,這成為新一代人工智能發(fā)展趨勢。

大語言模型應(yīng)用技術(shù)

1.應(yīng)用類別

大模型落地應(yīng)用技術(shù)路徑較為清晰,但效果參差不齊,“門檻不高,天花板高”是其特征。通用大模型主要面向C端,泛化能力較強(qiáng)。垂直領(lǐng)域大模型主要面向B端(企業(yè)端)應(yīng)用,如智能制造(優(yōu)化生產(chǎn)流程、提高生產(chǎn)效率和產(chǎn)品質(zhì)量)、金融(信用評分、風(fēng)險(xiǎn)管理、欺詐檢測和算法交易)、教育(定制優(yōu)化培訓(xùn)方案)、水利(水文、決策支持)、醫(yī)療(輔助診斷)、能源(優(yōu)化電網(wǎng)管理)、交通(優(yōu)化路線規(guī)劃)、農(nóng)業(yè)(預(yù)測作物產(chǎn)量、智能施肥)等。相比通用大模型,垂直領(lǐng)域大模型在數(shù)據(jù)質(zhì)量、安全、隱私保護(hù)、成本控制等方面具有優(yōu)勢,是大模型落地應(yīng)用的主要模式之一。專業(yè)小模型對終端要求低,可用于端側(cè)設(shè)備,如移動(dòng)設(shè)備、邊緣設(shè)備等,其靈活性和經(jīng)濟(jì)性強(qiáng),是專業(yè)領(lǐng)域面向C端應(yīng)用的主要模式,在消費(fèi)終端的產(chǎn)業(yè)界備受關(guān)注,如蘋果公司參數(shù)量為3 B且可在手機(jī)端直接運(yùn)行的純端側(cè)模型Apple On-Device、谷歌DeepMind的開源小模型Gemma 2 B、DeepSeek蒸餾的1.5 B或7 B小模型等,可以廣泛應(yīng)用于本地工作站、個(gè)人電腦、手機(jī)等邊緣設(shè)備,用途更為廣泛。

2.應(yīng)用技術(shù)

大模型領(lǐng)域應(yīng)用路徑有4種,包括提示詞工程(Prompt)、檢索增強(qiáng)生成(RAG)、微調(diào)(Fine-tune)和預(yù)訓(xùn)練(Pretrain),如下圖所示。

大模型領(lǐng)域化應(yīng)用技術(shù)路徑

提示詞工程比較適合快速探索應(yīng)用,如對話系統(tǒng)、文案創(chuàng)作、流程定制等;優(yōu)化提示詞可以顯著提升生成內(nèi)容的質(zhì)量。提示詞優(yōu)化方式包括少樣本提示、思維鏈等。特點(diǎn)是實(shí)操簡便,不需要調(diào)整大模型,但對基座大模型能力依賴性較強(qiáng),提示詞的設(shè)計(jì)質(zhì)量對結(jié)果影響很大。

檢索增強(qiáng)生成技術(shù)是對提示詞工程的強(qiáng)化,通過引入外部數(shù)據(jù)庫,并依據(jù)用戶輸入(Query)檢索得到相關(guān)信息(Context),將其和提示詞一并輸入大模型,其本質(zhì)是給定樣本的提示詞方式,對外部數(shù)據(jù)庫的向量化、排序及檢索技術(shù)等較為敏感,技術(shù)難度不大,無需對大模型進(jìn)行調(diào)整,還可以利用當(dāng)前的外部知識,應(yīng)用廣泛。

微調(diào)技術(shù)是利用專業(yè)數(shù)據(jù)集對基座大模型進(jìn)行布局的參數(shù)調(diào)整,使得通用大模型對專業(yè)領(lǐng)域更加適應(yīng),具有較高的專業(yè)泛化性。常用技術(shù)方法有監(jiān)督微調(diào)、低秩調(diào)整等方式。需局部調(diào)整基座大模型,技術(shù)難度較大,對專業(yè)數(shù)據(jù)集的質(zhì)量要求較高,目前在領(lǐng)域應(yīng)用較為廣泛。

預(yù)訓(xùn)練則是基于領(lǐng)域知識重新構(gòu)建或全面調(diào)整基座大模型,技術(shù)難度大,資源要求高,投入大,周期長,專業(yè)性強(qiáng),目前應(yīng)用較少。

3.行業(yè)應(yīng)用難點(diǎn)

不確定性是大模型的應(yīng)用難點(diǎn)之一。為了增強(qiáng)大模型確定性,可以對不同應(yīng)用方式或階段輸入更多“確定性”,如在訓(xùn)練基座大模型階段提高訓(xùn)練數(shù)據(jù)集的確定性和質(zhì)量,對檢索增強(qiáng)生成方式提高外部數(shù)據(jù)和檢索結(jié)果的確定性,對提示詞工程錄入更多確定性樣本或設(shè)計(jì)高質(zhì)量思維鏈等。需要指出的是,大模型架構(gòu)和原理決定了其本質(zhì)是“黑箱”模型,不可解釋和“幻覺”不可避免,因此在行業(yè)應(yīng)用特別是對結(jié)果的確定性要求比較高的行業(yè),大模型定位是“助手”而非“決策者”。

領(lǐng)域知識提取和模型適配與優(yōu)化是難點(diǎn)之一。領(lǐng)域知識高質(zhì)量提取較為困難,領(lǐng)域知識圖譜構(gòu)建復(fù)雜,模型的適配和優(yōu)化難度較大。

倫理與安全問題影響模型應(yīng)用落地。大模型的學(xué)習(xí)訓(xùn)練數(shù)據(jù)中可能存在偏見,并產(chǎn)生歧視性輸出;模型可能生成虛假、誤導(dǎo)性信息;模型可能被惡意利用造成不良社會(huì)影響,最終影響領(lǐng)域應(yīng)用信任性等。

大語言模型智能交互分析

1.智能交互分級

從大模型與系統(tǒng)平臺(tái)的交互融合深度而言,可將智能交互分為4個(gè)層級,即L0、L1、L2和L3(見下表)。

智能交互分級

第一層級是模擬操作(L0級),大模型類似模擬人類操作系統(tǒng),基于平臺(tái)交互界面,快速定位平臺(tái)內(nèi)置功能,包括查詢、模型調(diào)用、計(jì)算、結(jié)果展示、簡報(bào)生成等,L0級交互通過監(jiān)督學(xué)習(xí)來熟悉系統(tǒng)的功能,明確調(diào)用路徑,人類參與程度高。

第二層級是智能分析生成(L1級),交互模式是基于垂直領(lǐng)域大模型,其具備讀懂專業(yè)領(lǐng)域知識的能力,并經(jīng)過監(jiān)督學(xué)習(xí)熟悉了數(shù)字孿生平臺(tái)的業(yè)務(wù)邏輯和框架體系,基于數(shù)字孿生水利平臺(tái)的后臺(tái)數(shù)據(jù)、模型和知識,進(jìn)行綜合交互,具有“生成”能力,不局限于平臺(tái)前端已有功能的調(diào)用能力,具有理解提問者意圖,并通過后臺(tái)數(shù)據(jù)進(jìn)行分析整理提供“專業(yè)答案”的能力,人類參與程度較高。

第三層級為類Agent的交互模式(L2級),在平臺(tái)已有信息和功能基礎(chǔ)上結(jié)合大模型已有的專業(yè)基礎(chǔ)知識,對相關(guān)外部知識進(jìn)行融合和調(diào)用并綜合提出決策建議,人類的參與程度為一般。

第四層級是自主決策(L3級),屬于類“智人”型自主交互模式,可根據(jù)平臺(tái)數(shù)據(jù)和業(yè)務(wù)邏輯情況,結(jié)合調(diào)用外部已有的知識,自行開展決策,并對需要人類加入的部分進(jìn)行主動(dòng)式交互。

2.“四預(yù)”平臺(tái)交互流程

按上述大語言模型智能交互分級,L0~L2級均需人類參與,L3級人類較少參與。對于人類參與的L0~L2級交互,人類作為決策事項(xiàng)發(fā)起方,首先要提出問題、需求和要求,大語言模型在理解問題、需求和要求的基礎(chǔ)上,結(jié)合自身的語義識別能力、通用或水利專業(yè)知識、學(xué)習(xí)到的平臺(tái)功能等,確定解決問題的業(yè)務(wù)流程;然后根據(jù)業(yè)務(wù)流程逐步執(zhí)行模型平臺(tái)功能,包括數(shù)據(jù)采集生成、模型調(diào)用驅(qū)動(dòng)計(jì)算、結(jié)果展示、預(yù)案制定等。最后根據(jù)現(xiàn)狀、歷史場景和預(yù)案等,綜合給出推薦的決策建議,如下圖所示。

“四預(yù)”平臺(tái)智能交互流程

“四預(yù)”平臺(tái)意圖識別和模型調(diào)用

意圖識別是大語言模型輔助交互的核心,而模型是“四預(yù)”平臺(tái)的核心。因此以意圖識別和模型調(diào)用為例,說明大語言模型交互技術(shù)的實(shí)現(xiàn)。

1.意圖識別技術(shù)

大語言模型本身具有一定的意圖識別能力,就“四預(yù)”平臺(tái)而言,需提高其防洪專業(yè)或者“四預(yù)”平臺(tái)專業(yè)意圖識別能力,實(shí)現(xiàn)任務(wù)分解或確定業(yè)務(wù)流程。技術(shù)實(shí)現(xiàn)方法通常包括上下文理解和多輪對話、規(guī)則或模式匹配、思維鏈、專業(yè)小模型等。主要體現(xiàn)在:

一是上下文理解和多輪對話,采用Prompt方式,將輸入(Query)和平臺(tái)功能集作為Prompt方式,并結(jié)合多輪交互對話,最終確定意圖功能點(diǎn),技術(shù)難度小,效率不高,效果與平臺(tái)功能集質(zhì)量相關(guān)。

二是規(guī)則和模式匹配,其要求“四預(yù)”平臺(tái)或行業(yè)領(lǐng)域?qū)<叶x一系列規(guī)則來捕捉特定意圖,優(yōu)點(diǎn)是簡單直接,易于理解和維護(hù),但是難以覆蓋所有情況,擴(kuò)展性和泛化能力較弱。

三是思維鏈形式,提前設(shè)定“四預(yù)”平臺(tái)業(yè)務(wù)鏈條過程作為大模型默認(rèn)輸入,讓其“照葫蘆畫瓢”。

四是專業(yè)小模型方式,可以理解為“四預(yù)”平臺(tái)的助手,通過基于通用大模型和平臺(tái)功能及數(shù)據(jù)的微調(diào),形成一個(gè)功能聚焦的交互小模型,實(shí)現(xiàn)難度相對較大,在“四預(yù)”平臺(tái)內(nèi)的泛在性較好。意圖識別技術(shù)如下圖所示。

意圖識別技術(shù)

針對“四預(yù)”特定場景,例如“未來三天石角站最高水位多少?”,以上下文理解和多輪對話為例,說明其意圖識別實(shí)現(xiàn),過程如下圖所示。

上下文理解和多輪對話示意

采用預(yù)設(shè)內(nèi)容和Query作為Prompt方式,預(yù)設(shè)內(nèi)容限定多輪對話內(nèi)容、范圍等。當(dāng)Query輸入:“未來三天石角站最高水位多少?”,是將預(yù)設(shè)內(nèi)容和Query同時(shí)輸入給大語言模型,大模型會(huì)根據(jù)內(nèi)容進(jìn)行第一輪回復(fù)。然后第二輪Query:“加入決策建議,并完成流程圖繪制”,將“預(yù)設(shè)內(nèi)容+Query1+第一輪回復(fù)+Query2”同時(shí)輸入給大模型,則得到第二輪回復(fù),以此類推經(jīng)過多輪對話,生成Markdown格式的業(yè)務(wù)流程圖。

需要指出,大語言模型生成的業(yè)務(wù)流程精準(zhǔn)度與預(yù)設(shè)內(nèi)容設(shè)計(jì)相關(guān)性較大。根據(jù)平臺(tái)功能庫和大語言模型結(jié)合方式及專家經(jīng)驗(yàn),形成質(zhì)量較高的預(yù)設(shè)內(nèi)容,然后通過優(yōu)化對話輪次和回答精準(zhǔn)度,可提高生成的業(yè)務(wù)流程精準(zhǔn)度。因此,對于防洪“四預(yù)”平臺(tái),統(tǒng)籌開展業(yè)務(wù)流程數(shù)據(jù)集匯聚,對相關(guān)的業(yè)務(wù)流程、技術(shù)規(guī)范、標(biāo)準(zhǔn)、指引、指南等進(jìn)行“量化”、“結(jié)構(gòu)化”或者自然語言處理,形成通用和標(biāo)準(zhǔn)的規(guī)則、模式或知識庫和數(shù)據(jù)集,可有效提升大模型智能交互的確定性,提高決策支持能力和效率。

2.模型調(diào)用

模型調(diào)用的基礎(chǔ)是意圖識別,當(dāng)生成的業(yè)務(wù)流程中涉及模型使用的時(shí)候,由大模型智能調(diào)用專業(yè)模型進(jìn)行計(jì)算。首先大模型根據(jù)調(diào)用模型類別,調(diào)用已有庫中的中間數(shù)據(jù)交換格式文件,并根據(jù)現(xiàn)狀錄入或交互錄入模型參數(shù),生成可執(zhí)行的中間數(shù)據(jù)交換文件進(jìn)行驅(qū)動(dòng),通常的中間數(shù)據(jù)交換格式包括XML、JSON等,然后通過大模型,調(diào)用接口(API)驅(qū)動(dòng)平臺(tái)內(nèi)置的水利專業(yè)模型進(jìn)行計(jì)算,具體如下圖所示。

模型調(diào)用示意

總結(jié)和建議

1.總結(jié)

“四預(yù)”平臺(tái)在防洪決策中發(fā)揮了重要作用,針對“四預(yù)”平臺(tái)普遍存在的交互復(fù)雜、專家經(jīng)驗(yàn)融入難等問題,基于大語言模型在理解和表達(dá)、知識存儲(chǔ)和查詢、推理能力等應(yīng)用分析,結(jié)合當(dāng)前大模型技術(shù)落地應(yīng)用主要技術(shù)路徑,淺述了利用大語言模型優(yōu)化“四預(yù)”平臺(tái)交互的路徑,并以意圖識別和智能調(diào)用為例進(jìn)行了說明。

2.建議

大模型是人工智能技術(shù)發(fā)展的重要里程碑,也是人工智能技術(shù)可與千行百業(yè)進(jìn)行直接鏈接并注入智能的重要手段之一。盡管當(dāng)前大模型還存在不確定性、“幻覺”、安全等方面的問題,領(lǐng)域應(yīng)用成效還缺乏廣泛性,但隨著大模型能力不斷提升和外圍技術(shù)不斷迭代,大模型領(lǐng)域應(yīng)用將不可或缺。防洪“四預(yù)”平臺(tái)是水利防洪調(diào)度的重要利器,探索大模型應(yīng)用于防洪“四預(yù)”平臺(tái),增強(qiáng)平臺(tái)在實(shí)戰(zhàn)中的高效性和實(shí)時(shí)性,提升平臺(tái)的生命活力和韌性,更好助力防洪調(diào)度,具有必要性和緊迫性。

為進(jìn)一步提升大模型的水利應(yīng)用支撐能力,建議如下:

①統(tǒng)籌水利垂直領(lǐng)域大模型的開發(fā)。水利知識邊界是有限的,統(tǒng)籌開展水利業(yè)務(wù)數(shù)據(jù)集、專業(yè)知識集、標(biāo)準(zhǔn)規(guī)劃集、水利模型集等數(shù)據(jù)集建設(shè),基于結(jié)構(gòu)化知識體系,訓(xùn)練以通用大模型為底座的水利垂直領(lǐng)域大模型,構(gòu)建行業(yè)內(nèi)的水利大模型用戶生態(tài)體系,通過不斷迭代升級,提升水利大模型的泛化能力和確定性,打造“能用好用管用”的水利垂直領(lǐng)域大模型,助力水利新質(zhì)生產(chǎn)力發(fā)展。

②探索水利領(lǐng)域的專業(yè)小模型研發(fā)。基于水利垂直領(lǐng)域大模型或通用大模型,通過蒸餾、量化等形成更小參數(shù)量的水利領(lǐng)域?qū)I(yè)小模型,推進(jìn)水利行業(yè)端側(cè),如前端感知設(shè)備智能監(jiān)測、圖像和視頻識別判斷等應(yīng)用。

③探索大模型與水利傳統(tǒng)專業(yè)模型的融合。傳統(tǒng)的機(jī)理模型或概念模型在精度上具有一定優(yōu)勢,而大模型在速度上更加突出,為適應(yīng)數(shù)字孿生水利特別是“四預(yù)”的實(shí)時(shí)性要求,需探索大模型與水利專業(yè)模型的融合,在確保精度的同時(shí)提升決策的速度。

④探索大模型在水利科研中的應(yīng)用。傳統(tǒng)水利工程建設(shè)的科研課題往往通過數(shù)學(xué)模型、物理模型等手段進(jìn)行優(yōu)化論證,嘗試借助大模型手段進(jìn)行輔助研究,探索研究方法和路徑,助力水利科研高效優(yōu)質(zhì)發(fā)展。

Abstract: Large language models (LLMs) have emerged as a significant breakthrough in artificial intelligence in recent years. Leveraging the Transformer architecture and self-attention mechanisms, these models exhibit near-human natural language understanding capabilities at an ultra-large scale, assisting human cognition, reasoning, judgment, and decision-making. Currently, the application of LLMs in specialized domains has become a focal point, especially with the open-source release of DeepSeek based on the Mixture of Experts (MOE) architecture, which offers a more accessible technical pathway for industry applications and further stimulates related research. The “four pres” (forecasting, early warning, pre-planning, and emergency response) in flood control represent a novel intelligent business application in water conservancy based on digital twin technology. This system is characterized by strong specialization, lengthy business chains, and complex system architecture. While functionally comprehensive, there remains room for improvement in usability. Based on an analysis of the understanding and reasoning capabilities of large language models, this study proposes, for the first time, a classification system for intelligent interaction with large models, ranging from L0 to L3 levels. Focusing on intent recognition and intelligent invocation, the research explores application scenarios and technical implementation paths that support the “four pres” platform. Methods to enhance the output certainty of large models are proposed by optimizing “preset content” and incorporating specific problem overlays, which are tested on general large models. The study also explores pathways for large models to intelligently invoke professional models within the “four pres” platform, providing feasible solutions to improve interactive friendliness. Additionally, this research offers valuable references for the deep application of large language models in intelligent water conservancy business.

Keywords:large language models (LLMs); ChatGPT; DeepSeek; “four pres” in flood control; intent recognition; model-driven; vertical domain large models; specialized small models

本文引用格式:

郭磊,馮鈞,直偉,等.大語言模型發(fā)展研究及其在防洪“四預(yù)”平臺(tái)智能交互的應(yīng)用探討[J].中國水利,2025(5):29-36.

封面供圖林曉敏

責(zé)編李博遠(yuǎn)

校對董林玥

審核王慧

監(jiān)制軒瑋



聲明:本文系轉(zhuǎn)載自互聯(lián)網(wǎng),請讀者僅作參考,并自行核實(shí)相關(guān)內(nèi)容。若對該稿件內(nèi)容有任何疑問或質(zhì)疑,請立即與鐵甲網(wǎng)聯(lián)系,本網(wǎng)將迅速給您回應(yīng)并做處理,再次感謝您的閱讀與關(guān)注。

相關(guān)文章
我要評論
表情
歡迎關(guān)注我們的公眾微信