為了更快速且準(zhǔn)確地預(yù)測(cè)邊坡穩(wěn)定性,許多學(xué)者開始探索機(jī)器學(xué)習(xí)方法在邊坡穩(wěn)定性分析中的應(yīng)用,其中支持向量機(jī)、隨機(jī)森林等模型被證實(shí)在預(yù)測(cè)邊坡穩(wěn)定性方面有較高的準(zhǔn)確率。已有研究證明了混合機(jī)器學(xué)習(xí)模型能綜合多個(gè)機(jī)器學(xué)習(xí)模型的優(yōu)點(diǎn),從而提高預(yù)測(cè)精度,但也暴露出混合模型可解釋性較差和過擬合風(fēng)險(xiǎn)較高等問題。為克服混合機(jī)器學(xué)習(xí)模型的缺點(diǎn),啟發(fā)式算法開始被應(yīng)用于優(yōu)化機(jī)器學(xué)習(xí)模型。相比混合機(jī)器學(xué)習(xí)模型,啟發(fā)式算法通過其獨(dú)特的元啟發(fā)式搜索機(jī)制,在非凸、多峰及高維優(yōu)化空間中展現(xiàn)出更強(qiáng)的全局搜索能力,顯著提升了算法對(duì)超參數(shù)搜索空間的探索效率,這一特性使其能夠突破局部最優(yōu)限制,為機(jī)器學(xué)習(xí)模型遴選出更具泛化能力的超參數(shù)配置,進(jìn)而實(shí)現(xiàn)模型預(yù)測(cè)精度與魯棒性的同步提升。
常春藤算法(IVY)是一種新開發(fā)的生物啟發(fā)算法,該算法取自常春藤植物的生長模式,模擬了常春藤種群的有序協(xié)調(diào)增長和擴(kuò)散進(jìn)化的過程。武漢科技大學(xué)黃詩冰團(tuán)隊(duì)采用IVY對(duì)隨機(jī)森林、決策樹、多層感知器、支持向量機(jī)4種機(jī)器學(xué)習(xí)模型的超參數(shù)進(jìn)行優(yōu)化,并通過準(zhǔn)確率、召回率、查準(zhǔn)率、F1值、特異度和AUC值對(duì)優(yōu)化后模型性能進(jìn)行評(píng)價(jià)分析,比選出邊坡穩(wěn)定性預(yù)測(cè)的最佳機(jī)器學(xué)習(xí)模型,并進(jìn)一步探究IVY相比傳統(tǒng)啟發(fā)式算法的優(yōu)勢(shì)與不足。
數(shù)據(jù)集的建立與處理
構(gòu)建數(shù)據(jù)集時(shí)首先要選取合適的特征,選取的特征應(yīng)該在滿足反映評(píng)估對(duì)象特性的同時(shí)避免冗余。從邊坡幾何形態(tài)來看,坡高和坡角影響邊坡自重和應(yīng)力分布,是影響邊坡穩(wěn)定性的重要因素;從邊坡自身物理力學(xué)性質(zhì)看,巖土體的諸多強(qiáng)度參數(shù)反映了邊坡內(nèi)在力學(xué)性質(zhì)與邊坡穩(wěn)定性之間的關(guān)系,尤其是粘聚力和內(nèi)摩擦角在巖土工程領(lǐng)域被廣泛使用;重度也是邊坡巖土體重要的物理參數(shù),它直接影響影響邊坡的自重,較大的重度會(huì)增加邊坡的總負(fù)荷,增加邊坡失穩(wěn)的風(fēng)險(xiǎn);從誘發(fā)邊坡失穩(wěn)的外界條件看,水是誘發(fā)邊坡失穩(wěn)最常見的外界因素,可通過孔隙水壓比反映水對(duì)邊坡穩(wěn)定性的影響。研究中選取以上6個(gè)參數(shù)作為數(shù)據(jù)集的特征參數(shù),并收集了392個(gè)邊坡案例構(gòu)建數(shù)據(jù)集,其中表現(xiàn)為穩(wěn)定的邊坡有201個(gè),表現(xiàn)為失穩(wěn)的邊坡有191個(gè)。
各特征的小提琴圖
預(yù)測(cè)模型建立
IVY模擬了常春藤植物的生長和在種群中的傳播過程。算法首先創(chuàng)建一組位置隨機(jī)的常春藤植物種群,種群中的每個(gè)個(gè)體代表一個(gè)可能的解。個(gè)體通過目標(biāo)函數(shù)評(píng)估其適應(yīng)度,適應(yīng)度(或越低,由目標(biāo)函數(shù)決定),表示個(gè)體解越優(yōu)。常春藤種群中的個(gè)體會(huì)選擇最接近且最強(qiáng)的相鄰個(gè)體作為自我改進(jìn)對(duì)象,在優(yōu)化機(jī)器學(xué)習(xí)模型時(shí),常春藤植物借助最強(qiáng)鄰居向光源攀爬的過程實(shí)際上就是超參數(shù)借助相鄰最佳超參數(shù)向全局最優(yōu)超參數(shù)靠近的過程。
首先建立機(jī)器學(xué)習(xí)模型,然后IVY會(huì)隨機(jī)生成一組初始化種群,初始種群中每個(gè)常春藤個(gè)體的位置則決定了機(jī)器學(xué)習(xí)模型的初始超參數(shù)組合。機(jī)器學(xué)習(xí)模型在獲得初始超參數(shù)組合后將對(duì)模型進(jìn)行訓(xùn)練、測(cè)試和評(píng)價(jià),評(píng)價(jià)指標(biāo)值(如準(zhǔn)確率等)將作為適應(yīng)度傳遞給初始種群。初始種群將根據(jù)個(gè)體適應(yīng)度的高低進(jìn)行排序,保留適應(yīng)度高的個(gè)體,淘汰適應(yīng)度低的個(gè)體,這一過程也是淘汰較差超參數(shù)組合的過程。在淘汰適應(yīng)度較差的個(gè)體后,種群將圍繞適應(yīng)度高的個(gè)體進(jìn)行傳播與變異,生成新的個(gè)體,從而完成種群的更新。種群更新產(chǎn)生更優(yōu)秀個(gè)體意味著機(jī)器學(xué)習(xí)模型獲得了更優(yōu)的超參數(shù)組合,機(jī)器學(xué)習(xí)模型將根據(jù)更優(yōu)的超參數(shù)組合再次進(jìn)行訓(xùn)練、測(cè)試和評(píng)價(jià)。重復(fù)上述過程,直至達(dá)到最大迭代次數(shù),整個(gè)過程中產(chǎn)生的最大適應(yīng)度個(gè)體的位置就是最佳的超參數(shù)組合。
VY優(yōu)化機(jī)器學(xué)習(xí)模型流程
實(shí)踐結(jié)果
每個(gè)機(jī)器學(xué)習(xí)模型在經(jīng)過常春藤算法優(yōu)化之后準(zhǔn)確率都得到了提升,分別提高了8.4%、8.81%、18.76%和23.56%,其中隨機(jī)森林在優(yōu)化后準(zhǔn)確率最高,達(dá)到了90.68%;支持向量機(jī)的準(zhǔn)確率提升幅度最大,從優(yōu)化前的59.49%提升到了83.05%,共提升23.56%;隨機(jī)森林在優(yōu)化后除召回率和AUC值外,另外4個(gè)指標(biāo)都得到了明顯提升,表明隨機(jī)森林的整體預(yù)測(cè)能力得到了增強(qiáng);決策樹在優(yōu)化后召回率有所下降,而其他5個(gè)指標(biāo)都得到了提升,表明決策樹在經(jīng)過IVY優(yōu)化后,犧牲了一部分預(yù)測(cè)穩(wěn)定邊坡的能力,但模型的整體性能得到了提升,尤其是預(yù)測(cè)失穩(wěn)邊坡的能力得到了大幅增強(qiáng);多層感知器召回率也有所下降,但其他指標(biāo)的提升十分明顯,尤其是查準(zhǔn)率和特異度得到了大幅度的增長,表明模型在優(yōu)化前偏向于預(yù)測(cè)穩(wěn)定邊坡,但經(jīng)過優(yōu)化后,模型的性能在整體得到提升的同時(shí)變得更加均衡;支持向量機(jī)在優(yōu)化后每個(gè)指標(biāo)都得到了提升,說明其性能在優(yōu)化后得到了全面增強(qiáng);優(yōu)化后隨機(jī)森林算法的準(zhǔn)確率、召回率、F1值和AUC值均高于另外3種模型,查準(zhǔn)率和特異度也處于較高水平,說明隨機(jī)森林算法更適合預(yù)測(cè)邊坡穩(wěn)定性。
4種模型優(yōu)化前后指標(biāo)對(duì)比
結(jié) 論
(1)利用常春藤算法對(duì)4種機(jī)器學(xué)習(xí)模型進(jìn)行優(yōu)化,每個(gè)機(jī)器學(xué)習(xí)算法在經(jīng)過常春藤算法優(yōu)化后準(zhǔn)確率都得到了提升,其中隨機(jī)森林在優(yōu)化后準(zhǔn)確率最高,達(dá)到了90.68%;支持向量機(jī)的準(zhǔn)確率提升幅度最大,從優(yōu)化前的59.49%提升到了83.05%,提升了23.56%。表明常春藤算法能夠有效提高機(jī)器學(xué)習(xí)預(yù)測(cè)邊坡穩(wěn)定性的準(zhǔn)確率。
(2)優(yōu)化后隨機(jī)森林模型的準(zhǔn)確率、召回率、F1值和AUC值均高于另外3種模型,查準(zhǔn)率和特異度也處于較高水平,各項(xiàng)指標(biāo)的均衡發(fā)展表明其能夠精準(zhǔn)平衡邊坡穩(wěn)定性預(yù)測(cè)的敏感性與可靠性,是當(dāng)前數(shù)據(jù)條件下的最優(yōu)預(yù)測(cè)模型。
(3)經(jīng)IVY優(yōu)化后的隨機(jī)森林準(zhǔn)確率和PSO相同,高于GA,并且IVY在優(yōu)化隨機(jī)森林時(shí)能夠比PSO和GA更快收斂,表明IVY在優(yōu)化隨機(jī)森林模型時(shí)整體效果優(yōu)于PSO和GA這2種傳統(tǒng)啟發(fā)式算法,為解決機(jī)器學(xué)習(xí)超參數(shù)優(yōu)化問題提供了新途徑。
原文下載
蔡玉林,黃詩冰,徐劍波,等.基于常春藤算法優(yōu)化機(jī)器學(xué)習(xí)模型預(yù)測(cè)邊坡穩(wěn)定性的研究[J/OL].金屬礦山,1-11.
作者簡介
黃詩冰
教授,博士生導(dǎo)師,武漢科技大學(xué)城市建設(shè)學(xué)院院長。兼任全國非煤礦山安全生產(chǎn)專家,中國巖石力學(xué)與工程學(xué)會(huì)極地專委會(huì)常務(wù)委員,湖北省地下工程學(xué)會(huì)常務(wù)理事,《金屬礦山》雜志青年編委等。長期從事寒區(qū)巖土工程、工程地質(zhì)災(zāi)害防治以及固廢資源化利用等方面研究。主持國家自然科學(xué)基金項(xiàng)目3項(xiàng)(面上項(xiàng)目2項(xiàng))、湖北省杰出青年基金項(xiàng)目1項(xiàng)、武漢市自然科學(xué)基金特區(qū)計(jì)劃項(xiàng)目1項(xiàng)。作為第一作者或通訊作者發(fā)表SCI/EI論文50余篇,其中中科院一、二區(qū)論文近40篇,授權(quán)發(fā)明專利13件。入選了湖北省“楚天學(xué)子”,2024年全球前2%頂尖科學(xué)家榜單和中國知網(wǎng)高被引學(xué)者TOP1%榜單。
《金屬礦山》簡介
《金屬礦山》由中鋼集團(tuán)馬鞍山礦山研究總院股份有限公司和中國金屬學(xué)會(huì)主辦,主編為中國工程院王運(yùn)敏院士,現(xiàn)為北大中文核心期刊、中國科技論文統(tǒng)計(jì)源期刊(中國科技核心期刊)、中國精品科技期刊(F5000頂尖學(xué)術(shù)論文來源期刊)、中國百強(qiáng)報(bào)刊、RCCSE中國核心學(xué)術(shù)期刊(A)、中國期刊方陣雙百期刊、國家百種重點(diǎn)期刊、華東地區(qū)優(yōu)秀期刊,被美國化學(xué)文摘(CA)、美國劍橋科學(xué)文摘(CSA)、波蘭哥白尼索引(IC)、日本科學(xué)技術(shù)振興機(jī)構(gòu)數(shù)據(jù)庫(JST)等世界著名數(shù)據(jù)庫收錄。主要刊登金屬礦山采礦、礦物加工、機(jī)電與自動(dòng)化、安全環(huán)保、礦山測(cè)量、地質(zhì)勘探等領(lǐng)域具有重大學(xué)術(shù)價(jià)值或工程推廣價(jià)值的研究成果,優(yōu)先報(bào)道受到國家重大科研項(xiàng)目資助的高水平研究成果。根據(jù)科技部中國科技信息研究所發(fā)布的《2024中國科技期刊引證報(bào)告(核心版)》,《金屬礦山》核心總被引頻次位列26種礦業(yè)工程技術(shù)學(xué)科核心期刊第1位;根據(jù)中國知網(wǎng)發(fā)布的《中國學(xué)術(shù)期刊影響因子年報(bào)》(2024版),《金屬礦山》學(xué)科影響力位居73種礦業(yè)期刊第9位。
供稿:曾文旭
編排:戴穎熠
審核:王小兵
聲明:本文系轉(zhuǎn)載自互聯(lián)網(wǎng),請(qǐng)讀者僅作參考,并自行核實(shí)相關(guān)內(nèi)容。若對(duì)該稿件內(nèi)容有任何疑問或質(zhì)疑,請(qǐng)立即與鐵甲網(wǎng)聯(lián)系,本網(wǎng)將迅速給您回應(yīng)并做處理,再次感謝您的閱讀與關(guān)注。
不想錯(cuò)過新鮮資訊?
微信"掃一掃"