在云計(jì)算領(lǐng)域,將工作負(fù)載從一個云平臺遷移至另一個云平臺一直是企業(yè)面臨的棘手挑戰(zhàn)。盡管Terraform作為基礎(chǔ)設(shè)施即代碼技術(shù)的標(biāo)準(zhǔn),本應(yīng)助力基礎(chǔ)設(shè)施在云提供商間實(shí)現(xiàn)可移植性,但現(xiàn)實(shí)卻不盡如人意。每個云提供商都擁有獨(dú)特的資源表述方式,導(dǎo)致遷移過程往往需要數(shù)月的手動重寫代碼。即便市面上存在一些聲稱能生成生產(chǎn)就緒基礎(chǔ)設(shè)施即代碼的AI工具,在處理網(wǎng)絡(luò)、身份訪問管理以及服務(wù)依賴等復(fù)雜問題時,表現(xiàn)也難以令人滿意。
位于加利福尼亞州普萊森頓的初創(chuàng)公司FluidCloud,在2025年7月獲得810萬美元種子輪融資后正式走出隱身模式,推出了一項(xiàng)名為大型基礎(chǔ)設(shè)施模型的創(chuàng)新技術(shù)。該技術(shù)是一個專門打造的AI引擎,專注于在多云環(huán)境中生成、翻譯和驗(yàn)證Terraform代碼。FluidCloud聯(lián)合創(chuàng)始人兼首席執(zhí)行官Sharad Kumar強(qiáng)調(diào),真正的彈性并非僅僅掃描云環(huán)境并生成基礎(chǔ)設(shè)施即代碼,而是具備將基礎(chǔ)設(shè)施遷移至其他區(qū)域或云提供商的能力。
大型基礎(chǔ)設(shè)施模型在架構(gòu)設(shè)計(jì)上獨(dú)樹一幟。與大多數(shù)基于基礎(chǔ)模型或標(biāo)準(zhǔn)微調(diào)大語言模型構(gòu)建的AI基礎(chǔ)設(shè)施工具不同,它采用了多個模型的混合架構(gòu)。聯(lián)合創(chuàng)始人兼首席技術(shù)官Harshit Omar介紹,系統(tǒng)的轉(zhuǎn)換和核心能力并非依賴大語言模型,而是基于他們自主研發(fā)的條件模型。其中,標(biāo)準(zhǔn)大語言模型位于前端,負(fù)責(zé)解析用戶意圖;Terraform生成和云到云轉(zhuǎn)換工作則運(yùn)行在基于基礎(chǔ)設(shè)施模式訓(xùn)練的自定義基礎(chǔ)模型上。這些訓(xùn)練數(shù)據(jù)全部為合成數(shù)據(jù),F(xiàn)luidCloud通過生成大量Terraform配置,并運(yùn)用自身轉(zhuǎn)換技術(shù)構(gòu)建了訓(xùn)練語料庫。
在性能評估方面,F(xiàn)luidCloud采用BLEU評分對大型基礎(chǔ)設(shè)施模型進(jìn)行基準(zhǔn)測試。目前,該模型得分為0.58,接近0.60的人類水平性能,顯示出其在Terraform生成任務(wù)上的出色表現(xiàn)。該模型覆蓋跨云提供商的150多種資源類型,輸入模型也發(fā)生了顯著變化。此前,平臺需要直接云掃描作為輸入,且僅覆蓋約25到30種資源類型;如今,它接受包含Terraform代碼的現(xiàn)有GitHub存儲庫作為輸入,能夠處理多種Terraform語法樣式,并支持自定義映射覆蓋。
大型基礎(chǔ)設(shè)施模型還具備多項(xiàng)擴(kuò)展功能。在遷移開始前,它會運(yùn)行兼容性評分層,根據(jù)現(xiàn)有基礎(chǔ)設(shè)施估計(jì)在目標(biāo)平臺上可能失敗的工作負(fù)載百分比。同時,該模型引入了故障預(yù)測功能,通過分析云提供商發(fā)布周期、區(qū)域間公共網(wǎng)絡(luò)延遲數(shù)據(jù)和計(jì)劃的操作系統(tǒng)升級窗口等信息,預(yù)測潛在故障。FluidCloud計(jì)劃建立一個公共社區(qū)頁面,發(fā)布即將到來的故障預(yù)測,供企業(yè)訂閱提前通知。平臺開箱即用包含1800個合規(guī)策略,涵蓋主要超大規(guī)模云服務(wù)商以及Vultr、OVH和Hetzner等新興云提供商。
跨云網(wǎng)絡(luò)遷移是多云遷移中的一大難題。不同云提供商在VPC配置、私有隧道、安全組和防火墻規(guī)則等方面的表述方式各異,手動遷移這些配置往往導(dǎo)致遷移過程停滯。大型基礎(chǔ)設(shè)施模型在翻譯基礎(chǔ)設(shè)施時,能夠完整復(fù)制網(wǎng)絡(luò)堆棧,確保在另一個云中實(shí)現(xiàn)功能一致。由于該模型在跨提供商DevOps和基礎(chǔ)設(shè)施模式上進(jìn)行了訓(xùn)練,因此無需工程團(tuán)隊(duì)從頭學(xué)習(xí)每個云的網(wǎng)絡(luò)方言,即可高效處理翻譯工作。
除了遷移功能,大型基礎(chǔ)設(shè)施模型還充當(dāng)優(yōu)化層。Harshit Omar解釋,DevOps工程師做出的每個基礎(chǔ)設(shè)施變更都可歸為成本、安全或性能三類。該模型對這些變量進(jìn)行建模,并根據(jù)檢測到的意圖設(shè)置權(quán)重,從而生成新的基礎(chǔ)設(shè)施配置。例如,如果用戶意圖降低成本,模型會平衡配置以實(shí)現(xiàn)這一目標(biāo);如果用戶關(guān)注性能提升,模型則會優(yōu)化配置以提高性能。
在故障預(yù)測方面,Harshit Omar指出,上游光纖提供商并非云故障的主要因素,發(fā)布周期壓力才是更大驅(qū)動因素。由于云提供商面臨提供更新服務(wù)的壓力,加上AI和代碼生成技術(shù)的應(yīng)用,質(zhì)量控制和故障問題日益增多。針對這一現(xiàn)狀,F(xiàn)luidCloud的下一個開發(fā)重點(diǎn)包括用于通過MCP創(chuàng)建自定義基礎(chǔ)設(shè)施工作流的智能體構(gòu)建器,以及抽象云提供商API的可移植SDK。這些SDK將使切換云部署變得如同更改環(huán)境變量一樣簡單,無需重寫API調(diào)用。











