少妇人妻偷人精品一区二区,国产伦精品一区二区三区妓女,狼牙套加粗震动入珠套h,被狼交的女人(h)

中國金屬材料流通協會,歡迎您!

English服務熱線:010-59231580

搜索

鄔賀銓院士:大模型賦能企業數字化轉型

作者:中國工程院院士 鄔賀銓


隨著人工智能(AI)技術的興起,大模型成為從信息化走向數智化的重要驅動力。雖然基于大算力支持和超大規模語言數據作為訓練樣本的大模型技術能夠支持自動文摘、機器翻譯等基礎通用任務,但在醫療、金融等專業領域中,由于缺乏行業知識,無法滿足定制化、精細化和行業化的需求。

因此,需要基礎大模型提供方與垂直行業的企業合作,共同開發行業大模型。例如,百度的“文心一言”大模型就與汽車、能源、醫療、金融等11個行業的企業合作.創造了國內首個全面開放的大型語言模型。這樣的合作主要發生存大型企業之問.對于中小型企業來說,直接應用這種基礎大型模型仍然存在一定難度。

大模型的興起對云計算2的各個層面也產生了深遠的影響.在基礎設施即服務(IaaS)領域,推動了存算一體的算力架構的出現:在平臺即服務(PaaS)領域,促進了AI PaaS的發展,支持了專業大模型的快速構建和部署:在模型即服務(MaaS)方面,提供了更靈活的模型定制,進一步推動了云端AI應用:而對軟件即服務(SaaS)而言,大模型通過創新解決了定制化、成本和服務質量等問題,提高了它的實踐價值。因此,若將大模型拆分成模塊,利用“IaaS+PaaS+MaaS+SaaS”的組合構建全新的云智平臺,將有利于中小型企業更容易地應用AI大模型

1 AI的演進之路:從生成式AI到通用A1

人工智能正以前所未有的速度和規模發展,給人類社會帶來巨大的變革。AI是指計算機系統通過模擬人類智能、推理、學習、理解和創造等能力,實現自主決策和執行任務的能力。AI概念自1956年首次提出,經過將近70年的演變與發展,在越來越多領域得到廣泛應用。迄今為止,AI一共經歷了兩代發展。

第1代AI基于邏輯表示的“符號主義”,即知識驅動AI,旨在模仿人類的推理和思考能力,例如由IBM開發的“深藍”計算機。知識驅動AI的推理過程完全基于人類的經驗.南于缺乏數學基礎,其推理僅限于數理邏輯等確定性推理,只能解決特定問題。

第2代AI基于神經網絡的“連接主義”,即數據驅動AI,旨在利用統計方法將模型的輸入數據轉換為輸出結果。數據驅動AI可以分為判別式、生成式以及養成式3種。判別式AI根據需求分辨內容與需求是否匹配,從已有的數據中判斷出最符合要求的數據,主要適用于圖像識別、推薦系統等,例如2016年的AlphaGo。養成式AI是DeepMind公司于2022年提出的,該AI模型具有類似于人類嬰孩的思維能力.當簡單物理規則被打破時會表現出驚訝,可以對集中視頻訓練不同的對象和事件進行概括,并且還可以通過在一個相對較小的動畫上集中訓練,不斷成長。生成式AI技術是近年來人工智能領域的一個重要分支,可以通過對現有數據集的訓練來生成全新的、完全原創的內容,主要適用于圖像與自然語言生成。近年來,生成式AI技術獲得了顯著發展,2022年以ChatGPT為代表的生成式AI技術的火爆在全球引起了一股新的AI熱潮。

由2018年的GPT-1發展到2023年的GPT-4,大模型的參數(可學習的權重和偏置變量)已從初始的1.17億增長到了10 000億,訓練數據也從5 GB增長到了100 TB,如表1所示。GPT模型參數量的提升,使得訓練結果越來越精確,其突飛猛進的增長速度是驚人的。在2年的時間里,AI模型規模增長了25倍,Transformer模型(一種深度學習模型框架)更是增長了275倍。雖然大模型可以在數據中心進行訓練,但其高算力、高效率、低成本的特點將推動其上云。在大多數應用場景中,公有云的選用是一種合理的策略。

伴隨著生成式AI的飛速進展,實現通用AI的曙光已然照人人們的視野。作為一個知識和數據雙引擎驅動的模型,通用AI不僅滿足單向任務的處理.還通過輸入文本對大模型進行訓練,他更需要汲取視覺、聽覺、觸覺等眾多感知信息,進行多模態數據的融合,從而豐富其處理的復雜性和靈動性。在應對各項任務的過程中,通用AI尋求的是精準和高效,只需激活模型中與任務有關的部分即可,而非全盤啟動,以此達成真正的通用AI的愿景。

2 大模型的構建與應用:自建與協作開發的行業大模型

建設基礎大模型是企業實現數智化轉型不可或缺的一環,這一任務不僅需要雄厚的計算力、豐富的數據和高級人才,還要應對不同行業的獨特需求,特別是在處理敏感數據和遵循嚴格監管的領域。為了應對這一挑戰,垂直類企業通常需要與大型互聯網企業或專業研究機構展開合作,以共同推動特定行業大模型的開發。

2.1 自建基礎大模型

構建基礎大模型,如GPT系列,需要應對多項挑戰,包括強大的計算力、充足的數據、高水平的人才、適用的應用場景以及完善的生態鏈。通常,這一任務由互聯網大型企業或實力雄厚的研究機構來承擔。在垂直行業中,由于各種因素的制約,自建基礎大模型的實例相對較少,但中國的三大運營商卻是少數幾個擁有這類模型的企業。目前,中國已經擁有近200個大模型,然而,并非所有模型都具備執行任務所需的充足算力、數據和人才資源。

垂直類企業雖然很少擁有自建的基礎大模型,但在某些對市場監管要求嚴格、對數據安全敏感的領域,核心企業通常不愿意使用外部大模型。對于頭部金融機構而言.他們需要自行構建大模型.以實現數據和模型的私有化,并存加密環境中使用私有數據進行模型的訓練和應用。然而.創建金融大模型面臨多重挑戰。

首先,金融行業對數據安全性和隱私合規性的要求非常嚴格,同時風控對時效性和精準性的要求也很高,一般的基礎大模型在透明性、可信性和專業性方面可能無法滿足這些要求,直接遷移為金融大模型的難度較大:其次,金融大數據在平衡成本與質量時.面臨著數據難以共享的問題。導致數據規模無法與通用性語料匹敵,金融大模型難以產生“涌現”效果:最后,本地私有部署需要自建計算能力設施,對軟硬件產品有著嚴峻的創新性要求.加上大模型參數規模較大.這可能會導致輸入成本較高。

2.2 合作開發行業大模型

基礎大模型通常通過通用語料庫進行訓練.具備強大的通識能力,可用于聊天對話等多種應用場景。然而.這類模型缺少特定行業的專業知識,因此需要大模型提供方與垂直行業合作開發行業大模型.目前存在兩種主要的開發模式。

1)中心化模式。在這種模式下,垂直類企業將其數據提供給大模型提供方進行再訓練.并對模型進行適應性優化,如圖1所示。此后,進行知識蒸餾、量化以及對特定場景遷移等操作以縮小模型。但是在這一模式下,大部分工作由基礎大模型的提供方完成.垂直類企業無法全面掌握模型的開發和優化工作。此外,后續的模型微調和云邊端部署等工作仍需模型提供方提供支撐.可能存在數據在流轉過程中泄漏的風險。

2)非中心化模式。在這一模式下,大模型提供方會將訓練后的模型提供給垂直行業的企業。企業可以在此基礎上根據具體的業務場景和專有數據對模型進行微調.采用自我微調、有監督微調、指令調整等方式形成行業大模型或多個業務小模型。這種方式雖然避免了數據泄露的風險,但對企業自身的技術能力有較高的要求。同時,預訓練由基礎大模型提供方完成,而微調由企業完成,兩者之問提供的數據可能存在矛盾。


為解決這一問題,可采用混迭方式進行預訓練與指令微調,并且在預訓練階段引入部分行業數據,在微調階段引入部分通用數據。例如,度小滿金融的軒轅模型就是采用這種方式訓練的,他們將預訓練數據和指令數據隨機混合到一個訓練數據中進行混合微調,通過多階段逐漸訓練.緩解預訓練和微調問數據不匹配的問題,提高模型的表達、理解、遷移和泛化能力。

3 對MaaS及其工具鏈的探索

合作開發行業大模型涉及到多個領域.如數字孿生/工業設計、藥物仿真、電網建模、視頻生成、動漫渲染等。通常需要這些行業作為算力網業務消費者連接到IPv6網絡,以實現云、網、邊的協同。IPv6作為統一承載協議,在打通云、網、邊之間發揮著重要作用。

互聯網數據中心(IDC)作為算力網的業務提供者,通過提供計算能力成為IaaS的主要組成部分,即算力平臺。與此同時,算法主要分布在PaaS和SaaS層上,而大模型為這兩個層級提供了重要支撐。垂直類企業可以與大模型提供商合作,共同構建行業大模型。然而,對于中小型企業來說,參與這一過程仍然是一項挑戰。因此.MaaS應運而生,它將大模型縮簡為可以插入中小型企業本地設備或公有云的PaaS和SaaS之間的模塊。通過MaaS,中小型企業可以根據自身數據對模型進行精細化調整,形成適用于企業的專有模型。

結合IaaS、PaaS、MaaS和SaaS.可以構建一種全新的云智平臺,該平臺通過MaaS將大模型整合進云平臺。MaaS由大模型平臺(例如基礎大模型、行業大模型和第三方模型以及支持MaaS的工具鏈組成,向企業提供在大模型上再開發和應用所需的各項能力。MaaS工具鏈可以提供數據管理、模型訓練、評估優化、預測服務部署、提示工程以及插件應用等功能。盡管基礎大模型在一般場景(如聊天對話)下表現良好,但存工業應用中,對確定性的敏感需求可能會暴露出其本身可信性的不足。因此,工業大模型需通過工具鏈引入有監督學習思維鏈,使推理步驟可解析,并通過變換場景來增加遷移學習能力。此外,引入反事實數據測試可以提高模型泛化能力。

目前,國內已涌現出一些提供MaaS工具鏈的平臺,例如百度的“文心千帆”大模型服務平臺、華為的盤古工程、騰訊的混元大模型精調工具鏈以及阿里云的MaaS平臺(靈積平臺)。這些平臺提供了各種控制和導向大模型方向的工具,幫助企業更好地發揮大模型的應用價值。

4 大模型推動云服務創新

大模型的崛起對云計算各個層面產生了深遠的影響,在IaaS中推動了存算一體的算力架構:在PaaS領域促進了AI PaaS的發展,支持了專業大模型的快速構建和部署:為MaaS提供了更靈活的模型定制,進一步推動了云端AI應用:對SaaS而言,大模型通過創新解決了定制化、成本和服務質量等問題,提升了實操價值。這一系列變革構建了更智能、高效的云計算生態。

4.1 大模型時代對算力網絡的要求

在大模型時代,對算力網絡的要求將更加嚴格。
1)感知。算力網絡需要感知各種應用需求.為不同的應用提供差異化的服務水平(SLA)保障。此外,對于關鍵應用,需要實時檢測性能,以確保用戶體驗達到最佳水平。

2)實時。算力網絡需要支持對熱數據的即時計算,使網絡時延低于10 ms。具備低延遲和確定性的網絡連接有助于縮短服務器問的梯度同步數據的傳輸時間,從而降低計算資源的消耗。

3)無損。消除網絡數據包丟失,以減少由于服務器集群內計算協同等待而產生的開銷。根據實驗統計,0.1%的丟包會引起算力損失50%,因此無損傳輸是至關重要的。

4)彈性。提高海量小文件的加載速度,并提高AI大模型圖形處理器(GPU)的利用率。理想的網絡應當具備合理的存算比,并能夠迅速適應對彈性吞吐量的需求。

5)按需。集成身份/目錄服務、防火墻、零信任網絡訪問等安全服務.提供可見性和流量管理功能,并支持網絡即服務(NaaS)。

6)智簡。針對大模型訓練成本,優化資源配置,為客戶提供最優的算力接入和使用環境。

7)安全。確保數據能安全傳輸到算力節點并安全返回結果。需要提供算力租戶問的安全隔離,有效防御外部攻擊和數據泄露,實現終端的安全接入。

8)低碳。通過優化調度策略、合理利用資源、使用綠色能源等手段,降低能耗,實現低碳計算的目標。

4.2 大模型推動IaaS創新發展

大模型的興起推動了IaaS的創新發展。IaaS提供包括服務器、虛擬機、存儲、網絡和操作系統等基礎設施服務,具有彈性伸縮、自助服務、按需付費等特點,適用于靈活可擴展基礎設施資源的開發測試、高性能計算和容災備份等場景。受到大模型對算力的高需求影響,企業更趨向于從自建數據中心向公有云遷移,從而進一步促進了IaaS的發展。盡管MaaS的m現暫時可能使人們忽視了IaaS的重要性,但實際上,MaaS在很大程度上仍然依賴于IaaS的支持。

IaaS主要有兩種模式:常規的存算分離模式和存內計算模式。

圖4 IaaS的兩種模式
在大模型訓練中,對帶寬的高需求通常會導致數據傳輸時延和響應速度成為限制因素。無論是從外部儲存器向芯片搬運數據,還是芯片內部的數據總線傳輸,其物理限速的提升每年僅約為10%.遠低于芯片算力基于摩爾定律60%~70%的年均增速。這種“存儲墻”現象削弱了算力的利用率。

因此,發展存算一體的算力架構成為了一種解決問題的方式,能夠減少數據搬運帶來的時延。以阿里智算IaaS服務為例,其單集群可支持最大十萬卡GPU,智算集群可同時承載多個萬億參數的大模型進行在線訓練,并通過自研的遠程直接數據存取(RDMA)網絡架構為萬卡規模的AI集群提供無擁塞通信,使AI訓練效率提升10倍,推理效率提升6倍。

4.3 大模型催生AI PaaS創新發展

大模型的興起推動了PaaS向AI PaaS的創新發展。PaaS提供了應用程序開發和部署的平臺,包括操作系統、開發工具、數據庫、中問件和運行時環境等,具備自動化擴展、多租戶支持等特點,適用于簡化開發過程、快速部署和擴展的場景,如Web應用開發和移動應用開發等。

大模型在性價比、可靠性、易用性等方面都面臨著落地的挑戰,開發人員迫切希望PaaS能夠增加對大模型的支持,以便快速構建專業大模型、測試和部署相關應用。為此,AI PaaS應運而生,它在PaaS的基礎上集成了AI功能,以支持大模型的端到端并行訓練優化、場景模型遷移和應用集成等需求。同時.AI PaaS也需要得到大模型的支撐。MaaS通過大模型可優選小程序及配套的低代碼開發和模型編排等工具,定制化補充或增強PaaS工具軟件的平臺能力。

舉例來說,阿里低代碼平臺(aPaaS)允許開發人員創建大規模應用程序,后續還進一步推出了酷應用(bPaaS)、連接平臺(iPaaS)、數據平臺(dPaaS),提供各類模型調度平臺、模型訓練平臺、插件開發平臺等服務,不斷細分深化服務層次,支持企業開啟各種數字化的AI場景。此外,百度整合自研飛槳深度學習框架和百度文心大模型,打通了樣本中心、模型中心、AI開發平臺和AI服務運行平臺,實現了從數據存儲到模型訓練、生產、部署、測試的全鏈路、批量化生產。

4.4 大模型重新定義SaaS

大模型為SaaS帶來了全新的定義。SaaS作為一種將軟件應用程序作為服務提供的模式,廣泛涵蓋了企業資源規劃(ERP)、客戶關系管理(CRM)、協作工具和電子郵件等領域,具備即插即用、按需定制、資源共享等特點,適用于降低部署和維護成本、快速獲取軟件功能的場景,例如辦公協作、客戶關系管理和人力資源管理等。

然而,B端應用(面向企業用戶的互聯網產品)在模型專業深度、迭代效率、數據安全以及高算力成本等方面存在一系列問題。企業個性化需求的增加使得SaaS長期面臨著定制化要求高、使用頻率低、獲客成本高、異常消耗后期服務等挑戰。在這一背景下,大模型的出現有助于SaaS突破這些困境。只需對大模型進行微調或精調.就能生成面向特定場景的算法。這種“工廠模式”有助于避免過去“手工作坊定制算法”的高成本.解決了傳統SaaS在滿足客戶定制化需求、標準化產品和規模化盈利問的難題。

大模型使自然語言成為使用APP的界面,客戶通過人機交互便能調用滿足業務需要的功能,顯著降低調用APP的門檻,節約學習成本。大模型形成的數字內容孿生、編輯、創作i大能力及衍生的文本生成功能正好適應SaaS辦公場景。盡管大模型的訓練成本較高,但其部署范同廣,入門門檻低,且邊際效應呈遞增狀態。再加上公有云的規模化效應,可以在云上低成本獲取大模型,帶有天然的成本及可操作性優勢。因此,兩者的結合可以極大地優化SaaS的交付方式,提升其實操價值。

5 大模型賦能企業數字化轉型

大模型常會與大寬帶、大連接、大平臺聯合應用,如圖5所示。在離散制造現場,5G客戶端終端設備(CPE)通過WiFi連接可編程邏輯控制器(PLC),再連接產線裝備以收集相關數據。在流程制造現場,由于存在大量的危險品,傳感器、工業模塊等設備不能采用交流供電,因此PLC控制器被替換為使用先進物理層的控制器(APL)。APL通過單線式以太網實現遠距離直流供電。

數據通過5G信號從CPE傳輸到基站,然后再下沉到企業。大企業可以在其內部構建企業云,而中小型企業則可以通過5G連接到公網,再利用互聯網訪問人工智能平俞。5G的核心網具有控制面和用戶面分離的特征。用戶面功能(UPF)可以下沉到企業,在5G公網上建立虛擬的5G專網。企業級UPF可以進一步下沉到網絡邊緣,通過IPv6的多歸屬特性實現數據的本地分流,保障敏感數據不外泄,滿足超低時延和超高帶寬的需求。

通過修改5G核心網的用戶數據庫(UDM),可以設定特定的一組終端,形成5G LAN,提供本地L2包(數據鏈路層的包,即第2層的包)轉發能力,以實現對WiFi更好的覆蓋和業務隔離。因此,企業僅需配備5G CPE,通過UPF下沉和IPv6上云(公有云、企業云、混合云或多云),就可以無需自建T業互聯網平臺及企業大腦,實現大數據分析與AI決策能力,有助于推動數字化轉型。

6 從云網協同走向算網融合

當前正處于網絡云化的不斷推進階段,而向著云網協同和算網融合的目標邁進仍需經歷一段漫長而持續的發展歷程。這一過程不僅為數字化轉型提供更為強大和高效的基礎設施支持,也為未來智能互聯時代的到來奠定了堅實基礎。

網絡云化的核心技術包括軟件定義網絡(SDN)和網絡功能虛擬化(NFV)。SDN用于實現承載網的控制和轉發功能的分離.而NFV主要將網絡設備的軟硬件解耦,實現設備如UPF、基站、內容分發網絡(CDN)、CPE、PLC等的云化陀。此外,對IPv6的編程空問進行開發并拓展其功能也是必要的。
云網協同的實現主要是在數據中心引入SDN技術,并利用IPv6對軟件定義廣域網絡(SD—WAN)進行賦能。通過這樣的方式,可以實現數據中心問以及數據中心與用戶問多云互聯或云邊互聯。采用基于IPv6轉發平面的段路由(SRv6)和業務鏈技術(SFC)可以優化流量路徑。云網協同的實現面臨著諸多挑戰,如協議不一致、數據共享程度低、缺乏云網整體視圖、算力與路由分配脫節等。

算網協同將集中式的算力資源與分布式的邊計算相結合,使得SRv6能夠充分發揮其作為云網邊端統一承載協議的作用,是云計算的重要應用之一。
算網融合的實現需要采用算力度量、算力標識、算力感知、算力路由等技術。基于IPv6的算力資源和網絡資源的統一管理,包括統一標識、統一調度、智能編排、統一運營等,是實現算力和網絡深度融合的關鍵。

目前正處在網絡云化、云網協同、算網融合的技術發展過程中,這一過程并非一帆風順,尤其在云網協同方面。據統計,0.1%的丟包率可能導致算力損失高達50%,突顯了網絡性能對算力效率的重要性。網絡基于IPv6的能力與大模型的相互作用,將更好地推動朝著云網協同和算網融合的目標邁進。

7 AI加速數智化發展

目前正處于第3次工業革命的浪潮之中,前兩次工業革命歷經百年,因此我們有理由相信這一波工業革命將貫穿本世紀.工業革命進程。盡管有觀點認為信息化已經演進了很長一段時問,發展勢頭會有所減緩,但當前芯粒和SIP技術為延續摩爾定律提供了新的動力。大算力的崛起突破了算法演進的瓶頸.人工智能憑借其強大的賦能能力驅動著新一代IT創新,而大模型技術則迅速推動著技術革命的進程。

當下,數字經濟的新時期已經到來,經濟生產要素從農業時代的土地和勞力、工業時代的技術與資本,轉變為信息化時代的新生產要素一數據。當前,國際經濟正在經歷調整,信息化正逐漸演化為數智化,同時網絡技術創新也在迅速發展。互聯網進入了IPv6+主導期,光纖通信邁人了F5G的成長期,移動通信啟動了5G-A的新周期,工業互聯網進入攻堅期,AI邁向通用式AI的過渡期,而云網融合、算網協同正經歷著青春期。這一系列的變革推動著大寬帶、大連接、大數據、大平俞、大模型、大智能的發展


返回列表