全國咨詢(xún)熱線(xiàn):010-67877741/42/43

中國信通院人工智能所發(fā)布《新型人工智能存儲研究報告(2025年)》

發(fā)布時(shí)間:2025-04-27 04:07:39 人氣:258 來(lái)源:中國安全防范產(chǎn)品行業(yè)協(xié)會(huì )

  大模型時(shí)代,數據決定人工智能的高度,更多的訓練數據是大模型迭代升級的前提,更高的數據質(zhì)量也決定著(zhù)大模型訓練的效果。當前,大模型技術(shù)全面推動(dòng)底層基礎設施的發(fā)展,算力需求不斷攀升,海量數據的存儲和處理需求不斷增長(cháng),對人工智能存儲的性能、擴展性、數據韌性、數據范式等都提出更高要求。
  為充分發(fā)揮新型AI存儲對大模型賦能作用,更好支撐大模型發(fā)展,推動(dòng)大模型應用落地,中國信息通信研究院(簡(jiǎn)稱(chēng)“中國信通院”)人工智能研究所特編制《新型人工智能存儲研究報告(2025年)》。2025年4月9日,在中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟第十四次全會(huì )上,中國信通院人工智能研究所發(fā)布此報告,中國信通院人工智能研究所平臺與工程化部主任曹峰對報告進(jìn)行了解讀。
  報告重點(diǎn)對新型人工智能存儲的概念范圍、面臨挑戰、關(guān)鍵技術(shù)和最佳實(shí)踐進(jìn)行了梳理和分析。概念范圍上,梳理了新型人工智能存儲的基本概念,分析了全球人工智能存儲戰略和人工智能存儲現狀。面臨挑戰上,點(diǎn)明了新型人工智能存儲是發(fā)力大模型的基礎,但同時(shí)在海量數據歸集、訓練數據訪(fǎng)問(wèn)效率、推理實(shí)時(shí)性等方面存在諸多挑戰。關(guān)鍵技術(shù)上,闡明了新型人工智能存儲需要從存儲介質(zhì)、架構、系統、管理、編織和安全等方面發(fā)力。最佳實(shí)踐上,介紹了銀行、運營(yíng)商、AI企業(yè)等在新型人工智能存儲的實(shí)踐案例。最后,報告針對當前人工智能存儲發(fā)展的挑戰,提出了未來(lái)我國新型人工智能存儲發(fā)展建議。
   報告核心觀(guān)點(diǎn)
  1.新型AI存儲是指專(zhuān)為人工智能應用和服務(wù)設計的數據存儲系統,具備超高性能、超大容量、極致安全、數據編織等特征,可以有效支撐海量數據的分析和學(xué)習,是AI基礎架構不可或缺的組成部分。
  2.新型人工智能存儲具備極致性能、數據安全、大模型數據范式、高擴展性、數據編織和綠色節能6大關(guān)鍵特征。極致性能密度加快數據供給,提升AI全流程效率;支持向量、KV Cache等數據范式,加速推理應用;AI存儲高可靠性提升基礎設施持續服務(wù)時(shí)間,防勒索和加密保障數據安全;高擴展的AI數據湖降低數據工程和應用對接難度;數據編織實(shí)現全局數據可視可管,通過(guò)數據版本和血緣管理,保障數據質(zhì)量不被破壞;綠色AI存儲,降低每TB數據能耗和占用空間。
   新型AI存儲特征
  3.長(cháng)記憶存儲范式為推理提質(zhì)增效。長(cháng)記憶存儲通過(guò)多級KV Cache機制,降低大模型推理的內存占用和計算開(kāi)銷(xiāo)。它以分級方式實(shí)現“終身記憶”能力,支持長(cháng)序列推理和動(dòng)態(tài)上下文建模。例如,在醫療領(lǐng)域,長(cháng)記憶存儲可緩存病理圖像的歷史計算結果,減少大部分冗余計算,提升推理速度數倍,同時(shí)支持多模態(tài)數據協(xié)同,增強模型對復雜場(chǎng)景的適應性。
  4.數據編織加強數據跨域高效處理。數據編織通過(guò)構建統一數據視圖,打破數據孤島,實(shí)現跨域數據整合與高效流動(dòng)。其技術(shù)包括數據版本管理、數據血緣管理和統一命名空間,確保數據質(zhì)量不下降,并通過(guò)兼容多種存儲協(xié)議實(shí)現AI全流程業(yè)務(wù)的無(wú)縫對接。例如,在A(yíng)I企業(yè)實(shí)踐中,全局文件系統支持數據零拷貝和端到端加速,跨域調度效率提升數倍,顯著(zhù)降低數據治理成本,滿(mǎn)足大模型對場(chǎng)景化數據治理的需求。
  5.超節點(diǎn)存儲架構持續支撐擴展法則。超節點(diǎn)存儲架構通過(guò)全對等、全直通設計,實(shí)現存儲與計算之間高并行數據直通。例如,通過(guò)高通量數據總線(xiàn)互聯(lián),統一內存語(yǔ)義訪(fǎng)問(wèn)數據,實(shí)現計算、存儲資源解耦靈活調度,資源利用率最大化;通過(guò)近存計算將數據預處理功能下沉至存儲層,減少數據搬運開(kāi)銷(xiāo),支撐十萬(wàn)卡級算力集群擴展,滿(mǎn)足大模型對高擴展性和高并行數據流轉的需求。
  6.高性能并行文件系統以存強算。高性能并行文件系統通過(guò)高性能、高可靠、高擴展和加速卡直通存儲技術(shù)特性,提升大模型訓練推理效率。其四大能力包括:百PB/s級帶寬和億級IOPS能力支持超萬(wàn)卡集群無(wú)瓶頸擴展;EB級擴展能力適應海量數據;存儲系統高可用性達到六個(gè)九,實(shí)現軟硬件故障的自動(dòng)切換;加速卡直通技術(shù)實(shí)現數據從存儲到GPU的“一跳直達”。
聯(lián)系我們
聯(lián)系方式

熱線(xiàn)電話(huà)

13910555092

上班時(shí)間

周一到周五

公司電話(huà)

010-67877741/42/43

二維碼
聯(lián)
色欲天堂久久亚洲综合网_色偷偷88888欧美精品久久久_人人澡人人澡人人看_涩爱AV色欲AV极品一区二区