“即便到了今日,千位算力供給仍存在必定缺口,氣象尤其在高性能核算 、看上云核算等范疇。海上海天” 。數智
李彪LB。芯補 ·。算力基建來歷:界面新聞。千位
圖片來歷 :視覺我國 。氣象
界面新聞 | 李彪。看上
界面新聞修改 | 文姝琪 。海上海天
自從ChatGPT 、數智Sora相繼問世以來,芯補全球關于AI大模型的算力基建用處爭論不休 ,至今仍沒有一致明晰的落地使用場景 ,但“算力是AI年代的動力 ,未來將像水、電相同即取即用”卻早早就變成了一項一致 。
特別在上一年國內“百模大戰”時 ,簡直每家大模型廠商在承受媒體采訪時都要答復“魂靈三問” :公司囤了多少張英偉達顯卡 ?大模型缺不缺算力?怎么解決算力緊缺?
天數智芯董事長兼CEO蓋魯江上一年也聽到了外界各種“缺算力”的聲響 。
無論是從無到有地“練習”出一個大模型,仍是有大模型加持后,談天機器人靠“推理”每秒答復上百萬用戶的各種花式發問,背面都離不開很多的算力支撐 。上一年職業界最先進的英偉達A100\H100、A800\H800 又相繼遭美國禁售,更是將算力供需的天平重重壓在了供給一端,市場上掀起了搶購囤卡的熱潮。
“即便到了今日,算力供給仍存在必定缺口 ,尤其在高性能核算、云核算等范疇 。”蓋魯江承受界面新聞專訪告知。
天數智芯是在2018年前后國內的“GPU創業潮”中進入了算力范疇 。與這一范疇傳統的GPU(圖形處理器)道路不同 ,天數智芯挑選的是經過GPGPU(通用圖形處理器)敞開創業 。
一塊GPU顯卡一般需求完結圖形處理和通用核算兩部分使命,傳統GPU早年專為完結圖形處理使命規劃 ,例如3D圖形烘托和2D圖片處理 ,前期首要使用在游戲范疇 。后期則被很多用于處理海量數據的加速核算。
GPGPU更側重于通用核算,包含大規劃數據處理、科學核算 、機器學習算法等。它經過并行處理很多數據和使命 ,供給了更快速和高效的核算才能 。因而 ,也成為了開展人工智能不可或缺的要害設備 。
AI大模型的迸發使得核算規劃急劇脹大。數據顯現 ,OpenAI此前為ChatGPT研制的GPT3模型有1750億參數,就現已要用到1萬張英偉達顯卡來支撐模型練習。而GPT4模型的參數量據爆料更是GPT3的10倍 ,達1.8萬億 。參數規劃越大 ,練習所需的核算量就越大 ,對應GPU需求的也相應翻倍添加。
國內一家排名前三的服務器廠商負責人近期造訪客戶發現,算力需求的規劃眼下仍在成倍添加 。上一年職業建立算力集群都以1萬張顯卡為方針 ,而到今日5萬張都開端變成常態。
而面臨不斷上漲的需求,英偉達頂級產品的猝然禁售留出了巨大缺口,國內GPU廠商正在盡力進入其間補位。
上一年6月,天數智芯研制的通用GPU天垓100,現已被用于支撐某組織70億參數大模型的練習 。上一年11月,天數智芯再次與合作方完結了700億參數大模型的“異構練習”,這也是國內GPU廠商初次完結與世界干流GPU廠商的異構混合練習。
前述服務器廠商負責人表明,由于種種原因 ,將國內及世界不同廠商的GPU產品及其他核算資源混合組成一個集群的“異構道路”是當下的干流挑選。盡管異構在軟硬件上的兼容性仍是困擾職業的一大難題,但天數智芯 、昆侖芯都現已活躍沿此道路布局。
在蓋魯江看來,未來要完結算力像水 、電相同成為根底動力,當下要像曩昔建自來水廠、發電站相同先完結一場“算力基建”。
上海亦在出臺方針,活躍推進投建智算中心 。
本年3月 ,上海市通信管理局等11部分聯合擬定并發布《上海市智能算力根底設施高質量開展“算力浦江”智算舉動實施方案(2024-2025年)》,鼓舞全市加速建造智算中心。依照規劃 ,到2025年,上海市智能算力規劃超越30Eflops(EFLOPS指每秒百億億次浮點運算次數 ,是衡量算力的基本單位) ,到時將占全市總算力的50%以上 ,一起新建智算中心國產算力芯片占比要超越50%。
而當更多的智算中心被建成后,到時也將依照不同的參與者構成新的工業生態:上游參與者包含制冷設備供給商、網絡設備供給商等 ,首要為智算中心供給硬件根底設施;中游則包含智算服務供給商 、IDC服務供給商和云服務供給商等 ,首要供給算力服務、數據服務和算法服務 ,是智算中心運營的要害力氣;下流使用開發者首要使用智算中心的算力資源 ,開發各種智能化使用。
天數智芯旗下的GPU產品已在多個算力項目中落地使用。蓋魯江告知,近兩年來 ,大模型的開展給公司帶來很大推進效果 。天數智芯從2018年就開端規劃GPGPU芯片 ,前幾年要點放在技能攻關和產品性能上,使用場景非常廣泛,包含游戲 、零售、教育、金融、動力等多個范疇 。在這輪大模型掀起的AI浪潮中 ,支撐AI大模型練習、推理以及使用現已成為公司戰略布局的要點。