Top
首頁 > 快訊 >

剛剛,華為重大發布!

發布時間:2023-07-07 20:55:50        來源:金融界

“華為的大模型不作詩,只做事”,華為常務董事、華為云CEO張平安在2023年華為開發者大會上直言。


【資料圖】

7月7日,在華為開發者大會上,華為正式發布盤古大模型3.0。與此前發布的大模型不同,盤古大模型“不為聊天而生”,專注于包括礦山、氣象、金融等不同場景、不同行業多樣化需求。用張平安的話說就是“我們從來不會將盤古大模型對標ChatGPT”。

今年上半年,國內大模型如雨后春筍般出現,令國內AI算力需求陡增在。此次發布的盤古大模型另一大看點在于底層基于華為昇騰AI算力集群,按照華為方面設想,相較于火遍全球的GPU架構,昇騰AI算力集群希望成為國內AI算力另一極。

不作詩、只做事

“今年上半年,光國內就發布了86個大模型,這些大模型都有很強對話能力,市場也在疑惑,華為的大模型在哪里?”張平安在開發者大會上表達出業內對于華為的疑惑。在這一背景下,華為盤古大模型“千呼萬喚始出來”。只不過,按照華為給予的定位,與其他大模型不同,盤古大模型“不作詩,只做事”。

實際上,華為在2021年就立項盤古大模型,目前在CV大模型、NLP大模型、科學計算大模型等領域都有技術和落地案例。在此次開發者大會上,華為正式發布盤古大模型3.0。

據介紹,本次大會發布的盤古大模型3.0是一個面向行業的大模型系列,包括“5+N+X”三層架構。

其中L0層包括自然語言、視覺、多模態、預測、科學計算五個基礎大模型,提供滿足行業場景中的多種技能需求,另外華為方面提供100億參數、380億參數、710參數和1000億參數的系列化基礎大模型,匹配客戶不同場景、不同時延、不同響應速度的行業多樣化需求。

同時,盤古大模型提供全新能力集,包括NLP大模型的知識問答、文案生成、代碼生成,以及多模態大模型的圖像生成、圖像理解等能力。

在L1層,是N個行業大模型,華為云既可以提供使用行業公開數據訓練的行業通用大模型,包括政務,金融,制造,礦山,氣象等大模型;也可以基于行業客戶的自有數據,在盤古大模型的L0和L1層上,為客戶訓練自己的專有大模型。

張平安在會上提及,L0和L1未來將會是盤古大模型規劃重點。而L2層則是提供更多細化場景的模型,更加專注于政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業應用或特定業務場景。

不為聊天而生

“盤古大模型出生就不是為聊天而生,我們也從來沒有想過對標ChatGPT,這是與其他大模型最大的不同,”張平安對記者表示。

那么,盤古大模型究竟能用于什么場景?華為在開發者大會上舉例介紹,在煤礦領域,盤古礦山大模型已經在全國8個礦井規模使用,一個大模型可以覆蓋煤礦的采、掘、機、運、通、洗選等業務流程下的1000多個細分場景,讓更多的煤礦工人能夠在地面上作業,極大地減少安全事故。

在鐵路領域,盤古鐵路大模型能精準識別現網運行的67種貨車、430多種故障,無故障圖片篩除率高達95%,將列檢員從每日數百萬張的“圖海”檢測中解放出來。

在氣象領域,盤古氣象大模型是首個精度超過傳統數值預報方法的AI預測模型,同時預測速度也有大幅提升。原來預測一個臺風未來10天的路徑,需要在3000臺服務器的高性能計算機集群上花費5小時進行仿真。現在基于預訓練的盤古氣象大模型,通過AI推理的方式,研究者只需單臺服務器上單卡配置,10秒內就可以獲得更精確的預測結果。

在制造領域,過去單產線制定器件分配計劃,往往要花費3個小時以上才能做齊1天的生產計劃。盤古制造大模型學習了華為產線上各種器件數據、業務流程及規則以后,能夠對業務需求進行準確的意圖理解,并調用天籌AI求解器插件,1分鐘即可做出未來3天的生產計劃。

AI算力另一極

值得注意的是,盤古大模型從芯片、AI框架、AI平臺實現了全棧創新。

“眾所周知,我們不能使用行業主流的GPU架構,因此我們只能自己搭建框架和平臺,” 張平安在會上表示。據他介紹,盤古大模型算力基于華為昇騰AI集群,其中核心則是達芬奇架構的昇騰芯片適配神經網絡計算。

資料顯示,達芬奇架構是華為自研的面向AI計算特征的全新計算架構,具備高算力、高能效、靈活可裁剪的特性。具體來說,達芬奇架構采用3D Cube針對矩陣運算做加速,大幅提升單位功耗下的AI算力,每個AI Core可以在一個時鐘周期內實現4096個MAC操作,相比傳統的CPU和GPU實現數量級的提升。

大模型加速迭代趕超的背后,是不容忽視的算力挑戰。大模型研發高度依賴高端AI芯片、集群及生態,高計算性能、高通信帶寬和大顯存成為大模型訓練必不可少的算力底座。

“現在行業中面臨的普遍問題是GPU芯片獲取困難,這一領域也存在‘卡脖子’風險,”張平安在會上直言。在他看來,昇騰AI集群方案投入使用,可以解決AI領域高成本問題。

張平安表示,基于昇騰AI集群的模型訓練效率對比GPU架構提升1.1倍。此外,據他介紹,在大模型訓練過程中經常會遇到GPU故障,研發人員不得不經常重啟訓練,時間長代價大。昇騰AI云服務可以提供更長穩的AI算力服務,千卡訓練30天長穩率達到90%,斷點恢復時長不超過10分鐘。

而且,昇騰云服務除了支持華為的AI框架Mindspore外,還支持Pytorch,Tensorflow等主流AI框架,框架中的90%算子,都可以通過華為的遷移工具從GPU平滑遷移到昇騰。

需要注意的是,就在一天前,此前推出訊飛星火認知大模型的科大訊飛宣布與昇騰AI合作打造通用智能新底座。

科大訊飛方面也表示,訊飛星火認知大模型基于訓練推理一體化設計,實現大模型稀疏化、低精度量化的技術突破,能高效適配昇騰AI,加速大模型的行業落地應用和迭代;另一方面,以昇騰AI為核心,軟硬件協同優化,構建算力集中、性能優越、供給穩定、數據安全的大模型訓練集群。

記者在開發者大會上獲悉,目前華為云2000P Flops單集群的昇騰AI云服務已經在7日在烏蘭察布和貴安同時上線。張平安在會上對記者表示,面對目前業界普遍認可的GPU架構,昇騰AI算力集群希望成為AI算力的另一極。

相關新聞

熱點精選

欧洲精品在线观看| 久久99精品福利久久久| 国产精品视频网站| 97久久精品国产精品青草| 精品影片在线观看的网站| 热99re久久国超精品首页| 四虎永久精品免费观看| 精品少妇ay一区二区三区| 精品久久久久久中文字幕| 国产一区二区精品在线观看| 久久精品桃花综合| 99国产精品热久久久久久 | 真实国产乱子伦精品免费| 国产精品部在线观看| 久久精品国产亚洲AV| 久久精品黄AA片一区二区三区| 国产亚洲精品a在线观看| 国产精品自在线拍国产手青青机版 | 久久99精品综合国产首页| 亚洲国产精品一区二区第一页免 | 国产精品久久久久久久久kt| 国产精品爽黄69天堂a| 无码人妻精品一区二区在线视频| 国产伦精品一区二区免费| 国产精品正在播放| 久久精品网站免费观看 | 麻豆精品不卡国产免费看| 国产高清在线精品一本大道| 国产精品第一页第一页| 亚洲精品无码一区二区| 精品无码成人片一区二区98| 98久久人妻无码精品系列蜜桃| 久久久久夜夜夜精品国产| 亚洲精品狼友在线播放| 国产在线精品国自产拍影院| 无码精品人妻一区二区三区AV| 国产精品视频1区| 国产精品正在播放| 国产成人精品123区免费视频| 日韩精品久久一区二区三区| 女人国产香蕉久久精品|