華為云盤古大模型3.0來了！它為何不做中國版ChatGPT？ | AI之聲

2023-07-07 22:53:08 來源：第一財經

今年以來，以預訓練大模型等為代表的新興技術正在掀起新一輪人工智能熱潮，百“模”共生，百家爭鳴下，大模型的真正用處卻依舊朦朧。

在經歷半年多的“狂飆”后，即便是曾經爆火的ChatGPT流量也不再繼續。當C端熱度逐漸褪去，產業界的噪音開始多了起來：僅憑聊天作畫等功能，大模型就可以重構人類社會？人工智能的下一步該如何發展？

(相關資料圖)

“盤古大模型不作詩，只做事。”7月7日下午，華為常務董事、華為云CEO張平安在華為開發者大會2023上再次明確了華為在大模型領域的定位，不做“ChatGPT”類產品。他表示，盤古大模型3.0是一個完全面向行業提供服務，以行業需求為基礎設計的大模型體系。

在華為云看來，人工智能已經成為目前眾多科技企業的戰略競爭焦點，在與實體經濟的結合中，行業大模型扮演著重要作用，這將帶來更大的產業機會。

不做“ChatGPT”

自2022年12月ChatGPT問世以來，AI大模型加速了新一代人工智能的發展。當大模型和生成式AI的技術不斷取得突破，眾多行業人士紛紛開始思考大模型技術在商業化運營中，將會產生何種效用。

在上述開發者大會中，華為認為，大模型正在引領新一輪人機革命，為用戶帶來顛覆式使用體驗。如果說在PC時代，“鼠標+圖形用戶界面”開啟了第一次交互革命；“觸屏+手勢”開啟了移動互聯時代，而“對話+5G”則開啟了智能互聯時代，標志就是以ChatGPT為代表的大模型技術。

2015年12月，硅谷的企業家們開啟了OpenAI的引擎，ChatGPT計劃也在這個時候開始醞釀。而在前一年，谷歌已經收購了DeepMind，并且依靠DeepMind團隊研發的AlphaGo在全球掀起了一場AI風暴。

隨后，谷歌在2017年發布了Transformer大模型，成為了AI大模型的新分水嶺。但令谷歌沒有想到的是，Transformer隨后卻成為了OpenAI滋養ChatGPT的土壤。

OpenAI火爆之后，也激發了科技巨頭對大模型的軍備競賽。今年3月，百度發布了文心一言，并開始將其融入百度的所有業務；4月，阿里發布了通義千問，并于6月將大模型的布局拓展至AI音視頻賽道。據不完全統計，當前僅國內已發布超過80個大模型產品，對應不同行業、不同應用場景，“百模大戰”發展如火如荼。

但在大模型領域走得越久，華為對大模型賽道的態度卻越來越謹慎。“在華為看來，面對當前形勢，既要樂觀，又要保持冷靜。”華為輪值董事長胡厚崑在6日舉行的第六屆世界人工智能大會上表示，人工智能的發展，關鍵是要腳踏實地，推動人工智能走深向實，真正為千行百業服務。

從華為在大模型領域的布局來看，立項于2020年，并于2021年4月發布“盤古大模型”，摸索中，華為逐步確立在這領域的新定位。

從7號發布的內容來看，盤古行業大模型3.0升級后，盤古將是其“大模型系列”的統稱，既包括了語言大模型、視覺大模型在內的基礎模型，也包括了具有行業的屬性的金融，制造，藥物分子的行業模型以及場景開發類別的模型服務。第一財經記者從華為內部了解到，前期，華為云AI已經在各行業有超過1000個項目，這也為盤古大模型在行業中的落地起到了鋪墊作用。

華為創始人任正非曾指出，未來在AI大模型方面會風起云涌，不只是微軟一家。人工智能軟件平臺公司對人類社會的直接貢獻可能不到2%，98%都是對工業社會、農業社會的促進。

在任正非看來，模型的應用有時比模型本身還有前途，華為會做AI的底層算力平臺，但應用平臺不是華為的選項，“在2%的平臺貢獻里，我們占一點點就行。ChatGPT對我們的機會是什么？它會把計算撐大，把管道流量撐大，這樣我們的產品就有市場需求。”

大模型如何從概念走向落地？

在從目前全球市場的競爭格局來看，3000多個可用的生成式AI應用，全球數千家科技公司參與。大模型的一路“狂飆”下，企業需更加明確應用落地的方向才有可能在這場硬仗中突圍。

張平安表示，“目前大模型大多數應用都集中在2C領域，在面向行業應用時，由于行業數據獲取難，技術與行業know-how結合難，大模型在行業的落地進展較慢。”

而華為選擇的突破口一個是放大來自于人工智能芯片的算力優勢，另一個則是在多個場景中進行大模型的深耕。

華為昇騰計算業務總裁張迪煊7月6日接受記者采訪時表示，華為目前已經幫助孵化了20多個基礎大模型，比如科大訊飛的星火大模型，“中國大模型中約一半由昇騰AI支撐”。

2019年8月，華為宣布自研的AI訓練芯片昇騰910商用，7nm制程，稱同等功耗下算力是英偉達V100芯片（英偉達A100上一代產品）的兩倍。根據華為此前公開的信息，每個集群需要1000張昇騰910。在被制裁的情況下，目前華為把昇騰計算集群的規模從最多4000張卡提升到了1.6萬張卡。

這意味著華為成為英偉達之外的“另一個選擇”，為其他行業企業提供大模型的算力并帶動自身產品出貨，形成商業正循環。而在盤古大模型3.0的官方介紹中，該模型已經可以客戶提供100億參數、380億參數、710參數和1000億參數的系列化基礎大模型訓練。

此外，張平安在演講中提到了盤古的“5+N+X”三層架構。

L0層包括自然語言、視覺、多模態、預測、科學計算五個基礎大模型，提供滿足行業場景中的多種技能需求，L1層是N個行業大模型，華為云既可以提供使用行業公開數據訓練的行業通用大模型，包括政務，金融，制造，礦山，氣象等大模型。

L2層為客戶提供了更多細化場景的模型，更加專注于政務熱線、網點助手、先導藥物篩選、傳送帶異物檢測、臺風路徑預測等具體行業應用或特定業務場景，為客戶提供“開箱即用”的模型服務。

換句話，華為的大模型不僅僅面向于對零基礎的行業客戶，也包括了本身做大模型應用的企業。

張平安表示，盤古大模型已覆蓋金融、金融、制造、醫藥研發、煤礦、鐵路等諸多行業。“比如，在藥物研發領域，原來一款新藥研發平均需要10年時間、花費10億美金。盤古藥物分子大模型助力西安交通大學第一附屬醫院劉冰教授團隊發現全球40年來首個新靶點、新類別的抗生素，并將先導藥物研發周期縮短至1個月、研發成本降低70%。”

值得注意的是，除了華為云，目前騰訊、阿里、字節、360等科技企業也看到了行業端的機會，并瞄向行業大模型進行布局。

“對話、寫詩、作畫絕不是大模型的全部。我們需要去深入思考大模型的應用方向。”中國工程院院士鄔賀銓認為，要將大模型切實投入到城市發展、金融科技、生物醫藥、工業制造、科學研究等領域，也需要專業的企業和組織加速其在實體產業落地，為產業剛需帶來實實在在的大價值，真正意義上大規模服務社會。

標簽：