思思99RE6国产在线播放_日日噜噜夜夜狠狠视频免费_日韩精品中文字幕无码专区_护士AV无码在线观看_国产尤物av尤物在线看

當前位置: 首頁 > 熱點

華為不想走ChatGPT的老路

2023-07-10 21:54:08 來源:市界

經(jīng)歷了上半年的喧囂,ChatGPT帶來的大模型熱潮正在迎來第一輪冷靜期。今年6月,ChatGPT的訪問量首次出現(xiàn)了月度下滑,而年初接入ChatGPT聊天功能的新版必應(yīng)(Microsoft Bing),市占率也在近期出現(xiàn)下滑,甚至低于改版之前。

一切都在預(yù)示著,大模型賽道“看熱鬧”的時刻過去了,市場正在對大模型的實用性提出更高的要求。與C端市場的集體狂歡相比,現(xiàn)在大家更關(guān)心大模型如何在B端行業(yè)落地,僅僅只會“Chat”(聊天)的大模型,已經(jīng)滿足不了需求。

新的競爭局勢已經(jīng)出現(xiàn)。就在剛剛過去的人工智能大會上,一批聚焦不同行業(yè)和場景的大模型開始涌現(xiàn)。從華為、騰訊、阿里到科大訊飛等等,都在試圖讓大模型在商用層面落地。和以前“寫詩作畫”的賣點相比,現(xiàn)在大家更關(guān)心如何讓大模型幫助用戶解決實際問題。


(相關(guān)資料圖)

可以說,主流的大模型玩家們終于開始腳踏實地準備做實事了。

而華為作為國內(nèi)最早投入大模型研發(fā)的科技巨頭,早在2021年就推出了盤古大模型1.0。但是在今年的行業(yè)熱潮中,卻遲遲沒有拿出來自自家的當家產(chǎn)品。直到7月6日世界人工智能大會,華為輪值董事長胡厚崑才正式預(yù)告了盤古3.0的發(fā)布,并提到,未來人工智能的發(fā)展,關(guān)鍵是要“走深向?qū)崱?,賦能產(chǎn)業(yè)升級。7月7日,在華為云開發(fā)者大會(HDC2023)上,華為云正式發(fā)布了盤古大模型的3.0版本。

和ChatGPT不同,盤古3.0并不是一款主打“聊天”的大模型,華為方面甚至提到,盤古大模型在一段時間內(nèi)都不會開放給個人用戶使用,這也不是產(chǎn)品的主要方向。盡管華為并未透露這個時間具體是多久,但至少印證了,“Chat”(聊天)不是盤古大模型研發(fā)的重點。

“我們從來沒有和ChatGPT比較過,沒有叫盤古Chat,也沒有叫Chat盤古,我們沒時間聊天”。華為常務(wù)董事、華為云CEO張平安在7月7日媒體溝通會中提到。

據(jù)華為介紹,盤古3.0大模型不是一個單獨的大模型,而是一系列大模型集群和工程應(yīng)用平臺的總稱,共分為三個層級,既包括了底層(L0)的通用大模型,也包含了第二層(L1)的行業(yè)大模型和第三層(L2)的細分場景模型。

應(yīng)當說,在整個大模型賽道都在爭相比拼誰更擅長寫詩作畫的時候,盤古3.0選擇了一條全新的路,其發(fā)力點不僅在于通用能力的迭代,同時也聚焦于專業(yè)能力的進化,以滿足不同行業(yè)和場景的多樣化需求。

華為顯然已經(jīng)意識到了,大模型要想真正落地,必須要落地解決實際需求。大模型必須要在不同行業(yè)和場景中具有高度專業(yè)的實用能力,才能生存下去。

不做下一個ChatGPT

我們到底需要什么樣的大模型?當ChatGPT以意想不到的速度在全球躥紅之初,可能就連最頭部的科技巨頭也沒想清楚這個問題的答案。在微軟迫不及待地對旗下搜索引擎“必應(yīng)”進行激進改版后,事實證明效果并不理想。

但所有人都相信,隨著生成式AI的智能化水平跨過一個特定節(jié)點,必將徹底重塑整個世界的生產(chǎn)方式——其效果可能不遜于計算機帶來的上一輪信息革命。

在這次大模型團戰(zhàn)中,作為最晚入局大模型賽道的國內(nèi)科技巨頭,華為選擇從自身最擅長的To B市場入局。經(jīng)過上半年的“折騰”,整個大模型賽道也逐步意識到,To C市場雖然熱鬧,但最終大模型還是必須要做深做實,才能在商用層面落地。

“華為的大模型不作詩,只做事?!痹?月7日華為云開發(fā)者大會上正式發(fā)布盤古3.0時,華為常務(wù)董事、華為云CEO張平安如此表示。

作為國內(nèi)最早投入大模型研發(fā)的廠商,華為早在2021年就推出了盤古1.0大模型,而這次正式發(fā)布的盤古3.0則是對盤古1.0的一次重大升級。正如GPT3.0到GPT4.0的升級一樣,盤古3.0也是一次革命性的迭代,并且走了和ChatGPT完全不同的路。

三年磨一劍。在過去兩三年,盤古大模型在架構(gòu)和訓練方法上都進行了重大升級。

在架構(gòu)方面,盤古3.0首創(chuàng)了三層架構(gòu),其最底層是CV(視覺)、NLP(中文語音)、多模態(tài)、預(yù)測決策、科學計算、搜索推薦等一系列通用大模型,第二層是礦山、氣象、藥物分子、電力、金融等行業(yè)大模型,第三層則是解決具體問題的場景模型,具有高度定制化的功能性特征。

而在訓練方法上,盤古3.0也升級了一套從通用到專精的訓練模式,既有行業(yè)常見的預(yù)訓練方法,訓練大模型的通用能力。同時還加入了針對性的特調(diào)訓練,可以通過SFT的數(shù)據(jù)進行精調(diào),滿足不同行業(yè)需求,并且還有RHLF訓練,可以針對客戶的標注和反饋再進行強化學習。

此外,作為行業(yè)首個完全分層解耦的大模型集群,盤古3.0對自身的不同能力進行了區(qū)分,而不是像ChatGPT一樣直接打包成一個巨無霸大模型,讓用戶可以按需取用。

通俗來說,就是盤古3.0的各項能力之間可以獨立運行互不干擾。因為不同行業(yè)不同客戶的需求是不一樣的,例如鐵路行業(yè)可能主要需要視覺模型的能力,氣象行業(yè)可能主要需要科學計算的能力,分層解耦的設(shè)計適合針對不同行業(yè)的定制化需求。

“分層解耦的模式可以把大模型的商業(yè)模式構(gòu)筑得很好,讓行業(yè)客戶就像抓藥一樣想要什么就拿什么?!睆埰桨苍?月7日接受媒體群訪時提到。

依托于全新的三層架構(gòu)和分層解耦能力,盤古大模型的核心定位是對各行各業(yè)進行賦能,其中華為主要專注于L0層級和通識的L1層級。

當然,不管架構(gòu)和能力上有何創(chuàng)新,大模型的核心競爭力最終還是體現(xiàn)在訓練成果上,這背后必須依賴于龐大的數(shù)據(jù)量和算力支撐。

在數(shù)據(jù)方面,盤古大模型預(yù)訓練數(shù)據(jù)中包含了超過3萬億tokens,使用了超過1000+TB的數(shù)據(jù)訓練,指令微調(diào)數(shù)據(jù)也在千萬級。而且和其他通用大模型相比,盤古行業(yè)大模型還采用了不少行業(yè)公開客戶數(shù)據(jù)和行業(yè)客戶授權(quán)數(shù)據(jù)進行訓練,針對性的行業(yè)數(shù)據(jù)訓練進一步提升了盤古3.0解決行業(yè)問題的能力。

在算力方面,由于眾所周知的原因,華為并不能使用通用GPU架構(gòu),只能自己搭建框架和平臺。據(jù)張平安透露,盤古大模型算力基于華為昇騰AI算力集群,核心是達芬奇架構(gòu)的昇騰芯片適配神經(jīng)網(wǎng)絡(luò)計算。但據(jù)華為介紹,盤古3.0基于昇騰AI集群的模型訓練效率對比GPU架構(gòu)提升了1.1倍。

為了進一步提升算力規(guī)模,7月7日張平安在大會上宣布,單集群 2000P Flops 算力的昇騰 AI 云服務(wù)在華為云的烏蘭察布和貴安 AI 算力中心同時上線。相較于火遍全球的GPU架構(gòu),未來昇騰AI算力集群希望成為國內(nèi)AI算力另一極。

在多重創(chuàng)新下,盤古大模型在多項能力上實現(xiàn)了行業(yè)領(lǐng)先,其中盤古NLP大模型是業(yè)界首個千億參數(shù)的中文大模型,具備強大的文本理解和生成能力,CV大模型則首次兼顧了圖像判別與生成能力,在ImageNet 1%、10%數(shù)據(jù)集上的小樣本分類精度上,達到了業(yè)界最高水平。

進入6月以來,不少AI行業(yè)人士都坦承,在年初ChatGPT爆紅之初,整個行業(yè)是存在一定炒作的。當所有企業(yè)都在搶著發(fā)布千篇一律的聊天大模型時,也預(yù)示了這一方向可能開始陷入了一定的誤區(qū)。

今年2月,任正非在“難題揭榜”火花獎座談會上就曾提到,未來AI大模型會風起云涌,不會只是微軟一家。而人工智能軟件平臺公司對人類社會的直接貢獻可能不到2%,98%都是對工業(yè)社會、農(nóng)業(yè)社會的促進。

如今即便是OpenAI也在考慮進入行業(yè)市場,很大程度說明了,行業(yè)化或?qū)⑹钦麄€行業(yè)的必由之路。如何進一步改造工業(yè)社會和農(nóng)業(yè)社會,將是各個大模型玩家需要共同思考的問題。

深耕行業(yè),落地場景

當行業(yè)內(nèi)的玩家都逐步意識到,行業(yè)化正在成為未來大模型競爭的焦點之后,圍繞不同行業(yè)的深入水平,將成為決勝的關(guān)鍵——誰能掌握行業(yè)的真實需求,并切實為行業(yè)解決問題,誰就能最先跑通大模型的商業(yè)模式。

作為全球最大的通信設(shè)備廠商,華為在政企市場有著長達數(shù)十年的積累,在行業(yè)的縱深上有著很大優(yōu)勢。最近兩年,華為陸續(xù)成立了20大軍團,下到礦山、煤井里面去,就是為了進一步打入行業(yè),深度服務(wù)政企客戶。

在7月7日的媒體群訪中,華為云CEO就提到,華為最大的優(yōu)勢就是,行業(yè)業(yè)務(wù)做得比較深,行業(yè)哪里有問題,就能把科學家、數(shù)學家送到哪里去。

“我們的科學家、數(shù)學家可以下到煤礦井里,可以蹲在車間一個月、三個月。我們敢下到田頭、地頭,別人可能下不去或者不愿意下去,這就是華為在大模型上最重要的優(yōu)勢?!睆埰桨脖硎?。

從實際運用來看,此前軍團作戰(zhàn)深耕的不少行業(yè),確實也成為了盤古行業(yè)大模型最先運用的領(lǐng)域。

例如在華為比較擅長的政務(wù)市場,盤古政務(wù)大模型通過對超過20萬條政務(wù)數(shù)據(jù)進行精調(diào),包括12345熱線、政策文件、政務(wù)百科等,掌握了豐富的法律法規(guī)、辦事流程等行業(yè)知識。在深圳市福田區(qū)政務(wù)服務(wù)數(shù)據(jù)管理局的應(yīng)用案例中,基于盤古政務(wù)大模型訓練的福田政務(wù)智慧助手小福,能夠精準理解民眾咨詢意圖。

再比如在金融領(lǐng)域,盤古金融大模型通過對銀行的各種操作、政策、案例文檔進行預(yù)訓練,能根據(jù)客戶的問題,為柜臺工作人員自動生成流程和操作指導(dǎo),將原來需要平均5次的操作降低為1次,辦結(jié)時間縮短5分鐘以上。

在氣象領(lǐng)域,盤古氣象大模型則是首個精度超過傳統(tǒng)數(shù)值預(yù)報方法的AI預(yù)測模型,同時預(yù)測速度也有了大幅提升。原來預(yù)測一個臺風未來10天的路徑,需要在3000臺服務(wù)器的高性能計算機集群上花費5小時進行仿真。

就在這次華為云開發(fā)者大會召開之前,7月6日,《自然》雜志發(fā)表了華為云盤古大模型研發(fā)團隊研究成果——《三維神經(jīng)網(wǎng)絡(luò)用于精準中期全球天氣預(yù)報》。論文顯示,盤古氣象大模型突破了AI預(yù)報天氣精度不及傳統(tǒng)數(shù)值預(yù)報的世界性難題,是首個精度超過傳統(tǒng)數(shù)值預(yù)報方法的AI模型,速度相比傳統(tǒng)數(shù)值預(yù)報提速10000倍以上。

此外,在煤礦、鐵路、藥物研發(fā)等行業(yè),盤古大模型都推出了專用的行業(yè)大模型,進一步幫助行業(yè)提升效率。華為表示,盤古大模型的目標是讓每個行業(yè)、每個人都擁有自己的“專家助手”。

“我們始終堅持AI for Industries的戰(zhàn)略,在深耕行業(yè)的道路上不斷前行。我堅信大模型將重塑千行百業(yè),而每一個開發(fā)者,都將是改變世界的英雄?!比A為云CEO張平安表示。

而在行業(yè)大模型之上,更細分更具體(L2)的場景模型,則是專門為了解決特定問題而生,華為的說法是“開箱即用”。盤古大模型目前已經(jīng)在超過100個實際場景中取得應(yīng)用,降低了人工智能的開發(fā)門檻,平均節(jié)省研發(fā)成本80%以上。

例如在國網(wǎng)重慶供電公司,盤古CV大模型在經(jīng)過海量無標注電力數(shù)據(jù)的預(yù)訓練和少量數(shù)據(jù)微調(diào)之后,被成功運用到了電力智能巡檢中,很大程度取代了傳統(tǒng)的無人機智能巡檢AI模型。在數(shù)據(jù)標注能力上,新模型的樣本篩選效率提升約 30 倍,篩選質(zhì)量提升約 5 倍,以永川每天采集 5 萬張高清圖片為例,可節(jié)省人工標注時間 170 人/天。

在針對司法案件檢索的應(yīng)用中,盤古NLP大模型針對多個行業(yè)難點進行了微調(diào)和優(yōu)化,甚至設(shè)計了新的預(yù)測函數(shù)。最終在中國法律智能技術(shù)評測CAIL (Challenge of AI in Law) 大賽中,以NDCG@30分值0.943的總成績位列第一。

而在貨運列車智慧檢測的運用中,盤古大模型對貨車運行故障實現(xiàn)了精準檢測,可以精準識別442種各類故障。大類故障發(fā)現(xiàn)率達到99.99%,一般故障發(fā)現(xiàn)率超過98%,總體發(fā)現(xiàn)率達到99.8%,超過客戶預(yù)期。

在華為看來,未來大模型將會成為一個從通用到專精的綜合體,其中大語言模型更像是一個內(nèi)腦中樞,提供了自然語言處理領(lǐng)域的通用解決方案:可以理解人類意圖,并通過調(diào)用各種細分行業(yè)模型來服務(wù)行業(yè),而各種聚焦場景的調(diào)優(yōu)模型,則更像是具體的小功能,專門去解決具體問題。

毫無疑問,今年以來大模型賽道的爆發(fā),將成為一場科技革命,徹底重塑整個工業(yè)社會,很多行業(yè)都將被徹底改變。而華為作為一家企業(yè),除了研究和工程化以外,更需要探索新的大模型商業(yè)模型,保證大模型的商業(yè)成功。

如今將盤古大模型分為L0到L2的三層模式,并在完全解耦的基礎(chǔ)上,針對不同客戶的需求進行拆分組合,就是為了進一步探索大模型商業(yè)化的邊界。

華為的大模型之路

幾個月前,國產(chǎn)大模型紛紛橫空出世之時,行業(yè)就一直在期待華為大模型的亮相。作為國內(nèi)AI產(chǎn)業(yè)的頭部玩家,華為一直被視為在人工智能方面積累最深厚的企業(yè)之一,到底華為會走出一條什么樣的大模型之路,也一直被行業(yè)關(guān)注。

雖然盤古3.0的亮相比其他主流玩家都要晚一些,但如果回溯過往,華為對大模型的研究其實由來已久。

據(jù)華為方面披露,早在2020年,華為就判斷未來AI產(chǎn)業(yè)將有兩個主要的發(fā)展方向,一個是從小模型到大模型的趨勢,另一個則是AI和傳統(tǒng)科技計算的結(jié)合,也就是AI for Science。當時華為提出了關(guān)于數(shù)據(jù)模型和知識的6個子課題,其中模型模高的計劃和萬物預(yù)視計劃都和大模型高度相關(guān),在GPT-3推出之前華為就一直在朝著這份方向推進。

但ChatGPT對行業(yè)的推動確實不容忽視,特別是在2020年GPT-3推出后,使整個行業(yè)注意到了大模型加速崛起的新趨勢。華為也從2020年夏天開始進行大模型NLP、大模型CV方向的研究,后來逐漸擴展到了多模態(tài)、個性計算、預(yù)測決策進行立項。

除了入局足夠早,華為在大模型方面的人才積累也足夠深。據(jù)華為方面披露,盤古大模型團隊中有50%以上是博士,還有多名天才少年,這個團隊的平均年齡還不到30歲。這樣一個技術(shù)過硬,且敢于創(chuàng)新的年輕團隊,是盤古大模型背后最堅實的人才保障。

如今盤古3.0的亮相,并選擇了扎根行業(yè)的路線,意味著華為終于朝著自己選擇的大模型之路上踏出最重要的一步,但接下來的下一步將怎么走,和整個行業(yè)一樣,華為也還在摸索之中。

但是摸索不代表猶豫,據(jù)華為云CEO張平安在7月7日的媒體群訪中透露,針對盤古大模型的下一步,華為做了一個非常激進的路線圖,“我們現(xiàn)在是all in盤古大模型,路標圖制定是密密麻麻的。”張平安表示。

在張平安看來,未來盤古大模型更關(guān)注的不是參數(shù)有多大,而是對行業(yè)的垂直滲透率有多高。除了現(xiàn)在已經(jīng)切入的鐵路、煤礦、金融、政府等行業(yè),還有更多的行業(yè)需要自己的大模型。

“盤古大模型將來最有價值的不是5000億、上萬億的參數(shù)。而是在哪些行業(yè)又做深了,又擴展了哪些新的行業(yè)?!睆埰桨脖硎尽?/p>

盡管大家現(xiàn)在都在朝著行業(yè)化的方向邁進,但華為畢竟不同于其他玩家。由于長期在算力底座、開發(fā)框架等方面的積累,盤古大模型還具備了一大優(yōu)勢,就是全棧研發(fā)能力。

今年大模型賽道火了之后,為了滿足大模型訓練龐大的算力需求,英偉達的GPU一芯難求。國內(nèi)整個大模型賽道如今都面臨著算力緊缺,而未來英偉達GPU也很可能將會面臨供應(yīng)限制,這就要求國產(chǎn)大模型必須具備全棧自主研發(fā)能力。

據(jù)華為云CTO 張宇昕透露,盤古大模型從算力到算子,再到框架、開發(fā)平臺等都是自主創(chuàng)新,沒有使用開源技術(shù)。而之所以能夠做到全棧自主研發(fā),主要得益于華為此前在AI底座、算力和芯片等根技術(shù)上的積累。

因為有了昇騰的AI底座,有了Mindspore的計算框架,有了ModelArts訓練平臺等全棧的AI根技術(shù),華為在做大模型的時候,才能針對不同行業(yè)和場景做更深入的優(yōu)化,比其他玩家更深一步。

正如7月6日華為輪值董事長胡厚崑提到的,當前華為在人工智能發(fā)展上主要有兩個著力點,一方面是打造強有力的算力底座,做好產(chǎn)業(yè)基礎(chǔ)設(shè)施,另一方面就是從通用大模型到行業(yè)大模型,服務(wù)好千行百業(yè)。

在這次盤古大模型3.0發(fā)布時,盤古還公布了全新LOGO,新的LOGO上面頂著天,下面踏著地,是盤古開天地的簡化符號?!肮庞斜P古開天地,萬物新生;今有盤古縱四海,行業(yè)重塑?!睆埰桨脖硎尽?/p>

當華為為自家的大模型取名盤古時,或許就意味著,盤古大模型肩扛重擔,如果未來國產(chǎn)大模型也面臨“卡脖子”難題,盤古必須要獨自撐起一片天來。

作者 | 曾廣

編輯 | 李原

運營 | 劉珊

關(guān)鍵詞:

相關(guān)閱讀

Copyright   2015-2022 南方技術(shù)網(wǎng) 版權(quán)所有  備案號:粵ICP備18023326號-21   聯(lián)系郵箱:855 729 8@qq.com