可生成文本、繪制圖畫的人工智能(AI)工具已然成為芯片廠商的熱議話題。相比英偉達、谷歌、英特爾等傳統(tǒng)芯片巨頭,市場開始更多關注該領域的AI芯片初創(chuàng)公司。
近日,IDC亞太區(qū)研究總監(jiān)郭俊麗稱,以算力每一百天翻一番計算,預計5年之后,整體AI算力將增長超過一百萬倍,并推動相應的算力、基礎設施和芯片市場增長。
(相關資料圖)
英國AI芯片獨角獸Graphcore正是此一輪風口中的主要標的公司。Graphcore提供專為AI計算設計的軟件和硬件,其AI芯片被稱為“IPU”,很適合那些通過消除不必要的參數(shù)來降低計算成本,提高計算速度的計算。
Graphcore總裁兼大中華區(qū)總經理盧濤告訴界面新聞,對于AI芯片公司而言,大模型的意義在于兩點:一方面算力需求更大,無論是做計算機視覺還是自然語言理解,不同垂直領域的AI大模型之間技術會有相似性;另一方面計算范式正在發(fā)生遷移,從以CPU為核心變成AI計算為核心的時代,原有的芯片產業(yè)主導者將從舞臺中央退至邊緣。因此,所有半導體公司需要跟上AI的發(fā)展求新求變。
針對AIGC應用,Graphcore已提出相應解決方案,稱其IPU加速計算卡C600可保證較低的延遲和能耗,同時具有能夠快速遷移模型和軟件棧易用性特點,有利于提供更高效的服務、降低模型部署和運行成本。例如在GPT2-XL模型上,C600推理延時已經達到1ms/token的水平,功耗僅為30瓦。也因此,降成本是其面向AI應用的主要賣點。
Graphcore向界面新聞展示的技術Demo顯示,相比傳統(tǒng)ChatGPT聊天機器人一字一字“蹦”出文字回答,基于Graphcore IPU的ChatGLM-6B聊天回復更快,實現(xiàn)了幾百個字一秒內顯示的“刷屏”式回復。
在如火如荼的AI計算市場上,英偉達憑借GPU(圖形處理器)最先把握住了機會,成為AI企業(yè)不可或缺的芯片供應商,A100和H100系列GPU成為市場優(yōu)先選擇的AI芯片產品。
盧濤告訴界面新聞,IPU架構與GPU不同,在芯片核心數(shù)、存儲和芯片帶寬上均有差別,在保證上千個處理核心同時工作上有自己的理解,這決定了應用上最終會存在差異化表現(xiàn)。但他坦言,一個產品不可能在所有方面都領先,在一些功能特性上,客戶會更喜歡IPU。
盧濤稱對競爭對手充滿敬意,“即使我們每年100%擴張資源,大公司增加1%的資源就比我們要多,所以想在大規(guī)模的全面PK中勝出基本是不可能的。”他稱在目前競爭環(huán)境下,Graphcore需要保持的就是聚焦和定力,經過一定時間后最后實現(xiàn)突破。
云服務商擁有廣泛客戶群,對新型芯片選擇持開放態(tài)度,但對于初創(chuàng)企業(yè)而言,與巨頭企業(yè)同處一個舞臺,競爭仍遍布荊棘。“客戶要求很高,既要求性能也要求性價比,還要比英偉達有獨特的價值,”盧濤稱,“客戶總是對的,他就這樣期望,你必須要有這個認知,認可它才能想出解決辦法,不能總有抵觸心理?!?/p>
與英偉達力推AI云服務類似,Graphcore今年也轉變思路,通過云廠商向客戶提供算力。盧濤稱,目前Graphcore英國總部有幾家緊密合作的云廠商,以云產品形式來提供Graphcore實例,基本不再以單獨硬件產品對外銷售。
盧濤表示,在中國云端市場,Graphcore與金山云和騰訊云合作,目前與另一家大型云廠商公司也在進行合作細節(jié)規(guī)劃中。但他強調,Graphcore針對中國市場有獨立業(yè)務策略:“Graphcore在中國仍以一個算力產品的提供方出現(xiàn),主要策略還是聚焦在一些大型商業(yè)公司需求,即最終以銷售硬件,客戶自己安裝產品的形式來落地。”他表示,對于中國的廣大中小客戶,還是堅定走被集成策略。
(文章來源:界面新聞)
標簽: