對話後摩智慧CEO吳強:用存算一體解鎖大算力晶片,不復制別人的路

對話後摩智慧CEO吳強:用存算一體解鎖大算力晶片,不復制別人的路

底層創新技術路線的發展,將開創出AI晶片新思路。

作者 |

心緣

編輯 |

漠影

寫在前面:

12月21日-22日,GTIC 2021全球AI晶片峰會將在北京舉行。屆時,來自晶片巨頭、獨角獸公司及創業新秀的產業大咖和技術專家將同臺分享AI晶片的技術創新和落地經驗。大會前夕,芯東西對參會嘉賓進行系列深度對話,提前一睹他們對產業的真知灼見。本期對話嘉賓為後摩智慧創始人&CEO吳強。

2021年的AI晶片圈,“大算力晶片”無疑是熱度最高的話題之一。這個由英偉達、英特爾等半導體巨頭執掌的賽道,正有一批創業新秀摩拳擦掌。

在產業界,吳強已經歷練了大約20年。他經歷過CPU和GPU的鼎盛時期,見證過網際網路巨頭的崛起,也曾親臨人工智慧新一股浪潮爆發的前線。

從AMD的GPGPU/OpenCL創始團隊核心成員、Facebook總部資深科學家,到國內知名AI晶片獨角獸公司技術副總裁和CTO,他經歷了一次次身份轉變,在2020年底踏上新的創業旅程。

這次創業,吳強思忖已久。此時的雲端及邊緣計算領域略顯擁擠:高舉“國產替代”旗幟的GPGPU賽道,已經聚集了一隻手數不過來的創企。吳強不想做同質化的事。

在他看來,顛覆性的新興技術,才能真正帶來趕超巨頭的機會。由他創辦的後摩智慧,在國內率先提出基於存算一體,做面向邊緣端及雲端推理的大算力AI晶片。

創立不滿一年,後摩智慧已完成兩輪數億元融資,並於今年8月完成首顆核心技術驗證晶片的設計。在近日的深入交流中,吳強告訴芯東西,其首顆樣片已投片送測。

他希望後摩智慧的選擇,能讓中國AI晶片成功的機率,變得更高一點。

對話後摩智慧CEO吳強:用存算一體解鎖大算力晶片,不復制別人的路

一、未來15年,必有AI晶片超越英偉達GPU

20世紀90年代末到本世紀初,奔騰(Pentium)系列高效能處理器橫空出世,翻開英特爾輝煌的篇章,由此連續10年主宰全球PC處理器市場。許多偉大的研究論文也開始層出不窮。

那時,正在美國普林斯頓大學計算機科學博士學位、研究計算架構和編譯器的吳強,被英特爾攪動的PC風雲所觸動,對晶片行業心嚮往之,先是進入英特爾參與研發高效能計算處理器安騰,隨後加入AMD轉向GPGPU研究。

經歷幾波科技浪潮,吳強總結出一個規律:

技術永遠是被需求驅動的,而人工智慧(AI)是新一輪晶片熱潮爆發的根本原因。

早期從DOS到Windows作業系統,對速度要求很高,如果不換智慧機,軟體跑不起來。底層晶片的快速迭代推動了很多偉大的工作出現。但後來隨著PC市場開始飽和,很難再出現顛覆業界的新軟體。到2009年左右,晶片行業已經陷入低潮。

PC產業被連年唱衰之際,網際網路企業卻在爭議中走到了歷史舞臺的中心位置,透過網路不斷吸納海量資料,帶動起全球的流量風暴。

吳強意識到,PC市場對算力的需求越來越弱,而大資料、平行計算、高效能計算的需求之門正被網際網路企業開啟。他轉而進入Facebook,親歷了這家企業從數百人的創企成長為科技巨頭,直至2017年,晶片行業因為AI的方興未艾,再度湧動起創新的熱潮。

“AI的出現帶動了所有算力的需求。”吳強說,因為智慧化符合人性,沒人喜歡苦累繁複的工作,他堅信AI普及會是大勢所趨。AI對算力更大的需求,驅動了晶片產業的變化。“所以,我一定要做AI晶片,因為它有需求,有需求就有發展。”

伴隨著AI興起,一家美國晶片公司開始飛昇,它就是AI訓練加速市場的霸主——英偉達NVIDIA。

英偉達是第一家、也是迄今最成功的AI計算晶片公司。在2006年以前,英偉達更多是作為遊戲顯示卡龍頭享譽全球,解決了GPU統一程式設計難題的軟體平臺CUDA橫空出世,並在數年後與GPGPU聯手,成為AI技術革命的核心燃料。

乘上AI東風的英偉達,股價一路走高,如今最新市值已逾8000億美元。

對話後摩智慧CEO吳強:用存算一體解鎖大算力晶片,不復制別人的路

吳強從2006年就開始接觸和研究英偉達產品,對CUDA和GPGPU架構設計有深入理解。

現在主流的AI計算源自GPGPU,而GPGPU源於圖形處理單元GPU。GPU本來用於做圖形渲染,漸漸地,研究人員開始嘗試讓它做非圖形相關計算,由是出現general purpose GPU,即業內常說的GPGPU。

但第一個成功的路線,就是最好的路線嗎?

“不一定。”在吳強看來,英偉達的成功存在一定的歷史偶然性,“我們需要回答的問題是,我們能不能做出一個更符合AI計算特性的東西來。”

他坦言,這條路必然充滿挑戰,但

如果放大時間維度,看向未來15年,一定會有人能做出來

二、大算力晶片時代到來,政策加碼、資本湧入

“挑戰英偉達”,凡是站定AI晶片賽道的初創公司,幾乎都會喊出這樣的口號。

但在英偉達極厚的軟體生態壁壘面前,即便有些海外創企已經大牛如雲,至今仍在挑戰英偉達的道路上步履維艱。

不過,中國正迎來新的時運。

從2018年開始,持續不斷的中美貿易摩擦將晶片半導體這一資訊產業“軟肋”推至風口浪尖,國產替代的號角吹響,資本開始傾注各個“卡脖子”的關鍵賽道,許多行業老兵選擇跳入創業的汪洋。

吳強亦是如此,他看見了中國AI晶片枝繁葉茂的遠景,並關注到一個千載難逢的機會——中國人敢做大晶片了!

中國有上千家晶片設計企業,其中早期一批晶片企業大都在做小型應用晶片,包括WiFi晶片、電源晶片、藍芽晶片等等。但做大算力晶片的玩家相對少見。這是個高投入、高門檻、高試錯成本的賽道,一個晶片流片動輒要耗去幾千萬美元。

現在,在政策鼓勵、需求激增、資本力捧的大環境下,大算力晶片創業的池子正在變大、變得活躍,很多像吳強一樣在工業界做了20年的老兵開始入局。

這促使吳強在創業之初便下定決心:“

第一,我要做AI晶片;第二,我要在中國做。

做什麼?是下一個要解答的問題。

吳強觀察到一個現象,創業者總是一窩蜂地衝到同質化賽道,國產替代彷彿成了“金字招牌”,搶產能、搶人才等浮躁現象出現,在他看來,這些並不利於國內晶片發展。

大算力AI晶片領域存在類似的境況,“英偉達怎麼做,那我也國產替代複製一遍。”吳強覺得這種用英偉達的方式打英偉達,很難實現真正的超越。

他也支援有人做傳統路線的國產替代,只不過,

總要有人去探些新路,選擇另闢蹊徑,也有助於增加中國AI晶片成功的機率

因此,2020年下半年,面對已經聚集著一批雲端AI晶片創企的國內市場,吳強決定去走一條截然不同的路——用存算一體做大算力晶片,並立下實現單晶片算力高達1000TOPS的目標。

三、“不復制別人走過的道路”

為什麼選擇存算一體?這是綜合考量的結果。

吳強在計算晶片及編譯器等技術積累深厚,曾獲第38屆計算機體系架構頂會MICRO-38唯一的一個最佳論文獎,其科研成果被美國業內雜誌IEEE Micro評選為年度最有影響的12個科技成果之一,並多次擔任國際會議專案委員會委員和國際期刊的客座主編。

除了早年研究的GPU外,他也是谷歌第一代TPU論文的5個主審編之一,非常清楚TPU的技術底層邏輯。在研究過各種非常規的新興技術後,吳強認為存算一體可能顛覆傳統AI晶片的路徑。

對話後摩智慧CEO吳強:用存算一體解鎖大算力晶片,不復制別人的路

▲吳強與團隊交流(來源:焦點訪談)

他將AI晶片公司分為三類:

(1)把AI演算法與硬體高度融合,將演算法一部分固化在硬體;(2)仿照英偉達的技術路徑,把GPGPU做影象的東西去掉,只保留做AI計算的部分;(3)針對某一類應用場景或某一種工作負載來做相對定向最佳化的AI計算

這三類都有不少公司在嘗試。一方面,這些方式很難在通用性和效率上做到兩全。另一方面,用這種方式去挑戰英偉達,會面臨巨大的工程上的挑戰,很難真正超越英偉達。

而存算一體並沒有遵循傳統的馮·諾依曼架構,而是更多是從底層技術去重新設計,用儲存介質承擔計算任務,以節省資料在儲存與計算單元之間搬運所導致的延時和能耗。這是一個全新的維度,是可以在不損失通用性的前提下,實現效率的提升。

做存算一體AI晶片在業內已經有公司在嘗試,但用存算一體做大算力AI晶片,彼時在國內並不多見。

早先存算一體技術活躍於學術界,國內外也出現了一批團隊嘗試先做小算力晶片。他們對推動“存算一體”晶片的發展做出了積極的貢獻,也增加了外界的關注度。

吳強不想“複製別人的存算道路”,他觀察到

技術發展至新階段,用存算一體做大晶片已成可能

存算一體晶片的實現依賴儲存介質。早期存算一體技術在做大算力方面有一定侷限性。近幾年(特別是2018年之後), 新型存算技術和新型儲存介質技術都發展到了一個新階段,用存算一體做大算力晶片已成可能,商業落地的苗頭漸顯。

吳強想,結合自身積累的工業經驗和學術資源,也許能抓住這個時代機遇,達到更高的天花板。

四、先攻邊緣端和雲端推理,首顆樣片年底回片

做大算力存算一體AI晶片,既離不開擁有工程實踐經驗、做過大算力晶片的人才,也需要存算一體技術積累深厚的人才。

吳強本身兼具長期的工業背景和很強的學術資源,因而能將這兩撥人聚在一起,他也將此視作團隊核心競爭力所在:

兼備學術創新能力和工程能力,具有架構、演算法、軟體等層面的綜合積累,並熟悉整個產業鏈玩法,深入理解要以下游客戶需求為出發點反過來定義晶片,而不是先有技術這把“錘子”,去到處尋找“釘子”

“我比較幸運,團隊裡有這樣的人才。”吳強說,其團隊成員在存算一體研究的技術積累超過15年,在學術頂刊發表過多篇相關論文,並有業內最豐富的學術流片經驗。

一方面,只有具備學術創新能力才能真正做到“知其然,並知其所以然”;另一方面,除了能按論文理論做出晶片,團隊還需能將晶片理論產品化,只有擁有工程化經驗、做過晶片並深入理解客戶需求的團隊,才有能力快速地往前走。

聚集了多位能力強、有技術信仰和長期主義的人才,這是創業以來,尤其令吳強最感到驕傲的事。有的團隊成員是從異地加入,有的放棄了高薪或數量可觀的成熟上市公司期權,他感慨道:“這說明對方是真正認可你在做的事情。”

對話後摩智慧CEO吳強:用存算一體解鎖大算力晶片,不復制別人的路

▲後摩智慧辦公室(來源:焦點訪談)

在吳強看來,大晶片創業要闖三道關:

做出來、落地、規模化商用

多數晶片公司都能做到第一步,即做出晶片;接下來真正難的是落地商用,這將會經歷一段很艱難的日子;實現落地難關的公司將到最後的衝刺階段——起量,這時市場會排出前幾名。

因此,在解決做什麼、怎麼做的問題後,接下來的關鍵戰略選擇,就是

晶片首先落在什麼場景

在雲端訓練領域,設計出效能、能效超過英偉達GPU的晶片並非不可能的事,英偉達真正堅不可摧的是由CUDA+GPGPU砌成的生態壁壘。吳強認為,要替代英偉達,起碼要比英偉達的產品效能好5~10倍,1~2倍的改良客戶可以就等下一代產品,沒必要忍受一個新的、沒那麼順手好用的軟體。

他選擇先從競爭對手相對薄弱的環節——邊緣端和雲端推理攻入。當前AI推理晶片普遍採用特定領域架構(DSA),其效率與通用性存在天然矛盾,而存算一體恰恰能發揮出兼顧高效能與通用性的優勢。

經過近一年的發展,如今後摩智慧的團隊規模擴大至近百人,研發團隊碩博士佔比超80%,申請了10餘項新專利。

吳強透露道,後摩智慧的

首顆“存算一體”大算力樣片已經投片送測,預計年底回片、明年點亮

五、結語:大晶片創業視窗收窄,創新值得被鼓勵

據吳強觀察,中國大晶片元年從2018年開始,到今年是三年的開放視窗期,待到今年年底後,創業視窗將收窄,再想入局可能為時已晚。此時早期一批玩家已經各佔一席,如果還在做基於類似技術的產品,很難做出差異化。

除了存算一體外,吳強也希望國家可以多鼓勵企業去探索其它的底層創新技術路線,尤其是新材料、新儲存介質等基礎技術,這些技術的發展,甚至有望推翻整個計算機設計的基本假設,開創出AI晶片新思路。

“如果中國真想超越美國,需要有人去做這樣的事情。”他呼籲無論是投資還是創業,都少做同質化探索,多往不同的創新技術路線去佈局和分配資源,才更有可能抓住歷史機遇。

隨著更多投資者開始關注新興技術賽道,國內市場將有一個大浪淘沙的過程,然後趨於理性,留下真正產生價值的AI晶片公司。

峰會推薦

從2018年3月舉辦國內首場AI晶片產業峰會至今,每一年,我司都會聚焦AI晶片領域,透過舉辦產業峰會,緊扣時代脈搏,聆聽行業足音。今年,12月21日-22日,GTIC 2021全球AI晶片峰會繼續與你相約北京,歡迎大家報名參會。

目前北京大學微納電子研究院院長、微納電子學系主任蔡一茂教授,NVIDIA中國區工程和解決方案高階總監賴俊傑,瀚博半導體創始人&CEO錢軍、地平線聯合創始人&CTO黃暢、登臨科技創始人&CEO李建文等16位重磅嘉賓已經確認參會。

大家可以點選

【https://aiorang。com/f/avmOhaIj1fmOB0】

進行報名。組委會的工作人員將會在每週五對大家提交的報名資訊進行稽核,並以簡訊形式通知。