【看中國2023年7月31日訊】一個半個月前,AMD的蘇姿豐發布了新款大語言模型GPU MI300X,據說比Nvidia的H100更小更快。
說起來,美國朋友追求又小又快已經很多年了。
最近,浙江人民出版社的朋友寄給我一本《晶元戰爭》,說你看看。我說我看過英文版,總是打開又合上,合上又打開。他說你是看不懂英文嗎?看不起誰呢,my English is fine thank you, and you?
中文版的《晶元戰爭》翻譯的不錯,作者用一個個晶元發展史上的歷史故事告訴讀者,為什麼靠砸錢和堆人搞不出晶元產業。因為整個行業的分工極為細密,背後是一個極其複雜的商業生態系統,這個系統不可能源於任何政府扶持,也不可能有任何國家做到全產業鏈獨立自主,它依靠的是企業家們像生物演化一樣的:自行冒險和優勝劣汰。
中國人是不缺優勝劣汰的,缺不缺冒險精神,網上一直爭論不休。要說不缺吧,考公的人是越來越多,要說缺吧,ChatGPT大火之後的短短几個月內,國內光是上市公司就有9個老闆說自己要搞大模型後隨即離婚的,導致原本就不富裕的存量夫妻數量因此「雪上加霜」。
最重要的是,你看AI晶元最核心的三個大拿黃仁勛、蘇姿豐和張忠謀都是華裔。再具體一點,他們都是胡建(福建)裔。
一
自從幾萬年前人類征服了藍色星球之後,仰望星空後的好奇促使大家做了一個違反祖宗的決定——暴露自己,不顧黑暗森林法則。至於為什麼這麼做,千百年來從哲學家到科學家做過很多解釋。覺得,主要是因為太過孤獨。
為了對抗集體孤獨感,除了尋找地球之外的智慧生命,還有就是試圖給自己之外的東西注入神性。
從遠古神話裡出現的黃金機器人到雪萊的《科學怪人》,從亞里士多德的三段論邏輯到微積分發明人萊布尼茲試圖設計一種普適性語言,經歷了幾千年的探索,即便在計算機技術不斷進步後,人類還經歷了無數次挫敗。
具體到怎麼讓機器人和人自然對話甚至完成交辦的任務這方面,直到2017年,谷歌的一篇論文《Attention is all you need》,才算是真正打開了局面。這篇論文看起來很簡潔,主要就是講Transformer(翻譯器)是怎麼工作的,這個Transformer就是ChatGPT裡的T。
有了可以驗證的理論,大家就把大語言模型的訓練實現基本簡化為了兩個要素:語料和算力。簡單來說,先要有足夠多的文字內容,然後要規劃學習方法,比如自己學習,工程師監督學習和用戶反饋後的強化學習。看起來和人類學習過程差不多,但機器學習是可以開挂的,想讓它加快學習過程,就要上算力,大幅提升訓練速度。比如,為了訓練ChatGPT-3,微軟給OpenAI配了10000張A100顯卡,單次訓練成本上千萬美元,這個我們中國人理解起來一點也不難。想讓孩子上清北嗎?從小學開始就要擇校,吃好的用好的還要報各種班。
去年底ChatGPT大火之前,連搞AI的人自己都在懷疑自己。阿里雲在去年降價了6次,GPU租用價格下降了兩成,騰訊也直接砍掉了對NVIDIA GPU的採購單。然後,ChatGPT火了,大家紛紛宣布我也行,我也能上。最誇張的是很善於做全家桶的周總(周鴻禕),他說:「比爾·蓋茨都沒我看得準。」
20多年前,從亞馬遜誕生到阿里巴巴誕生,大概用了5年;從有ICQ到騰訊有OICQ,大概用了兩年;從谷歌誕生到百度誕生,大概用了15個月。從ChatGPT大火到「比爾·蓋茨都沒我看得準」用了多久呢?——一個季度。
大家樹新風的樣子,像極了在大集上喝早酒的山東朋友。一開始,鏡頭前的本地大哥都是配著羊湯喝瓶啤酒或者二兩白酒。後來,出現了一碗羊湯配一斤散簍子的大媽和兩斤散簍子的大爺。到最後,有個大哥抱了一桶十斤裝的白酒告訴拍攝者:這是我一天的量。
只有少數還沒上頭的。媒體問位元組副總裁楊震原有沒有開發大模型,楊震原會說我們在學習。被問到大模型進展怎麼樣,他說很初級、不成熟。
騰訊也是一貫的務實風格。馬化騰說對於工業革命來講,早一個月把電燈泡拿出來,在長的時間跨度上來看是不那麼重要的。關鍵還是要把底層的演算法、算力和數據紮紮實實做好,而且更關鍵的是場景落地,目前我們還在做一些思考。我感覺現在有很多公司太急了,感覺是為了提振股價。
你就直接報周總(周鴻禕)身份證號得了。
二
6月26日,鋰電池的發明者古迪納夫去世,享年100歲。3年前,他以97歲高齡成為了諾貝爾獎歷史上最年長的得主。
在看訃告時,筆者讀到了他的一句話——我們有些人就像是烏龜,走得慢,一路掙扎,到了而立之年還找不到出路。但烏龜知道,他必須走下去。
華人特別喜歡歌頌速度。蘇姿豐30歲時憑藉設計銅電路替代鋁電路成為了IBM CEO的技術助理;黃仁勛30歲時和兩位工程師一起創立了NVIDIA。底層文化裡,華人是不可能稱讚烏龜的,大家稱讚的都是「高大全快」。
相反,德日甚至瑞典的一些企業可能產品看起來一點不起眼,一個軸承,一顆螺絲甚至一個銼刀,一捆絕緣線能鑽研一輩子,但全世界工業企業都離不開他們。當經濟高速發展時,他們把自己投入大生態順勢而為,當經濟進入下行週期的時候,這些企業靠著專精能力,活得也很舒服。
這種跨越週期的能力,大概就是古迪納夫說的「烏龜」吧。
現在,習慣了快的我們也慢下來了,筆者覺得大夥面對大模型這種時代巨浪還是要有些定力,如果搞不起軍備競賽,雇不起大量的北大應屆生,那還是先冷靜冷靜,想想大模型對自己有啥用,算清楚ROI。如果用大模型比僱人幹活還要貴,還不如多招些人,也是為就業做貢獻了。
這樣對很多企業來說是最划算和安全的,風浪越大魚越貴是沒錯,但首先要保證自己一直在船上。
(文章僅代表作者個人立場和觀點) 責任編輯: 宇真 --版權所有,任何形式轉載需看中國授權許可。
看完那這篇文章覺得
排序