CloseAI提示您:看後求收藏(第113章 意外的邀請,重生之AI教父,CloseAI,試讀吧),接著再看更方便。

請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。

相比效果顯著,非常出色的老虎演算法,移動端最佳化排序演算法的效果要稍差一些。

因而孟繁岐並沒有急著推動上線測試,而是等待結合AI語言解釋模型的那一個更新準備一起推動。

目前針對語言問題所採用的通常是迴圈神經網路(RNN)和長短期記憶辦法(LSTM),這兩個工作都是上個世紀末的老辦法了。

這兩種方法簡明好用,因而一直興盛到2017年左右。

直到Transformer,也就是ChatGPT的T方法出現。

通常來說,大家都認為Transformer方法之所以能夠迅速取代RNN和LSTM,主要是因為它更方便並行進行。

在多個裝置上容易做到並行,這件事最核心的意義便是讓規模龐大的版本成為可能,這也為後來ChatGPT這樣的究極巨無霸模型奠定了基礎。

“其實老版的RNN也有辦法可以把並行做得很好,領域內對這件事有很大的誤解。”孟繁岐皺著眉頭思索道。

原本時間線,Transformer出來之後,所有人都放下了手頭老方法的研究,擁抱了T方法。

可18年實際上有人專門做了RNN的高度並行,只可惜已經太遲了。

如果這個發現可以早一年的時間,可能RNN會長期作為T辦法的競爭對手,我們也有可能看到ChatRNN的出現。

“早期的T方法需要很多資料,各種引數比較難調整,需要的計算能力也很龐大。”孟繁岐即便根據後來成熟的許多方法做了一個改進的版本,T方法在早期仍舊比較麻煩。

“好在谷歌的資料和算力都不缺,而我也比較熟悉各種經典的引數設定。”孟繁岐先寫了一個雛形版本的T方法,進行了一下測試。

“不過,受限於現在顯示卡的視訊記憶體,模型沒有辦法做得很大,除非我專門再去開發DeepSpeed這樣的高階並行方式。”

在多張卡上訓練模型,可能是為了追求速度,也可能是因為一張卡上放不下了。

其中,資料並行是最簡單的,也就是不同的卡都在做同樣的事情,每張卡上都會存放一個模型。

只不過輸入的資料不一樣,不同的卡做完運算之後,再一起整合更新。

就像是所有人都拿了同樣的刀切不同的菜,最後把切好的食材堆在一起。

可有的時候,一張卡上根本就放不下模型,這樣的情況就比較麻煩了。因為一個人根本拿不動這把刀了,需要多人協作。

可以把每一層拆分到不同的卡上,也可以把不同層分配到不同的卡上,如此一來,其實是用多卡實現了類似單卡訓練的效果。

顯然,前者會比後者容易非常多,前者只需要在不同卡上覆制這些模型,分別讀取資料做運算就好。

而後者則需要根據不同的情況和設定拆分合並,一個不小心就會搞錯。

看了下谷歌大腦的伺服器,裡面有好幾批2013款的GTX泰坦,這東西著實價值不菲。

考慮到當時的其他產品,6G的視訊記憶體還是鶴立雞群的。

比起孟繁岐自己重金購置的4G旗艦款,多出的2G視訊記憶體,足夠做很多其他的事情了。

用速度換視訊記憶體,孟繁岐又做了許多引數和資訊在Cpu和Gpu上反覆轉移的操作。

因為在正式入職之前,谷歌大腦分配給他的顯示卡就已經有16張泰坦,這部分卡撥給孟繁岐獨享,隨時都可以使用。

除此之外,還有32張在不同節點上的Gpu可以申請佔用。

“這時候的谷歌顯示卡還沒有那麼多,這個配置已經相當大方了。”

不僅有統一配置的系統和環境,還有提供好的多卡並行方式和例子。

再過兩年,幾千張上萬張TPU都是標配。

孟繁岐如果想要將AI接入搜尋系統,有三個主要的方向。

一是透過拆分關鍵詞,透過語言模型來獲取其在現實世界的含義,從而對結果進行更好的排名。

二是透過擴大模型的規模,使得它具備一定的寬泛理解能力,從而擴大能夠搜尋的內容量。

三則是讓搜尋引擎更能夠理解不同語言順序會如何改變查詢的意圖。

其中二目前比較難辦,一和三孟繁岐的把握很大。

傳統的RNN和LSTM的迴圈方式,就導致了在較長語句上比較難處理得當,對順序的變化理解也沒有那麼充分。

孟繁岐的雛形T方法,在這方面具有得天獨厚的優勢。

除此之外,T方法雖然在小資料上難以學到東西,各個引數也很難微調,總體的訓練難度大。

但這在孟繁岐這個老煉丹師面前,不是什麼難事,配合谷歌早已備好的海量資料,孟繁岐對這個方法的效果還是很有信心的。

而將顯示卡資源都投入訓練之後,在13年的聖誕節前夕,孟繁岐結束了在谷歌尚海大約十天的工作旅程。

模型的訓練需要一定的時間,廣告演算法後續兩板斧可能過兩週,元旦之後了。

總算基本完成了早期生涯吸金最多的技術,孟繁岐如釋重負。

就在他計劃開始開辦公司,開始看工作場地,裝置金額的時候,一個意料之外的電話打亂了他的節奏。

“孟先生您好,我是創新工廠李開赴的秘書,他很想跟你面對面談一談,但由於身體原因,出行不大方便,不知道您方不方便過來呢?”

李開赴?也算是谷歌系的華人大前輩了,最高做到全球副總裁,中華區第一把交椅。

不僅如此,他也曾在蘋果和微軟幹到很高的位置。

不過09年四年約到期之後,他就辭職不幹了,自己搞了一個天使基金投資大學生的夢想。

“李開赴老師現在在哪裡?”孟繁岐對李開赴的經歷還是比較熟悉的,此時應當正值他罹患癌症初期,只是不知道他在何處接受治療。

“李開赴先生先在寶島北市接受治療,如果方便的話,我們就約一個時間吧?其實這段時間的治療效果並不是特別好,因此李先生已經基本不再參與任何會議和公司工作了,不過他執意要抽出一天時間跟你聊一聊。”

“我現在剛剛結束了手頭的事情,明天就可以去辦理入島許可證。”孟繁岐覺得有些奇怪,自己雖然在AI界嶄露頭角,但對於李開赴這樣級別的前輩來說,似乎沒有什麼是非見不可的。

尤其考慮到他目前的身體狀況不是很好。

“不過辦理下來,也該是兩週往後了。”

孟繁岐問了秘書,她也不大清楚具體的原因,孟繁岐便壓下了自己的好奇心,約在一月中旬見面。

尚海飛北市桃園,總共要不了兩三個小時,比去燕京其實還近一些。他兩輩子還真沒有去過寶島,去見李開赴順便走一圈倒也還不錯。

只是入島許可證,卻像簽證一樣,辦理起來讓人很是不爽。

本章未完,點選下一頁繼續閱讀。

都市小說相關閱讀More+

父子火葬場,簡小姐絕不回頭

東回

撿回家的女孩是病嬌?我遭老罪嘍

我慧美如畫中仙

重生1977:從空間種田開始

樂高

海島求生:我靠撿垃圾成神

濾穗

明克街13號

純潔滴小龍

律師:校園霸凌無罪?我送他死刑

燻文