文心一言實力不如ChatGPT是理所當然的,微軟投資幾百億美元並且用微軟的雲端訓練整個網
路資料兩年了,到了去年底才終於開花結果
目前這種LLM模型,最重要的就是 資料 算力 和算法,其中基礎的資料是非常重要的,Chat
GPT在建立模型的過程跟一般的Ai一樣要機器學習建立模型,而ChatGPT的基礎原理就是由上
一個字生成下一個字,週而復始,其中在訓練的過程還會經過人工挑選優質回答和一些和添
加一些限制來引導訓練方向,但總體而言跟其他Ai模型一樣訓練出來的模型基本上是黑盒子
,是無法直接改動的,所以基礎語料的重要性不言而喻
而中文跟英文在目前網路的資料量91%左右,而中文只有0.11%,甚至還沒有日文0.12%多,文
心一言基本上就是專攻中文的,所以在先天條件下其實就不如ChatGPT(GPT的中文回答很多
時候也是經由英文生成答案再轉成中文的
第二個就是算力差距也很大,之前微軟的訓練場所都是5萬張A100在24小時跑模型的,美國之
前已經要求NV禁售高階運算卡很久了,目前百度能用的卡就是一些消費級的和以前囤積的卡
,聽說他們之後要用他們的國產摩爾線程的顯卡,不過那個效能和NV差距非常大,在算力這
方面上幾年內也是追不上OpenAi團隊的
不夠就算如此,我也覺得百度這次算厲害了,為什麼?因為隔壁Google 開始公測的Bard實際
表現還不如文心一言,甚至可以說慘多了,全靠同行襯托啊。而且百度這次不像很多中國公
司一樣拿外國產品套個皮就說自研,而是真的在做產品,這點就挺厲害了,不過他們會下去
做主要也是想繼續霸佔中國瀏覽器市場的龍頭地位就是了