人工智能正在以前所未有的速度席卷全球,去年業界打響“百模大戰”,聚焦于AI的iPhone時刻,走到今年,大規模的落地應用已經成為新的競技場, AI應用卷起來了,價格戰硝煙四起。
一系列的變化意味著大模型的商業化正在提速。圍繞大模型的下一步,業界展開了激烈討論:開源好還是閉源好?C端和B端誰先迎來AI應用的爆發?超級應用什么時候出現?大模型的落地還面臨哪些挑戰……近日,第一財經總編輯楊宇東與百度創始人、董事長兼首席執行官李彥宏,硅谷101的聯合創始人陳茜展開一場對話,共同來探討大模型的未來之路。
“超級能干”的應用比 “超級應用”更重要
楊宇東:ChatGPT掀起的熱潮已經一年多了,接下來超級應用什么時候出現?國內面向C端的大模型產品形態看起來大都是問答模式,未來有沒有可能產生差異化的競爭?
李彥宏:準確地講,我倒不是說一定在等待一個超級應用的出現,我更覺得,在基礎模型之上應該能夠誕生數以百萬計的各種各樣的應用,這些應用有些是很小的領域,可能是大家不太容易想到的應用,但是它對于那個領域的問題解決比以前好很多。
也有可能出現用戶量龐大、用戶時長非常長的類似于移動互聯網的超級應用,現在還沒有看到能夠比肩移動互聯網時期超級應用那樣的AI原生應用。但我們已經看到越來越多的在各種各樣場景、尤其是To B場景,利用大模型提升效率、產生更多的收入,或是能夠節省更多的成本的情況出現。
尤其是今年以來,我們看到在各行各業都有AI的應用場景出現了,使人力大規模節省,或是效率大規模的提升。也許對于投資者、對于創業者,沒有覺得這很令人興奮,因為大家都在想,我能不能有一天從0到1做出一個人們想也沒想到過的東西,變成一個DAU10億的超級應用,這個當然很重要,假以時日也一定會出現。但是目前已經看到的,甚至是更重要的是大模型在各個領域、各個場景的應用。
從百度文心一言的日調用量來看,已經非常明顯了。我們在4月時曾公布過文心一言的調用量每天有2億次,到前幾天文心一言調用量已經到了5億次,也就是說兩個月的時間,調用量翻倍。
調用背后意味著什么?意味著它在給應用產生價值。這種增長速度還是非常令人興奮的。大模型對于實體產業,對于各行各業的提效降本這些作用現在已經非常明顯了。
楊宇東:你更多是談到了垂直行業,百度還是有很強C端基因的公司,作為一個普通的用戶會有什么樣很好的場景?
李彥宏:我覺得分兩類,一類是大家比較關注的,過去從來沒有過這些應用而現在比較流行的,類似于ChatGPT,我們把它叫做ChatBot(聊天機器人),國內每一個大模型公司,都會推出一個相應的APP或網站來做ChatBot,它的作用也比較明顯,很多時候如果你丟給它一個很具體的問題,它會給你一個還不錯的答案,而且準確率也越來越高了。很多人逐步對ChatBot產生依賴。
對于現有的這些To C的應用,其實信息增益作用非常大。我們在4月的時候公布過一個數據,百度搜索有11%的搜索結果會由AI來生成的,這個比例還在不斷的提升。
也就是說,現有大家比較常見的應用,其實也越來越多地在被大模型、被生成式AI所改造。另外一個例子,過去百度文庫大家是在上面找一些現成的文檔,今天經過大模型改造之后,已經更多地變成了生成式AI應用,不管你想要產生什么樣的文檔,PPT、論文甚至是漫畫,它都可以根據你的要求來生成,而且它是收費的產品,今年以來已經有大約2600萬付費用戶。你如果說用超級應用的標準來看,它也沒有到超級應用的水準,但要是看它實際產生的價值,有那么多人愿意為這個產品來付費,還是很厲害的。這些產品都是過去已經存在的,只是經過了大模型改造之后,它的能力跟以前完全不一樣,人們對它的認知也在不斷地迭代、加深。
陳茜:我同意您最近在多個場合強調的,去卷AI的原生應用,這樣大模型才有意義。同時我也有一點小困惑。比如說OpenAI的GPTs在8個月之前就推出來了,當時大家都會覺得,我們AI應用時刻要爆發了,但是8個月之后的今天,我們看到還沒有爆發,可能很多應用出來也不太盡人意,最近最火的就是AI搜索perplexity,現在是2000萬用戶的量級,也還沒有到所謂的Super APP、Killer APP,我的疑惑在于,如果基于GPT4的模型能力,是不是我們現在還沒有到去卷應用的時候,這個時刻還沒到?
李彥宏:對,剛才你提到了GPT,以及perplexity,還是我剛才說的第一類,過去從來沒有過的東西從0到1去做,這樣的超級應用確實現在還沒有出現。即使ChatGPT的DAU也沒有過億,算不上一個真正的超級應用,但是對于現有產品的改造,無論是中國也好美國也好,我們都看到了實實在在的增益,比如美國微軟的Copilot已經收到了很多費用。美國更多的是To B的行業,Palantir、Snowflake這些軟件都是通過被大模型、被生成式AI加持之后,業績得到實實在在的增長。
所以從這個意義上講,大模型應用其實已經逐步在浮現出來,它對于現有業態的改造作用,比從0到1顛覆作用更早到來、更明顯,甚至我覺得也是能夠創造更多價值的。
以前薩提亞說,過去互聯網叫做AutoPilot,想要什么東西,你自己就把這個結果給弄出來了,現在的生成式AI叫Copilot,它實際上是人和機器共創的過程,這個過程一開始大家覺得沒有那么性感,但是它對于人的工作效率的提升、成本的下降,對于打開新的可能性,產生的促進作用其實是比那些從0到1要更大。
只是大家好像覺得說沒有新鮮感,或者它更多誕生在生產力場景,受眾群體不會過億過十億,尤其在C端,在公眾層面的體感沒有那么集中,這可能是大家現在一直想尋找一個SuperAPP的原因。
楊宇東:你的問題是挑戰Robin,Robin說要卷起來,你說怎么沒看到卷。聽Robin講完我總結下來,“超級”這兩個字一個是數以百萬計的應用已經開始起來了,二是所謂的超級反而是在垂直、局部的領域,有非常顯著的加速度或者是增益。
陳茜:或者是“超級”的定義在互聯網時代跟在AI時代是不一樣的。
李彥宏:是不一樣的。在互聯網時代可能是某一個單一的從0到1,或者是到100這樣的應用,今天這種所謂的超級應用,它對現有場景的一種加持,這種加持還在早期,我必須得承認,它逐步會改變現有產品的形態。
我再舉一個例子,小說創作、網文是在國內特別火的行業,過去就是靠作者自己的能力和想象不斷更新一篇小說,效率是很低的。現在有了大模型的加持,基本上有一個構思,它就會給你相應的文檔,根據你的想法不斷調整。在用戶看來,仍然是在讀一篇網文,但是小說的生產成本、生產效率,它的內容豐富度、可讀性、優良率等等,都跟以前不一樣。這樣的例子,其實我們在幾乎任何行業都能夠看到。
楊宇東:我們前面聊的總結一下叫卷應用,接下來還有一個關鍵詞叫智能體,你說過好多次,AI時代最看好的是智能體,但是目前來看好像也沒有特別強大的爆發。你為什么認為智能體是AI時代未來的趨勢呢?
李彥宏:我覺得智能體正在爆發,只是說它現在基數還比較小的時候,大家的體感沒有那么強烈。但是你要看業界大模型公司,都在做智能體,都在看好智能體。
智能體為什么代表未來?基礎模型本身是需要靠應用才能顯現出來的價值。智能體就是一個幾乎可以是放之四海而皆準的基于大模型的應用。根據我自己的場景,我設定一個角色人設,連編程都不用,只要把我想要做的事情跟它講清楚,有時候要把自己的私有知識庫對接進來,或者說把自己做事情的套路給它說清楚,專業術語叫做工作流,把工作流套進去后它就是一個非常有用的、跟基礎模型不一樣的東西。今天大多數AI的原生應用,用智能體的方式都可以做出來,做出來之后效果也不錯。
由于它的門檻足夠低,意味著越來越多的人可以做出他想要的智能體來,這有點像90年代中期的互聯網網站,網站你可以把它做得非常復雜,但是仍然讀書的大學生,也可以做一個自己的HomePage,鏈接上常用的幾個網站,就是他自己的網站。由于做網站很簡單,所以在90年代中期到末期誕生了數以百萬計的網站,經過大浪淘沙,最終會出來一些非常優秀的網站,像Google、Facebook。早期你可能看到的都是,這些網站怎么亂糟糟的,一個大學生就能做一個網站有什么價值?但是你必須得門檻足夠低的時候,讓更多人進來,他們發揮聰明才智,指不定哪條路跑通了,它就是一個Supper APP、這就是為什么,我覺得智能體代表未來,我特別看好的一個新興的業態。
陳茜:在美國硅谷智能體AI Agent也是特別重要的概念,在業界大家對AI Agent,它的定義還是有一點不同的探討,有些人說比如說GPTs,也都是一些智能體,有些人會說,可能更加高級一點的Agent才算智能體,要調取不同的工具、要成為一個虛擬世界的機器人它可能才叫Agent,你對Agent的定義是什么樣子的?
李彥宏:我剛才也講了,我首先要考慮門檻要足夠低。就一個小白,比如說大一的學生,他也可以很方便地能夠制作一個智能體出來,當然在此之上,可以有各種各樣比較fancy的玩法,剛才你講的調用工具、反思、長期的記憶等等,這些能力會逐步加進去,這跟90年代時候的網站誕生過程也有類似之處。我們一開始的網站都是很簡單的,后來說我可以用Java把一些動態的東西放在網站里,后來也可以加上cookie……一旦有越來越多的人在生產網站,技術就會跟進說,你有什么需求,我去解決你的問題。
Agent是一樣的,不是說用了最先進的能力之后才叫一個AI Agent,我反而覺得我們要把門檻降得足夠低,讓大家覺得我也可以搞一個AI Agent,進來之后隨著時間的推移,隨著你遇到新問題,解決問題的過程,會把各種各樣最先進的技術用進來。
說實話,我認為現在AI Agent用到的這些能力仍然是非常初級的。未來還會產生我們今天想也想不到的Agent能力,但是這些能力的誕生,反而要依賴數以百萬計的開發者,去開發各種各樣的應用,在他們使用的過程當中產生新的需求,這些需求被解決的過程就是一個創新的過程,就是AI Agent進化的過程,這個我還是非常期待的。
楊宇東:這個特別像我們一個報道,在法律領域,好多創業公司想說,我要用AI做一個個人法律助手,但是一直沒有好的產品,真正拿到融資的AI法律產品還是面向企業客戶的適合合同審查場景的產品,因為這個場景足夠標準化而且有人買單。所以像這種一開始的初級產品,越做越復雜,越做越好的時候,可能最后像Robin說的,真正意義上的個人法律助手的產品就出現了。
陳茜:百度有什么比較有意思的AI Agent的案例可以給我們分享一下嗎?
李彥宏:國內高考是一個非常大的事件,學生、家長都非常重視。過去大模型在干什么呢?高考有個作文題,我們用大模型來寫一個作文,看它能得多少分。其實你想一想,這個東西在哪用呢?不可能讓一個考生帶著大模型去參加高考嘛。但是高考完了之后,你要估分、報志愿,選學校和專業,可能還有人在乎宿舍幾人間,學校有沒有游泳池,或者說哪個專業更適合我未來發展,每個人的情況都是不一樣的,問題也都是不一樣的。這種情況下,哪有一個全能的輔導老師可以告訴你說,你最適合的是哪個學校哪個專業?但是AI Agent就可以干這個事情。我們開發了一個高考填報志愿的AI Agent。在高峰時期,一天有200萬人在使用。高考考生也就1000萬左右,一天使用的人數就有200萬人,足見大家對這個東西的認可度和依賴度還是非常高的。
再比如剛才講到法律,我們還有一個智能體的法行寶,它就是一個法律援助方面的AI Agent,我有什么訴求,跟我類似的判例都是哪些,我該怎么去寫一個法律文書,全都是不一樣的。過去大家來百度或者其他地方去搜索,都是找世界上已經存在的內容文檔、視頻到底是什么樣子,沒有專門為這個人在這個時刻、這個地點、環境生產一個文檔或內容,而今天的AI尤其是智能體就可以做到,然后根據你的情況生成一個法律文書,這樣的例子非常多。
大模型對B端影響將超越互聯網
楊宇東:你說過大模型對于B端,對于這些領域的影響會超過互聯網,接下來你認為,哪些垂直領域會受大模型的影響最大?
李彥宏:其實你想一想,互聯網對C端的改造,我們都是感同身受的,是非常徹底的,是顛覆性的。但是互聯網對B端的改造,其實我覺得一般,用的技術比較簡單,產生的增益也沒有那么明顯。
但是大模型確實不一樣,剛才提到的那些應用,比如小說創作,讀小說叫做C端,小說創作就可以當做是B端,法律援助其實在幫助律師在提升效率。我們接觸到的一些能源電力行業,生產制造業等都有類似的需求。還有像現在國內電動車卷得也很厲害,車里對話系統很多也在用文心大模型。但對于百度來說,這就是一個To B的應用,我們不直接提供給用戶,它是經過了OEM、經過了車廠集成之后把應用提供給了終端消費者。這種事情非常多,而且我們看調用量如果上得很快,這就說明我們的客戶需要這些東西,B端靠著大模型和AI原生應用產生了價值。
楊宇東:最近我跑制造業比較多,很多企業家覺得未來AI對于高端制造業、智能制造是一種革命性的突破,但是一直搞不明白,比如說通用大模型和我自己的行業垂直領域、垂直大模型,將來到底是什么樣的關系?你說到的OEM,到底是什么樣的供應商,和平臺型的大廠商之間形成什么樣的業務鏈條,這個問題是制造業,尤其是先進制造業特別關注的。
李彥宏:對!這個問題確實很重要。實際上涉及到大模型在各個垂直的場景里怎么用。這件事情我們也經過了探索過程,最初我們的想法是把這個基礎模型做得越來越強大,大家叫通用人工智能,在什么場景我都能做得很好。后來發現這件事情沒有那么容易,每個場景都有它自己的道,要求也不太一樣。有些場景下,大模型思考兩分鐘再給我結果也OK,只要結果準確、全面就可以了。但是有些場景,如果你一秒鐘不出結果,用戶就放棄了。
這兩個場景對大模型要求是不一樣的,今天即使是最強大、反應最快的模型還不能做到。所以當應用場景需要反應快的時候,我們需要更小的模型,它由于沒有大模型通用的能力,在垂直場景當中還要做精調,就是做SFT,把行業的數據怎么去灌進去,再經過各種各樣的調教,在特定場景里的效果跟大模型差不多。
類似這種場景,我們也見了很多、去年10月份,我們發了文心4.0之后,主要精力就是根據最強大的模型,去裁剪各種體量的小模型。比如十億、百億、千億量級的模型,有的也許擅長角色扮演,有的模型也許擅長邏輯推理等等,根據客戶的不同使用場景不同要求,出來各種各樣的模型。這些模型的大多數速度都比EB4要快,推理成本更低,這種應用是大家更愛用的。
即使到今天,我剛才講的5億的調用量,調用量最大的一定不是最強大的模型,你要看市場需求的話,規模更小一點的模型,市場需求量是更大的。
楊宇東:幫我們介紹一下,這種大模型在B端的應用有哪些比較成功的商業案例?
李彥宏:比如說電商的數字人直播,通過大模型來生成一個直播的話術。比如說我要賣一個營養品,是在哪一年、哪個大學教授做了多少實驗出來的結果,這些數據自然人很難去記住,但這些數據恰恰能夠很好地說明營養品到底有什么作用。這些內容靠數字人把它表達出來,很多時候比真人的直播效果反而要更好。
楊宇東:還有一個有趣的問題,我們這兩年主要是生成式AI大行其道,比如金融、醫療、法律這些領域,C端和B端直接有非常好的交互場景,但是大家也開始擔心了,生成式AI有幻覺問題。尤其做金融的,不大敢讓AI幫助客戶來做決策,一旦碰到嚴謹性問題的時候,怎么破解這個難題?
李彥宏:其實我們只要回顧一下過去這一年半的時間,大模型發展的歷程,我相信你的信心會大增。一年前,如果你跟大模型進行交互,去問它一些問題會經常發現幻覺問題。今天你在用的話,尤其是用最大規模,最強大模型的時候,已經很少出現幻覺問題了。
因為隨著技術不斷地提升,一開始純粹于原教旨的Transformer去做出來的大模型,確實是非常難避免幻覺,要解決這個問題,就要在原來Transformer架構上增加一些東西,專業詞語叫RAG,稍微借助一點工具就可以消除這樣的幻覺,隨著你使用這種工具的能力越來越強,你就會發現,在各種場景下,幻覺是越來越少的。
當然,今天這種生成式人工智能更像是一個Copilot,在特別嚴肅,對準確度要求特別高的場景下,我們還不能讓它全部自動去實現,還要靠人把最后一道關,這樣的話,一方面效率提升,另一方面,在準確度上,在消除幻覺上也能夠起到比較重要的作用。其實我們也必須承認,人也有錯的時候,甚至有時候這個錯誤率更高,我們也不能夠完全避免,
陳茜:現在企業們是否愿意去為AI去付費,現在你在跟一些企業客戶交流的時候,他們的態度是什么樣子的?
李彥宏:當你處在市場經濟環境當中,這些企業其實非常理性。尤其是中小企業的賬是算得非常精的,如果這件事情能夠讓我降本增效,能夠讓我賺到更多的錢,那我就會用它,如果不能,你再吹破天我也不會用。其實市場會告訴你這個大模型到底有用還是沒用,我們看到調用量的迅速提升,確實是因為在用戶側,在客戶側,它為企業確實產生了降本增效的作用。
我再舉個例子,比如說在招聘場景,很多時候雇主要找一個具備什么技能的人,對于技能的描述千差萬別,過去是HR坐在那兒,一份一份簡歷篩查,面試100個人,最后篩出來10個人來,再進行下一步的面試,效率是非常非常低。但是大模型進來之后,它可以非常明顯地去提升這方面的效率,有了這樣的場景之后,你去算一算模型的推理成本,其實幾乎是可以忽略不計的。尤其在國內,現在大模型價格戰是非常厲害的,所以像一些比較輕量級的模型,百度的輕量級模型都是免費的,這個免費不僅僅指的是模型免費,實際上算力也送你了,你本來要有電腦,我得要有帶寬等等,這些都沒有了,你只要來用就好。
陳茜:有一個比較好奇的問題,在互聯網時期,SaaS在中國To B沒有做起來,為什么您會覺得在AI時期,這個AI as a service可以在中國做起來呢?
李彥宏:我覺得在SaaS時期,之所以沒有做起來,更多的是因為比如說像互聯網大的平臺,既做了To C的事,也做了To B的事,比如今天大家都到電商平臺去購物,平臺商家所需要的To B的能力電商平臺都替他做了。在某種意義上講,其實中國并不是沒有這樣的需求,而是說這些需求,被更大的平臺所滿足掉了。
但是在AI時代,情況又發生了變化,它不是從0—1的,恰恰是對于現有業態的增強。當現有業態被增強、效率越來越高的時候,它就更能夠抵御類似于像互聯網平臺對它這種業務的侵蝕。我倒覺得AI的這種To B的需求,在中國會比互聯網To B的需求要大很多。
開源是一種“智商稅”
楊宇東:我們還感興趣一個問題,就是其實現在行業里面爭議很大,開源還是閉源,現在看到開源的大模型越來越多了,而且甚至有些能力都不亞于GPT4了,就這個問題你怎么看,還堅定走閉源路線嗎?
陳茜:在國際上對開源閉源大家也爭論得很厲害,馬斯克吐槽OpenAI叫Close AI好了,我們看到馬斯克的XAI也開源了,為什么你對閉源這么堅持?
李彥宏:我覺得開源其實是一種智商稅。仔細想一想我們為什么要做大模型?是它能夠有應用,這些應用在各種場景下能夠為客戶為用戶提升效率、降低成本。所以當你理性地去想大模型能夠以什么樣的成本給我帶來價值的時候,你就會發現你永遠應該選擇閉源模型。無論是ChatGPT也好,文心一言也好,以及各種各樣的模型,你看一下它的平均水平,一定是比這些開源模型要更強大的,推理成本也一定是比開源模型更低的。
尤其在國內的話,我們連算力都送你了,所以當你想要一個開源模型的時候,你得把這個模型拿過來根據場景去做SFT,很可能還要做安全上的對齊,根據場景去準備各種各樣的數據,做一輪輪的迭代,最后由于是你獨有的模型,沒有辦法跟別的應用去共享算力,最高峰的時候用多少那就要準備多少算力,這是非常非常不經濟的。
反過來你用一個閉源的模型,算力可以和大家共享,這些能力在同等的參數下,閉源模型一定比開源模型的力量更強。同等能力下,由于閉源模型可能參數規模會更小一點,它的推理成本就會更低。所以長久來看,我覺得閉源模型使用一定會超過開源模型。
當然,我也不能說開源模型沒有存在的價值,其實比如說從學術研究的角度,或者是高校學生想拿來練練手……在這些場景下,我覺得有它的價值,但如果你是一個企業,要的就是大模型能夠帶來價值上的增益,只要一算賬,就會發現開源模型是沒有機會的。
陳茜:閉源大模型再加公有云集合不同的閉源、開源模型供客戶去調用,你用這樣的一套打法,對To B客戶來說有什么考量嗎?
李彥宏:To B的客戶,他要選擇的是一個性價比最好的模型。一方面,模型要對他的應用產生價值,另外一方面,成本要足夠低。很多時候,你看著有用,一算成本不劃算,客戶就放棄了。這是為什么我剛才講,開源模型打不過閉源模型。你只要理性的去看待,你的收益是啥,你的成本是啥,你就會發現,最好還是去選擇閉源模型。當然,閉源模型不是一個模型,它是一系列的模型,根據你的使用場景去平衡一下,要多好的效果,要多快的推理速度,要多低的成本。模型有非常多的變種,可以根據用戶的需求,讓他來做選擇。
閉源模型還有一個開源模型不具備的優勢:這些相對來說規模更小的模型,都是從最大最powerful的模型裁剪出來的,裁剪出來這些更小規模的模型,仍然比那些同樣規模的開源模型要效果更好。
價格戰不可避免
楊宇東:用戶最終的選擇還是會看性價比。現在才一年多的時間,價格戰已經開始打起來,閉源大模型的API調用的費用越來越低了。在這樣一個商業環境之下,大模型靠推理收費的商業模式未來成立不成立?以后我們市場再去比拼大模型的話,會比拼哪些點?
李彥宏:說實話,我們也在內部不斷的在思考,在討論這個問題,價格戰我覺得幾乎是不可避免的,在中國互聯網干了這么長時間,其實已經對價格戰非常熟悉了,但就像你講的,確實它來的比我想象的還要更早一點,這么早就開始把這個價格打到了幾乎不可思議這種低的地步。但我覺得某種意義上講也不是壞事兒,當你足夠低,甚至免費的時候,就會有更多的人有積極性來嘗試在大模型基礎上去開發各種各樣的應用。也就是說大模型對于各行各業的滲透速度會更快。
你都免費了,或者說價格足夠低,大模型公司靠什么賺錢?我是這樣想的,大模型天花板還是很高的,技術的天花板,在今天我們還是對于大模型的能力有很多不滿意的地方,仍然需要很多非常優秀的技術人員,需要很多的算力,需要很多很多的數據才能夠訓練出來下一代大模型。
所以最終大家是要去拼誰的技術更好,你的技術好,你為客戶產生了更好的價值,將來你還是能夠收到費的。今天之所以把模型價格打到足夠低,是因為現在模型的能力其實還沒有到最好。那沒有到最好的時候,大家都差不多的時候,那就拼價格,誰的價格低就用誰的。時間長了之后,市場本身會回歸理性,同樣的效果,就是當我的成本比你低的時候,那你打價格戰你肯定打不過我,時間久了之后你就退出了。
這個過程我們在百度網盤上是經歷過的。那些年大家在卷網盤的時候,今天給你10G的免費空間,明天你給我100G的免費空間,后天說無限空間永久免費。當你說無限空間永久免費的時候,大家也會說這怎么能夠持續呢? 后來慢慢地一個一個退出。為什么百度沒有退出呢?因為我敢打,我的技術好,存儲成本低。
陳茜:你覺得價格戰還會持續多久?
李彥宏:這個很難講,現在有些創業公司是玩家,也有很多非常大型的這種互聯網平臺公司是玩家,燒錢的話,理論上講是可以燒很長時間的,但我覺得燒錢不是這件事情的本質,本質仍然是誰的技術更好,誰的效率更高。當你的技術好、效率高的時候,你就不怕去打價格戰,所以多長時間都OK,最終它會是優勝劣汰的一個過程。
陳茜:價格戰過后,你覺得未來在中國市場會是一個贏家通吃的局面嗎?還是說價格戰之后會剩下幾家主要的玩家?
李彥宏:這次生成式AI對于整個IT技術棧是一個大變革,我們一般認為過去的IT技術棧就是芯片層、操作系統層、應用層或者軟件層這三層。到生成式AI之后,我們認為IT的技術棧變成了四層,芯片層、框架層、模型層、應用層,我認為在每一層可能都會誕生至少2—3個大的玩家。到應用層可能數以百萬計,甚至數以千萬計的各種各樣的應用都會出來,也會逐步地出現超級應用。超級應用不會很多,可能就三五個。模型層我覺得也許兩三個就足夠了,因為最后還是大家比拼的還是效率。
Scalinglaw短期內不會被顛覆
楊宇東:我們談到規模和能力,最近開始有不同的聲音出來了,確實看很多行業做一些小的模型的速度更快,效率更高,大模型的Scalinglaw會不會這么快又被顛覆掉?
李彥宏:我覺得Scalinglaw本身可能還會有若干年的生命周期,但與此同時,會在此之上會疊加出來各種各樣的創新。剛才講到智能體,仍然是基于Transformer這類大模型在做,但未來再過一兩年還會出現什么新的技術創新,在此基礎上再去疊加,我們也不知道,大家都在探索。換句話說,我覺得Scaling law短期之內倒不會被顛覆,但是在Scaling law之上會疊加出來很多我們現在可能還無法想象的創新。
陳茜:那你覺得接下來大家在卷應用之余,會不會開始卷一些中小模型,在國際上比如Mistral這樣的中小模型也是受很多開發者歡迎的。百度在中小模型上,還有一些模型蒸餾上有什么的計劃?
李彥宏:我們看到的真實需求,確實在絕大多數情況下都不是最大的模型,它都要求這個模型變小。變小意味著什么?速度快,成本低,當我干這個事兒能帶來每年100萬的增益,但一算最大的模型要120萬的成本,那我肯定不干了。那我給大模型公司的要求就是要把成本降到80萬,甚至降到8萬。那我們就得想,怎么把最強大的模型蒸餾到足夠小,也就是成本足夠低的時候,仍然能夠滿足特定場景的需求。我覺得這方面閉源模型仍然有優勢,因為閉源有最強大的基礎模型,它根據這個模型蒸餾或者裁剪出來的小模型比那些開源模型更有優勢。開源模型不管是用更大的開源模型來蒸餾還是怎么樣,但當你基礎沒有別人好的時候,做出來的東西在競爭力上會有劣勢。這方面我們看到真實的需求確實非常多,也認為這方面的機會仍然在閉源不在開源。
陳茜:GPT—5一直在延后,擔憂的聲音越來越高,比如5—10萬億這樣的參數加上去,擔心它的效果并沒有實現躍升,是不是會打擊一些人對Scalinglaw的信仰?也就是我們的AGI可能沒有辦法用Scaling law的方式實現了,你對這個有擔憂嗎?
李彥宏:我不是很擔心這件事情,我覺得大家應該更關注應用,而不是關注基礎模型,某種意義上講,基礎模型迭代速度稍微放緩一點不是壞事兒,今天的這些應用開發者,有一個相對穩定的基礎模型來開發應用其實效率更高。如果模型天天在那兒練,他每天都要重寫一遍過去的代碼,是很累的。但是在現有基礎模型上不斷去做微調,去做一些漸進式的迭代和創新,其實是一直在發生的。
但是長遠來講,我確實認為下一代的大模型一定會比現在這一代模型強大得多。什么時候推出來我不是很著急,我們應該更多地去看一下真實的市場需求是什么。如果我們認為AGI 10年都達不到,也就是說它有擅長的和不擅長的地方,如果它擅長的恰好不是市場需求的,那這個意義不大;如果他不擅長的恰好是市場需求的,那我們浪費了很多資源去做一些不該做的事情,這是為什么我更關注應用。當市場需求不是很清楚的時候拼命往前跑,去做一個名義上更強大的模型,其實很有可能是會走彎路,是浪費資源。
楊宇東:你之前說距離AGI還有10年時間。你個人認為AGI實現的標準是什么?還有哪些路徑可以讓我們更快地通向AGI?
李彥宏:確實業界沒有一個標準答案。以前大家覺得通過圖靈測試就實現AGI了,實際上現在大模型已經通過了圖靈測試,但是人們所說的AGI不只是通過圖靈測試。在我的心目中,AGI是說機器或AI能夠具備人在任何場景下所具備的能力,這是一個很高的要求。
我們做無人駕駛有11年的時間了,仍然不能說這個技術成熟,這還是一個專用場景,AI都做不到非常的成熟。所以說真正要實現AGI,我認為確實是還需要很多很多年。
但是就是業界有人說AGI可能再過2年的時間了,或者再過5年,說什么的都有,但是我自己的判斷是10年以上,也許10年,也許20年,也許更長的時間。很多人在講AGI是一種信仰,當你把它當做一種信仰的時候,誰的信仰會明年就實現?這是自相矛盾的。如果是一個信仰,它就是你值得為之長期奮斗的一個目標。
楊宇東:好的,最后輕松一點,您能不能推薦一下最近讀的一本書或者論文,關于AI方面特別有啟發的,給我們大家推薦一下。
李彥宏:我最近沒有怎么讀論文或者是書。首先書太慢了,大模型技術包括大家認知迭代的速度非常非常快,等到成書的時候,基本上已經過時了。為什么論文我也讀得少呢?一方面我們公司有一大堆人都在讀論文,我很多時候就是讀一些摘要,時間有限,每天出來的新東西實在是太多太多了。另外一方面我也覺得其實我們應該更關注市場信號,更關注真實的需求在哪里,而不是理論又往前推進了多少。如果大家都靠理論去指導實踐的話,根本就不會有飛機出來,是飛機出來之后,大家研究為什么比空氣重的東西還能在天上飛,其實有一個理論叫做空氣動力學。很多時候實踐是反而是領先理論的,我們要更多地看市場有什么需求,我們怎么去更高效地去解決這些真實的市場需求。
楊宇東:對,它是種基本的原動力,來自于實踐,來自于需求。推動了理論,推動了科技的發展。
李彥宏:沒錯。
楊宇東:非常感謝一個多小時的時間,我們演播室對面就是徐匯濱江,非常漂亮,告訴大家一個很讓人開心的消息,馬上會建成一條纜車的索道,橫跨江兩岸。我們也期待以百度為代表的優秀公司,早日為我們建成人類通向未來的AI橋梁,謝謝。
李彥宏:好,我們努力,謝謝。
陳茜:非常感謝。
網上經營許可證號:京ICP備18006193號-1
copyright?2005-2022 www.ayzwhls.com all right reserved 技術支持:杭州高達軟件系統股份有限公司
服務熱線:010-59231580