當前,作為數字經濟時代的重要基礎設施、關鍵技術、先導產業以及賦能引擎,人工智能已在自動駕駛、智慧城市等領域廣泛應用,成為改善人民生活質量、推動產業優化升級的重要驅動力。黨的二十大報告指出,加快發展數字經濟,促進數字經濟和實體經濟深度融合,打造具有國際競爭力的數字產業集群。
近日,北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍,清華大學計算機科學與技術系教授、清華大學人工智能研究院常務副院長孫茂松,阿里云智能首席技術官周靖人做客《人民會客廳》欄目,圍繞大模型驅動下AI產業發展進行交流。
從日常生活中人臉識別的廣泛應用,到街上行駛的無人駕駛汽車,再到工廠內相互配合的機器人……類似的智能場景在生產生活中并不少見。作為數字經濟時代的重要基礎設施、關鍵技術、先導產業以及賦能引擎,人工智能(AI)已在自動駕駛、智慧城市等領域廣泛應用,成為改善生活質量、推動產業優化升級的重要驅動力。
近日,行業專家和企業代表做客人民網《人民會客廳》視頻訪談欄目時表示,大數據、大算力推動了人工智能發展走向大模型時代,要加快人工智能技術創新,建設開源開放生態,降低模型應用成本,拓展人工智能應用場景,推動數字經濟和實體經濟融合發展,為經濟社會高質量發展注入智慧動能。
【更多】北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍:經過十幾年發展,人工智能已發展到大模型時代。大模型是一個智能載體,而智能來自于海量的數據。計算機具有超強算力,能夠從海量數據中提煉出智能模型。再加上人工智能算法的進步,能夠訓練出智能水平比較高的模型。要建設開源開放的大模型技術體系,讓更多人的聰明才智以開放的方式匯聚在一起,推動智能社會更快到來。
清華大學計算機科學與技術系教授、清華大學人工智能研究院常務副院長孫茂松:大模型和AIGC實際上為數字經濟開創了無限可能性。借助于計算機可以對所有信息,包括文本信息、圖像信息從計算的角度進行處理,在深度和廣度上比以前有一個質的提升。要把這種可能性落實到現實中的應用場景里有一定的難度,需要付出艱苦的智力勞動,要打破數據間的行業壁壘,在符合國家法律法規的前提下,共享、利用、開發好數據。
阿里云智能首席技術官周靖人:推動我國AI創新發展,一是要在基礎設施上提供相應的算力支持,能夠有更大規模的提供公共服務的算力平臺,為我國AI快速發展奠定基礎。二是模型生態建設上要有開源共享的目標,不僅要關注基礎模型,也要探索每個行業的相關模型,包括人工智能一系列應用,這對我國AI發展發揮著重要作用。三是要降低AI使用門檻,降低模型應用成本,讓各行各業的人將人工智能應用到實際場景中,真正讓AI做到普惠、創新發展。
人民網主持人吳婧:
各位好!歡迎走進《人民會客廳》。近年來我國人工智能加速發展,形成了較為完整的產業體系,人工智能日益融入千行百業,成為驅動產業轉型升級、推動新型工業化建設的重要驅動力量。今年的政府工作報告也強調,大力發展數字經濟,這意味著人工智能等數字經濟將迎來新的發展前景。
今天我們的演播室為大家邀請到了北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍,清華大學計算機科學與技術系教授、清華大學人工智能研究院常務副院長孫茂松,阿里云智能首席技術官周靖人。歡迎大家。
今天我們將要圍繞大模型驅動下中國AI產業發展進行探討。我們知道,近期國內外出現了一系列的自然語言生成的現象級AI產品。我們想先請教一下三位,這樣一款產品出現根本的原因是什么?
北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍:
可能大家關注的是產品,事實上整個AI的趨勢到了今天這個時候,無論是哪款產品出現,背后的整個大的趨勢是不變的,產品只是一個典型的大家接觸到的東西。實際上人工智能發展,當然我們也可以說經歷了差不多六七十年,也可以說經過2012年以來十多年的發展,已經到了這樣一個時刻。什么樣的時刻呢?就是今天大家說的大模型。大模型是什么東西呢?其實就是一個智能的載體,智能的來源來自于大數據,海量的數據。人類像生物這種智能來自于地球這樣一個復雜的環境把我們進化出來我們的智能。今天大家用的人工智能這種用計算機算法產生的人工智能,背后實際上來自于海量的數據,數據也是環境的一種表達方式。經過差不多新世紀以來,海量數據的產生,使得產生智能的物質條件具備了。這是第一個。
第二個,今天計算機的算力特別強,它能夠從海量的數據中提煉出一個智能模型,這也是一個基本條件,這個條件以前也不具備,今天的算力也已經具備了這樣的條件。再加上人工智能算法的進步,使得今天能夠訓練出智能水平比較高的模型。有了這樣的模型在背后,出現各種各樣的產品也就不奇怪了。
清華大學計算機科學與技術系教授、清華大學人工智能研究院常務副院長孫茂松:
剛才黃老師說了,實際上是三個“大”,三駕馬車,大數據、大模型、大算力。這三件事不是放到一起就出這個東西,實際上是產生了化學反應。但是沒這三件事肯定不行,應該說這三個“大”風云際會的結果。這里面特別重要的就是自然語言的作用,自然語言就是人類語言,人類語言的重要性不言而喻,我們大家都有認識,語言是人類所獨有的,可以反映非常深刻的思想,我們很多人類獨有的活動,比如說推理、決策等等,其實都依賴于語言。但是以前沒有找到一個很好的計算的辦法,把它打到模型里面去。這些年發展,實際上我們找到了一種通過計算的手段把人類的語言可以無遺漏地表示出來,處理一遍。這件事導致了什么結果呢?我們人類擁有的任何的概念,這個概念非常龐大,有粗力度的概念,有細力度的概念,任何概念都可以以一種隱藏的我們所謂向量表示的形式,向量表示其實就是數字,以一種可計算的數字的方式建立聯系,建立聯系就可以相互作用,相互作用的話就可以有些更加復雜的行為,比如大模型和大數據融合,可能就會產生涌現現象,涌現現象就會導致它的性能出現一些突變,所以,才有最近這段時間大模型有些表現,包括AIGC的表現,非常讓人驚艷,我們對語言的處理是一個很重要的原因。
另外,這套理念,就是我們進一步拓展了多模態,比如說到圖像,以自然語言為橋梁,然后再結合圖像本身的優勢,把文本和圖像的各自的長處結合起來,就產生了現在做圖像生成效果也很好,這也是語言做橋梁,往前又走了一大步。我覺得這幾點可能是我們現在產品做得不錯的一個內在的原因。
阿里云智能首席技術官周靖人:
剛才黃教授和孫教授的觀點我都非常認同,主要的幾個原因來源于三個元素,包括數據、算力,特別是云計算的誕生,以及本身算力模型方面的一系列的進展。數據,剛才黃教授提到了,整個數據現在是以非常豐富的形態的存在,不光光指數級的增長,以前可能我們更多的是文本的數據,現在有圖片,有各種的多媒體的數據,整個的數據的體量也是在以指數級的規模不斷地發展。有了數據,就需要有計算的能力去處理這些數據。正好這幾年我們整個云計算得到了長足的發展。不光是單臺服務器的計算能力有一個突飛猛進的發展,包括我們的云計算也有效地把成千上萬的機器有效地連接起來,組成了一個超級計算機,也為今天模型的發展提供了一個堅實的基礎。
另外,我們在模型方面也有很大的突破。首先,模型本身越來越復雜,特別是近幾年的Transformer模型的架構,能夠讓模型的參數非常龐大,參數越多,在一定程度上讓模型可以能夠捕捉到很多知識細節。另外,在模型訓練的范式也發生了一系列的變化,以前我們人工智能的模型,更多的是從標注的數據開始,也就是說需要人提前去標注,告訴機器,學習什么樣的結果,但今天由于新的人工智能范式的誕生,我們更多的是通過一個所謂自監督學習的方式,能夠從我們海量數據里面自動進行數據的標注,只有這樣我們對模型的訓練才能有規模性的發展,才能真正地能夠創造這樣一個大模型。
回到模型的本質,為什么今天的模型有這么非常有力的一系列的應用呢?我們也在不斷地探索。中間可能有幾個原因。我們知道今天的這些大模型在一定程度上已經代表著近似于人類的智能體,人的智力很重要的一點是記憶力,也就是說首先要有記憶才能有其他的一些推演的能力。今天,在大模型,因為它能夠海量去處理今天互聯網上看到的各種信息,或者說書本上的信息,首先對所有的信息能夠看過一遍,而且本身模型有強大的記憶的能力,它能通過內部強大的網絡,非常有效地把我們的信息、把我們的知識組合起來,組織起來,也就是我們常常講到的高效的縮影,也就是它有高效的存儲讓這些知識有效地存儲起來。有了這些知識過后,當我們解決實際問題中間的時候,就會發現我們是可以舉一反三的,經常我們講熟讀唐詩三百首不會做詩也會吟,我們往往遇到實際的問題是可以通過我們的知識體系進行解答的。甚至今天在模型的時候我們也引入了一些隨機變量,能夠讓今天有這么靈機一動的感覺,讓今天的基于大模型的深層的應用變得非常豐富、非常有力。
我們認為今天大模型還是在一個發展的初期,所謂大模型所帶來的一系列的應用,以及大模型真正的核心的能力,我覺得我們現在也許只看到了一部分,今后的幾年我們應該能夠看到更多這樣創新式的應用發展起來。
人民網主持人吳婧:
清華大學計算機科學與技術系教授、清華大學人工智能研究院常務副院長孫茂松:
AIGC是生成,所以,首先應該會對內容制作和內容創作產生直接的深刻的影響。我想可能有這么幾點。一個是它可以顯著地降低制作成本,以前你要作一幅畫,很多功夫要下,現在用大模型,他把人類的畫作都學了一遍,之后他可以很快地,不需要你做很多的事情,從制作的角度,如果從工業生產的角度,他會顯著地降低成本。
再一個,會顯著地降低準入的門檻。原來比如說你要做內容的制作,通常是要大的機構,或者是大的企業,個人很難做這件事。從制作。但是現在有了AIGC的人工智能工具,不光是2B,不光是大的B可以做這件事,個體也可以做,2C和2B說不定在一個平面上了,這樣其實大大有利于大眾創業、萬眾創新。
再一點,它會顯著提高生產的效率,它快。這個顯然,秒級就出來。
再一個,它會顯著提升產品的質量。特別是多樣性和個性化生產,計算機作一幅畫,人工智能作一幅畫你不滿意,我再給你弄一個,這幾乎是無限的,直到一款符合你的要求,契合上,你在這種基礎上修改,還是啟發你,機器可能的生成空間比我們人想象的空間可能要大,它啟發你,可能不一定完全合理,啟發你,你再去做一些創意,也很重要,在這個基礎上做創意,這樣就使它的多樣性和個性化就會有一個很大的提升。
直接的效應,包括相關產業,是很明確的,這個空間是非常廣闊的。再往前走,不僅限于此,有了大模型,因為它把信息以一種知識的形式整理了一遍,給它打通,這時候我們做其他更復雜的任務,比如說做宏觀經濟決策,做更復雜的任務,可能就會比以前做得好。直接就是生產,但是,再往前走一步,會有更廣闊的應用空間。
人民網主持人吳婧:
北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍:
AIGC,人工智能產生內容。之前我們知道,幾年之前,UGC,用戶產生內容。再往前,大家不說,但是大家都知道,是專業人員產生內容,是作家、畫家經過長期訓練之后才能產生有質量的內容。現在AI都可以做了,肯定會對人的各方面會產生很深刻的影響。
一方面我們傳統認為的創造性,比如說我是個作家,我寫一篇大家很愿意讀的小說,我覺得這是很有創造性。我一個畫家,美院畢業,我畫一幅畫價值多少。那個時候認為這就是創造性,今天我們回過頭來看,這種創造性大概要一分為二的看,一種是真正的原創性和根據前人的作品組合、模仿畫或者是創作,這是兩種創作性,后面這一種現在AI是可以做的,真正原創的,比如說齊白石畫派,出現了一個全新的畫種,以前沒有,從他開始有了。物理學的愛因斯坦,之前我們沒有相對論的觀念,他在腦子里面有了這么個靈光一閃,產生了一套新的理論。這種創造性,今天的AI,我認為是做不到的,至少目前的AI還缺乏這樣的能力。但是像剛才說的其他的,我們原來認為百分之九十幾的創造性,AI都可以做了,因為大多數從事的是這百分之九十多,而不是那最頂尖的創造性,一定會對這一類的職業、工作帶來很深刻的影響。
因為今天我們很多人,除了剛才說頂尖的少數人在做,從事物質生產的也有一部分人在做,中間有很大量的人是在做內容或者是文化產品或者是精神產品,這些工作就會受到直接的影響。但是我覺得可能最大的影響是說,如果這個東西能被AI替代之后,如果人不去做這件事了,AI的成本也低,又方便,很容易得到,其實最后那個頂尖的成果的產生也可能被影響了,因為人不去努力地走前面這些沒那么創造性的工作,他可能走不到那么原創的東西。所以,這個對人類社會的發展,我們要想想,原來說把體力勞動希望交給機器,現在我們把大部分腦力勞動也要交給機器的話,還要我們干嗎?盡管我剛才說,還保留了一定的人,特殊的只有人能做的創新,但是問題是可能根本就走不到那一步。所以,這是一個很深遠的問題,一方面,某種意義上是福利,AI幫我們做了這么多腦力勞動的事情,但是另外一方面我們想想這個社會結構,以及我們人類到底怎么發展的。
人民網主持人吳婧:
北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍:
人民網主持人吳婧:
北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍:
人民網主持人吳婧:
北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍:
人民網主持人吳婧:
阿里云智能首席技術官周靖人:
我們剛才提到大模型特別是超大規模模型的發展是需要強大的算力,以及模型本身的一系列的研發。今天到了超大規模模型,實際上是AI+云計算全面的整體的技術的表征。也就是說,今天所有的大模型離不開下面的基礎設施,特別是云計算這樣的計算能力,能夠幫助我們去做模型的訓練,去做模型的服務。在這兩個方面,我們國家都有很早期的投入,而且在這方面也是有非常多的創新。比如說在基礎整個算力這部分,在云計算方面,阿里云也是全球前三的云服務商,特別是阿里云也有自研的超大規模的操作系統,飛天云操作系統,也就是說能夠把數百萬的機器有機地能夠聯系在一起,形成一個超級的計算機。通過公共服務的方式,為大家提供相關的算力。整個操作系統也是通過今天內部的軟件各個方面的資源調度,能夠為我們的AI各個方面的訓練,包括數據的處理,提供一個堅實的基礎。
我們大模型的訓練,還需要特別的智能計算的一些硬件和場景,特別是我們需要一個高密度的計算的集群,在這方面,不光光是每臺機器有足夠多的計算算力。這些再加上我們的存儲,再加上我們的網絡,再加上我們軟件調度的一系列的優化,才真正為我們大模型以及AI的發展奠定一個堅實的基礎。我相信,首要的第一個條件就是今天如何能夠用好云計算,能夠讓云計算為我們的AI算力有效地快速地創新、快速地發展起來奠定了一個堅實的基礎。
第二方面,在模型方面。我們國家在模型方面也是有非常多的一些創新,今天包括孫教授和黃教授這邊的學院等等,其實在這方面都有非常多的研究。
我們國家研究大模型方面,還是起步很早的,舉例而言,即使在我們阿里,阿里達摩院這邊也是很早就在做相關的一系列多模態預訓練的大模型。最初我們的想法很簡單,當我們看到一個事物的時候,如何理解一個事物,這個事物有可能是一個商品,有可能是一個服務,關于這樣一個事物,是有語言的描述、文本的描述,也有圖片的描述。我們意識到今天為了有效地去理解這樣一個萬物,其實我們是需要從多個渠道理解這樣一個物體,從文本、從自然語言的角度,從圖片、從視覺的角度,去多方面地通過我們的知識體系,去理解這樣一個商品,能夠把知識融會貫通,這樣才能有效地去完成萬物的識別、萬物的理解。這也是我們最開始去做多模態預訓練大模型的初衷。大概在2019年、2020年的時候我們開始在這方面有很多的投入。我們過去這幾年,從2021年我們也發布了一個百億參數規模的中文的預訓練多模態大模型。之后我們從百億又到了萬億,到了十萬億也代表了我們國家是有訓練整個超大規模模型技術的能力。在這之后,我們也在相關的,包括對話、視覺各個方面也都有非常多的多模態模型的研發和創新,特別是我們在過去幾年讀圖會意的競賽VAQ里面,首次能夠讓模型超越人類的評測標準,在中文的閱讀理解方面,也是首次超過了人類的評測標準,這也是代表了今天我們所有的模型在過去幾年有長足的發展。
去年阿里這邊把所有的模型匯集在一起,對外發布了“通義”的大模型系列,我們之所以把所有的模型匯聚在一起能夠形成多模態訓練的范式,能夠提供統一的訓練的框架,更重要的是把這些模型能夠分享給大家,能夠開源,能夠開放給大家,能夠讓各行各業在上面進行創造和繼續地二次開發,只有這樣我們才能為今天這個模型整個的生態逐漸地建立起來。
人民網主持人吳婧:
北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍:
我們在做AI的人與廣大網友大家所關注的可能還不太一樣,比如產品出來之后,大家會突然眼睛一亮,好象AI突然發生了什么巨大變化。但是對于做AI的人來說,大概那條河流本來就在流,到了這個節點出現了一些浪花現象。所以,我想從這個角度來說,我說河流的時候,實際上是全世界上很多人都在做AI的研究,中國有很多人做AI的研究,而且中國的研究本來就是世界研究的一部分,中國的人才、論文等各種貢獻現在也是有目共睹,是整個全球做AI研究的一個重要的力量。所以,在這個意義上來講,我們認為這個時間到了這個點,中國有這個技術的積累、人才的積累,我們現在要做一個產品或者做一個服務,這些條件都是具備的。但是,從一個真正的我們搞AI研究的人,到變成千家萬戶能用的服務,這之間還是有很多企業、產業的投入。首先,我們基本的條件還是相當不錯的。但是,如果要說大模型這樣一個基礎設施或者大模型這樣一個時代來看這個問題的話,這中間還有大量的工作要做。
我稍微說得長遠一點,不在乎今年、明年又發了幾個大模型或者有多少產品上市了,當然對大家有很直接的感受。我想我們從稍微長遠一點的角度來看待這件事情,大模型本身是一個時代,一個什么樣的時代呢?它從海量的數據里面抽取出來,凝練出這樣一個模型,以智力的方式給千家萬戶提供服務的。這種服務你要想,我們講未來是智能時代,智能時代是什么感覺?家里面所有的東西都是在跟一個具有智力的云、網絡聯在一起的,就像今天家里的電器接著電一樣的,打開就亮了。將來我們每一個設備或者我們用的東西都是聰明的,它聰明來自于哪里?來自于通過網絡源源不斷送過來的智力。所以,在那個意義下,整個社會構造的是一套智力基礎設施,就跟今天正在用的電力基礎設施是類似的,是一個道理。所以,整個會有成千上萬的企業在上面在不同的環節給大家提供服務。所以,在那個意義來看這件事,一方面,這件事并不是特別的技術秘密,好象誰能用、誰能做、誰不能做,不是那樣一回事。就像發電,全世界會發電的人多了,能夠運營大的電廠也很多,但最終電網只有極少數的電網,中國只有兩家電網,國家電網、南方電網。將來智力也是這樣類似的形態。要把這樣的基礎設施和智力服務構造出來,需要從多方面推動這件事情的形成,而不是幾個簡單的產品。可能不同的機構、不同的產學研用、全社會,包括投融資,大家要從這個角度來看,找到自己更恰當的位置,為未來共同的愿景作出自己的貢獻。
像我們學校,或者我現在所在的智源研究院這樣的機構,因為我們是做技術的,最終我們的貢獻還是體現在技術上。我們現在的重點實際上是做開源、開放的大模型技術體系,因為你早晚不管這個模型誰做誰運營,總要訓練模型的技術是越先進越好,那樣才能把成本降下來普及千家萬戶。所以,我們為了做開源開放,很多研究學者都在做,不做開源開放,這些東西會封閉在少數壟斷企業手上。比如我們關心國內國外的,這個產品當然是要直接面對用戶。但是像我剛才說,長遠來說,這個東西是普惠的東西,普惠的東西就需要跟多的人把自己的聰明才智,比如算法的改進、訓練東西的改進能夠以開放的方式匯聚在一起推動這個社會更快到來。現在整個社會,可能大家看到產品有點著急,這是著急不來的,一定是在建造一個智力社會,至少要有幾年的眼光,絕對不要幾個月,現在著急,馬上要做出,有點過激反應,這不太好。
人民網主持人吳婧:
清華大學計算機科學與技術系教授、清華大學人工智能研究院常務副院長孫茂松:
我特別同意剛才黃老師說的,我們應該從更高的角度來看待這個問題,風物長宜放眼量。著名的哲學家維特根斯坦曾經說過一句話,非常深刻,他說“我的語言的極限就是我的世界的極限”。這句話我們給它推演一下,人類語言的極限就是人類世界的極限。大模型實際上通過語言把我們世界上所有的文本信息以及進一步拓展圖像信息、多模態信息等等,它給它融通起來。這件事實際上可以說是大模型的極限,就是我們未來智能信息處理的極限,可能也不夸張,就是剛才黃老師說的,它是一個智能信息處理的基礎設施。可能我們要從這個角度來看這個問題,如果這樣來看,就不光是企業的問題,就上升到國家層面。
我們國家應該說從2010年開始,這一波人工智能的高潮到來這十來年,我們國家在人工智能方面還是取得顯著進步,剛才黃老師也說了,我們做這件事的能力是有的,這個不容易,非常不容易。人工智能實際上是全世界各種,包括國家,包括企業,包括個人,各種力量博弈的一個結果,它是競爭的一個巔峰對決,我的話叫巔峰對決,非常不容易,我們能跟上。所以,這應該是我們國家可以在大模型和AI技術方面已經作出很多成果的一個重要保障。我們弱是弱在哪呢?我們跟跑能力很強,我們領跑能力現在是一大短板。總的來說,跟我們是能跟上,但是領跑幾乎很少,這是我們將來要深刻思考的問題。但是跟跑的能力也很重要,為什么?我們能跟上,就說明我們有能力在AI一些重要應用場景方面作出創新。因為AI應用場景也是重大挑戰,國外在這方面也在探索。貌似在應用層面,實際上它和國計民生更密切,這一大塊是短板,全世界都是一大短板,我們能在前沿技術上跟上,就預示著我們有能力在重大應用場景方面取得突破,這也非常重要。
當然,如果我們將來可以領跑就更理想了,這個問題比較復雜,今天可能不一定有時間來討論。你剛才講的人才培養,其實是其中一個重要的因素。我們國家培養,平均意義來說,高質量的人才、人工智能的人才,這些年是沒有問題的,這些年培養了大量的人才,支撐了我們國家包括大學、科研院所乃至企業的人工智能的發展。但是我們在頂尖人才培養方面也是一大短板,這和我們頂尖成果、領跑是匹配的。當然,這個問題就比較深刻。比如我就講一點,我們可能要進一步提高學生的視野,就是他的學術視野。比如說人工智能真是要有重大創新,可能要多學科的交叉,特別是要有非常深厚的數學基礎。包括從物理、化學里面都應該可以接到很好的借鑒,這塊我們學生是弱的。比如學計算機的,可能只關注計算機的知識。但是從國外發展,比如這段Diffusion model,實際上從物理、從化學那邊有所借鑒,你看他們學生讀的論文,會讀《Physical Review》,我們學生可能就少。所以,交叉學科合作的意識可能需要培養。總之,這個問題很復雜,今天不一定有時間展開了。
人民網主持人吳婧:
阿里云智能首席技術官周靖人:
我們剛才提到其實大模型本質都是算力及模型上的突破,為了進一步促進我們國家在AI上面的整個創新和不斷探索,我覺得從幾個方面:第一方面,我們還是要能夠在整個基礎設施上提供相應的算力支持。因為所有模型的訓練基礎還是依賴于通用的計算能力。在這方面,我們是希望能夠有更加大規模的、更加能提供公共服務的算力的平臺,或許更多是跟當前云計算發展能夠有機結合在一起。
剛才講到模型訓練的范式也在發生一系列的變化。往往以前我們是訓練一個特定問題的模型,因為有了這樣一個預訓練的模型框架,我們可以最開始的階段,更多的是一個知識的積累,并沒有帶有任何一個特定問題訓練這個模型。這部分,在這個階段,我們往往叫預訓練的階段,是需要大量的算力,需要大量數據的處理。在這方面,剛才兩位教授講到,今天我們要在跟海外的頂尖機構在這方面進行競爭。今天的競爭,不單單是一個AI方面的競爭,這是今天AI+整個計算算力全方面的競爭。在這方面,我們一定要在基礎設施方面能夠為我們接下來整個國家的AI快速發展奠定一個堅實的基礎,這是第一點。
第二點,我也非常同意剛才兩位教授的觀點,今天我們要講到AI快速發展,需要我們模型有這樣的生態,更多的是要讓大家有開源共享的一個目標。其實今天我們大家更多的關注是底層的模型,也就是今天關注的比如說像語言模型等等,這些我們一般來講,專業人士講的是叫基礎模型。基礎模型需要大量算力、大量的知識積累。同時,我們也需要行業模型,比如真正要把這些模型應用在一個行業里面,其實我們是需要大量的行業的算法工程師來根據我們當前的問題來進行不斷地去調優。當然,隨著今天整個大模型的發展,上層模型的調優也發生了一系列的變化。過去我們更多的是做一些微調,其實現在我們看到,現在微調都不需要,可以通過指令性的一系列創新,能夠改變今天模型在實際過程中的一系列行為,幫助我們有效解決問題。所以,在這方面,整個模型的生態發展,我希望大家不光光關注我們的底層模型,其實每一條行業線相關模型的探索,包括人工智能一系列的應用,這對我們國家全方面的AI的發展也是起到一個至關重要的作用。
第三點,隨著我們今天AI的發展,我們還是需要降低AI使用的門檻。剛才講到所有都提到AI訓練成本比較高,有時候也需要相當專業的知識,包括今天到了每一個行業也需要進行特定為這個行業進行制作,怎樣讓AI使用的成本進一步降低。甚至我們今天能夠讓學生甚至讓小學生,今天我們的小學生也都可以在PAD上進行編程,其實他們也應該能快速使用這些模型。去年我們搭建了一個社區叫魔搭社區,就是嘗試解決這方面的問題。魔搭社區短短幾個月也出現了將近有幾十萬的開發者到我們的網站上來下載模型。特別是我們提供一個簡單易用的編程接口,能夠幾行代碼就可以使用非常復雜的模型,這只是一個例子。我是希望講到今天我們需要讓模型的應用成本不斷地降低,能夠讓今天我們各行各業的人,即使你是非計算機專業的人,也能夠使用到人工智能的方方面面,能夠應用到你實際的場景里面,只有這樣我們才能真正做到AI的普惠、AI的創新能夠共同發展。
人民網主持人吳婧:
北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍:
剛才講數字經濟與實體經濟的結合,可能還需要從更長遠一點角度看這個問題。我甚至想這樣去打一個比方,比如工業革命,蒸汽機,原來以人力動物的力量進入到以機械為主體的那樣一個時代,大概有幾百年。電力,應該說一九幾幾年開始,整個電力開始進入千家萬戶,進入企業。我們想一想當時有電和沒電這個社會的那種差別有多大。過去一百多年,計算機、互聯網、移動互聯網這些信息,其實我認為信息本身可能都難以跟我們接著要出現的智力時代相提并論。因為信息的時候是給人提供信息,還是人作為主體來加工使用這些信息。所謂智力時代是整個信息系統,AI系統在利用這些信息產生新的能力、新的智力。所以,我剛才講,從當時工業革命、電力革命、智力革命這三個是同樣量級的。而信息前面那些都是前奏,都是為了這次智力革命準備素材,數據、算力這些條件。只有智力像電一樣的源源不斷地給全社會供應的時候,我們就進入了一個全新的時代。
在這種意義上我們怎么看待這個問題呢?我們講數字經濟,數字經濟肯定是建立在數據、大數據、AI這些新技術基礎之上的,讓各種應用,剛才說人、企業、全社會各個要素能夠很簡單地使用智力來驅動。因為這個社會運行的很多東西是靠智力的。我們建房子,我們農業、工業,更別說所有的這些跟內容加工、信息生產相關的活動,背后都是智力。以前是靠人的智力,剛才說工業革命讓我們的體力一定程度上解放了,這次要解放我們的智力。它會帶來特別深刻的巨大的變化。像剛才講,我們中國在這個時代是走在前沿的,我們并沒有落后,不像前兩次時代的時候,歷史的原因,某種意義上是我們錯過了一段時間。這次我們幾乎是在人類要進入這個時代,我們準備好了。
人民網主持人吳婧:
清華大學計算機科學與技術系教授、清華大學人工智能研究院常務副院長孫茂松:
大模型和AIGC實際上是為數字經濟開創了無限的可能性,這是一條。因為它是借助于計算機對人類所有信息、文本信息、圖像信息、各類信息從計算的角度進行了理解,在這個基礎上我再去做信息處理,所以它的深度和廣度比以前有一個質的提升,所以可能性是無限的。但是要把可能性落實到現實性其實還是蠻困難,你不能指望大模型是一個靈丹妙藥,放之四海而皆準,吃一片就靈,不能指望這個。到了重大應用場景,還是需要一個場景一個場景的深耕,深深的耕作,要付出艱苦的智力勞動,它不是一個簡單的事。
在這一點上,全世界其實都在摸索階段,你可以認為大模型AIGC是一個概念,這個概念顯示了一個無比美妙的前景。這個概念進入到千家萬戶可以進行銷售,還有一段路要走,這實際上給我們國家,因為我們國家市場很大,各種應用場景很大,實際上給我們國家帶來一個很好的機會。同時,也給各類比如企業,不管是大型企業還是中小型企業,特別是新興創業的企業也帶來了很多機會,也個人發展也帶來了很多空間。我剛才也講過AIGC本身是個性化可以很強的,降低了門檻。
總的來說,我們國家這幾年再加把勁,以我們有很強的跟跑能力這件事,在重大的應用場景方面應該能作出世界領先的成績來。這里面當然有很多問題要解決,比如剛才黃教授說了,數據有很大的問題。
人民網主持人吳婧:
清華大學計算機科學與技術系教授、清華大學人工智能研究院常務副院長孫茂松:
人民網主持人吳婧:
謝謝孫教授。AI產業的發展應該有很寬廣的未來,但是路上的艱辛還是可以看得見的。
清華大學計算機科學與技術系教授、清華大學人工智能研究院常務副院長孫茂松:
人民網主持人吳婧: