人工智能:從“作坊式”走向“工業(yè)化”新時代
對于普通人來說,人工智能是一個既熟悉而又神秘的詞。在我國“十四五”規(guī)劃中,多次提到要推動人工智能產(chǎn)業(yè)發(fā)展。當前產(chǎn)業(yè)現(xiàn)狀如何?正在走向何方?哪些領(lǐng)域最有可能取得突破?帶著這些問題,記者采訪了中國科學院自動化研究所所長徐波。
中國科學院自動化研究所所長徐波。受訪者供圖
人工智能創(chuàng)新不斷 “一體兩翼”快速發(fā)展
人民網(wǎng):當前,人工智能技術(shù)創(chuàng)新不斷,應(yīng)用層出不窮。它究竟走到了哪一步?能否談?wù)勀侨绾慰创覈斯ぶ悄芗夹g(shù)發(fā)展現(xiàn)狀的?
徐波:人工智能是一個高度交叉復合、快速發(fā)展的領(lǐng)域。如果要對其發(fā)展現(xiàn)狀作一個全面概括,可以從人工智能 “一體兩翼”構(gòu)成來著手分析。
其中“一翼”是指人工智能的基礎(chǔ)理論。人工智能快速發(fā)展無疑受益于大數(shù)據(jù)和大算力發(fā)展,但基礎(chǔ)還是15年前深度學習基礎(chǔ)理論和方法的突破。人工智能越發(fā)展,其計算、生物、數(shù)學、材料、心理學和社會學等交叉復合特性就越明顯。我國人工智能高水平論文發(fā)表數(shù)量已經(jīng)位居世界一二,人工智能基礎(chǔ)研究發(fā)展態(tài)勢良好,已經(jīng)成為人工智能基礎(chǔ)研究大國。但成為人工智能基礎(chǔ)研究強國,還需要在需求牽引下,按照問題導向繼續(xù)弘揚“十年磨一劍”的科學家專注精神。
另外“一翼”就是人工智能的應(yīng)用。人工智能具有無所不在的廣闊應(yīng)用場景,技術(shù)落地需要和工業(yè)制造、農(nóng)業(yè)發(fā)展、醫(yī)療制藥、社會治理等領(lǐng)域深度結(jié)合。我國有市場、人才、規(guī)模、數(shù)據(jù)等方面的優(yōu)勢,在應(yīng)用方面走得比較快,對各行業(yè)的滲透深度和廣度前所未有,具有世界上獨一無二的優(yōu)勢,已經(jīng)走在世界發(fā)展最前列。
人工智能中間非常關(guān)鍵的“一體”,指的是人工智能的基礎(chǔ)軟硬件,包括芯片、算法、軟件硬件協(xié)同、開源框架、應(yīng)用開發(fā)接口等等。它作為一個橋梁,把人工智能基礎(chǔ)研究成果和場景應(yīng)用廣泛地結(jié)合在一起。目前,我們的基礎(chǔ)軟硬件研發(fā)已經(jīng)從“可用”走到基本“好用”的階段,發(fā)展了自主可控的人工智能基礎(chǔ)軟硬件生態(tài)。
人民網(wǎng):產(chǎn)業(yè)應(yīng)用是技術(shù)發(fā)展中很重要的部分。您認為我國要發(fā)展人工智能產(chǎn)業(yè),占領(lǐng)關(guān)鍵技術(shù)高地,未來的突破口在哪里?
徐波:隨著我國新一代人工智能的發(fā)展,人工智能應(yīng)用呈現(xiàn)出遍地開花的良好發(fā)展態(tài)勢。但人工智能落地中,也碰到很多問題,例如對數(shù)據(jù)質(zhì)量要求高、缺乏相應(yīng)標準、落地周期長成本高、人才昂貴等。
我認為可以從這幾方面尋找突破口。
首先是復合型人才的培養(yǎng)。智能社會發(fā)展過程中需要培養(yǎng)一批既懂行業(yè)需求流程、又懂人工智能的專業(yè)人才。人工智能還完全沒有發(fā)展到可以通過調(diào)幾個參數(shù)就能上線替代部分人工作的水平。其中行業(yè)數(shù)據(jù)的獲取、清洗和加工,以及如何按照業(yè)務(wù)需求建立相應(yīng)的應(yīng)用模型都需要一些這樣的復合型人才支撐。
其次要降低人工智能的應(yīng)用門檻。現(xiàn)在按照專用人工智能技術(shù)發(fā)展的應(yīng)用,在很多時候發(fā)現(xiàn)還不如用個人更省成本。所以,如何從專用型的人工智能,逐步向更具泛化能力的人工智能技術(shù)發(fā)展,是一個重要的技術(shù)突破口,也是未來5-10年人工智能技術(shù)發(fā)展的主流。
這個過程中,從推動產(chǎn)業(yè)發(fā)展的角度選擇一些超級場景對于牽引人工智能應(yīng)用發(fā)展非常關(guān)鍵。例如,自動駕駛會是人工智能在單一領(lǐng)域里最大的產(chǎn)業(yè)場景,也是汽車工業(yè)發(fā)展的必爭之地。類似的還有人工智能+醫(yī)療,也是一個特別大的場景。中國有四百萬醫(yī)生、全世界最大的臨床海量醫(yī)療數(shù)據(jù),最適合人工智能去發(fā)揮智能化優(yōu)勢。所以,要選擇一些這樣的超級場景,作為推動人工智能進步的突破口。
加快原始創(chuàng)新策源 努力占據(jù)制高點
人民網(wǎng):中科院自動化所作為我國“國家戰(zhàn)略科技力量”的重要組成部分,“十四五”期間在人工智能領(lǐng)域的研究和應(yīng)用方面,有哪些相應(yīng)的目標和計劃?
徐波:我們按照“兩加快一努力”要求,加快原始創(chuàng)新策源和關(guān)鍵核心技術(shù)突破,努力占據(jù)人工智能科技創(chuàng)新制高點。
中國科學院自動化研究所始終關(guān)注人工智能中長遠發(fā)展布局。十年前在深度學習剛剛開始應(yīng)用于語音、圖像并產(chǎn)生技術(shù)突破時,我們意識到感知類人工智能應(yīng)用將逐漸由產(chǎn)業(yè)界為主導,于是開始布局更前瞻性的類腦智能,推動人工智能和腦科學的交叉研究實現(xiàn),并與科學院神經(jīng)所成立腦科學與智能技術(shù)交叉研究中心。目前這個方向已經(jīng)成為研究所三大主力研究方向,相信在下一代人工智能發(fā)展中也將扮演重要角色。
人工智能想要在經(jīng)濟發(fā)展、社會治理、大工程系統(tǒng)等復雜問題的決策中發(fā)揮作用,需要人工智能與復雜系統(tǒng)進行交叉融合,這也是人工智能從感知、認知走向決策的必然發(fā)展趨勢。因此,研究所進一步布局了可自主進化智能方向,研究建模人、環(huán)境和機器之間的演化、合作和競爭等關(guān)系,并通過交互提升人和機器對環(huán)境的認識和認知。這項技術(shù)可廣泛應(yīng)用于大量復雜問題的智能輔助決策。
這兒要重點談一下我們最近研發(fā)的“紫東太初”多模態(tài)大模型。這是基于我們多年基礎(chǔ)積累形成的面向關(guān)鍵技術(shù)攻關(guān)的研究方向。我們?nèi)祟悓κ澜绲恼J識天然是多模態(tài)的。舉個例子,我說“貓”這個字,你馬上腦子里能想到貓的圖片、貓叫的聲音、貓的文字。我們大腦里面把貓有關(guān)的聲音、圖像和文字關(guān)聯(lián)在一起,共同組成了“貓”這樣一個語義。這個語義是跨模態(tài)存在的。模擬人的多模態(tài)認知特點,自動化所推出了全球首個千億參數(shù)的三模態(tài)大模型“紫東太初”,把圖像、文本和語音結(jié)合起來,它采用了多層次、多任務(wù)、自監(jiān)督、預訓練的學習方式,不僅可以實現(xiàn)跨模態(tài)理解,還能實現(xiàn)跨模態(tài)生成。這是我們在已有多個很好技術(shù)積累基礎(chǔ)上,通過多模態(tài)把人工智能眾多方向加以融合創(chuàng)新的研究成果,服務(wù)于產(chǎn)業(yè)和國民經(jīng)濟主戰(zhàn)場。
人民網(wǎng):在人工智能創(chuàng)新鏈中,科研院所在扮演怎樣的角色?自動化所又是如何面向國民經(jīng)濟主戰(zhàn)場,為我國人工智能產(chǎn)業(yè)鏈發(fā)展賦能?
徐波:人工智能包括智能和智能化。智能即智能科學內(nèi)涵、基礎(chǔ)理論和模型算法等,智能化則是智能與各個領(lǐng)域行業(yè)的結(jié)合。研究所發(fā)展規(guī)劃一方面要承擔主責主業(yè),大力探索智能本身。同時,需要考慮智能怎么去和社會、和企業(yè)、和政府合作,政產(chǎn)學研結(jié)合,面向國民經(jīng)濟主戰(zhàn)場,為人工智能產(chǎn)業(yè)鏈發(fā)展賦能。無論從科研還是產(chǎn)業(yè)化,我們始終秉持在低潮時堅守、在高潮時冷靜的理念,努力成為默默的開拓者和引領(lǐng)者。
六年前,人工智能落地應(yīng)用剛剛萌芽,基于人工智能自身發(fā)展特點,研究所及時推出了“離崗創(chuàng)業(yè)”制度,鼓勵已在智能應(yīng)用領(lǐng)域深耕多年的團隊進行轉(zhuǎn)化。制度實施以來,已經(jīng)誕生了在工業(yè)視覺、融媒體、生物特征識別等垂直行業(yè)里多家有影響力的企業(yè)。離崗創(chuàng)業(yè),這是一種人工智能技術(shù)轉(zhuǎn)化1.0版本形式。
作為一種賦能千行百業(yè)的技術(shù),我們不能止步于此。我們正在探索人工智能技術(shù)轉(zhuǎn)化的2.0版。2.0核心就是要利用研究所力量,以核心創(chuàng)新為抓手,以構(gòu)建創(chuàng)新生態(tài)為目標,做一個大的人工智能平臺。如上所述,目前人工智能存在落地周期、成本、人才等問題,同時國產(chǎn)基礎(chǔ)軟硬件從基本“好用”到非常“好用”,都需要協(xié)同各方力量共同努力。
為了解決這一行業(yè)痛點,今年5月,中國科學院自動化研究所、華為技術(shù)有限公司、武漢東湖高新區(qū)管委會簽署《人工智能技術(shù)開發(fā)合作備忘錄》,三方共同籌建武漢多模態(tài)大模型人工智能平臺。該平臺以自動化所的“紫東太初”大模型為核心,以全國產(chǎn)的昇騰AI基礎(chǔ)軟硬件為底座(包含昇騰AI處理器、異構(gòu)計算架構(gòu)CANN和全場景AI框架昇思MindSpore等),通過合作支撐當?shù)禺a(chǎn)業(yè)實現(xiàn)智能升級。大模型、大底座、大數(shù)據(jù)形成了一個天然的合作模式,來為各個行業(yè)賦能。這是我們技術(shù)轉(zhuǎn)化2.0的一個開始的初步嘗試。
打破應(yīng)用門檻 解決人工智能“落地難”痛點
人民網(wǎng):您如何看待這個平臺的未來發(fā)展?
徐波:這是人工智能向更加通用化方向邁出的重要一步。以前的人工智能是屬于“作坊式”的。想要做一個應(yīng)用,需要從算法開始進行開發(fā),類似于我們常說的“重復造輪子”。多模態(tài)大模型人工智能平臺,是人工智能從“作坊式”向“工業(yè)化”轉(zhuǎn)型升級的一次重要探索。通過對多模態(tài)大模型人工智能平臺的持續(xù)研發(fā)、應(yīng)用、優(yōu)化、升級等,大大降低應(yīng)用門檻和對應(yīng)用人才要求,同時推動全自主可控軟硬件體系的形成。
這個過程中大模型技術(shù)持續(xù)創(chuàng)新研發(fā)是我們的主責主業(yè)。例如現(xiàn)在計算量還比較大、成本和能耗也比較大,未來大模型在現(xiàn)有基礎(chǔ)上還會有很多突破。需要我們不斷融合類腦等智能新機制,使得大模型的運營成本越來越低,越來越好用。
目前,我們也正在同步研究大模型基礎(chǔ)上蒸餾出小模型技術(shù),這也非常重要。對于不想上云的,或者是應(yīng)用場景不那么復雜的,其實并不需要用到大模型。因為大模型的參數(shù)特別多,使用成本非常高。這個時候,就可以用大模型中蒸餾出一個小模型,小到可能只有幾兆的大小,不但降低成本,而且實現(xiàn)從通用向?qū)S玫倪M一步優(yōu)化。
打個比方來說,大模型類似于一個知識非常淵博的老師,他學了無數(shù)多的數(shù)據(jù),但是如果從事一件具體的工作,就不需要那么淵博的知識,這時候,我們可以根據(jù)需求,自動蒸餾出一個小模型,教出一個小徒弟來做這項工作。
人工智能要邁上工業(yè)化階段,必須要滿足以下幾個條件,批量化,成本低,易訪問,輕能耗以及最大程度的開源開放。未來,“云端的大模型+末端小模型”很可能會成為人工智能應(yīng)用的重要模式。
人民網(wǎng):這個平臺,目前是否有一些成功的應(yīng)用?
徐波:我們已經(jīng)有一些應(yīng)用,效果很好。以前解決不了或者解決不好的現(xiàn)在有了全新的技術(shù)手段。
我們在智慧媒體方面做了一些探索。和頭部視頻網(wǎng)站合作,針對其海量的短視頻、電影和電視劇,做到了跨模態(tài)內(nèi)容的檢索。比如輸入一段文字,就能定位到視頻中的某一個片段;可以根據(jù)電視劇的簡介自動生成1分鐘的視頻摘要;還可以指定某個特定演員出現(xiàn)的場景、某件事的前因后果等內(nèi)容進行“跳播”。
工業(yè)視聽覺已經(jīng)進行了應(yīng)用嘗試。過去,人工智能在工業(yè)領(lǐng)域的應(yīng)用是一個痛點,因為樣本非常少,而且很多時候數(shù)據(jù)是多模態(tài)的。比如發(fā)動機的質(zhì)檢,往往是靠老師傅們“聽”出來的。用人工智能怎么做呢?我們把各種各樣的工業(yè)缺陷數(shù)據(jù)混合在一起,首先讓機器進行模型自學,應(yīng)用的時候只需要給兩個樣本,就可以達到很高的質(zhì)檢精度。這方面我們已經(jīng)實驗過了,原來可能需要一萬個樣本才能做到90%以上的識別率,現(xiàn)在只要用幾個或幾十個樣本,精度就能達到90%,大幅降低了人工智能的應(yīng)用門檻。
另外一個應(yīng)用案例是具像化的教學,可以在打手語的同時生成對應(yīng)圖片,輔助學生理解,更好地達到教學目的。
類似的應(yīng)用還有很多,只靠自動化所一家單位去落地,會錯失大量的助推產(chǎn)業(yè)升級的機會,也會比較慢,所以一定要在推廣模式上創(chuàng)新,吸引更多的人、更多的機構(gòu)來實踐,來應(yīng)用。我剛才說的“2.0”就是這個意思。現(xiàn)在我們自己先做一些樣例出來,然后進一步完善模型,通過標準化、流程化等一系列手段,將門檻降下來。未來越多人用,這個模型就會越完善,也越好用。
近期,自動化所聯(lián)合大學、產(chǎn)業(yè)界等在積極推進 “多模態(tài)人工智能產(chǎn)業(yè)聯(lián)盟”的建設(shè),這個聯(lián)盟的成立就是為了讓產(chǎn)學研各界都能更好的應(yīng)用我們創(chuàng)新的成果,并基于這些成果再去推廣、完善。12月18日即將在武漢舉行的“2021東湖國際人工智能高峰論壇”上,我們也會就推動人工智能通用化、技術(shù)應(yīng)用國產(chǎn)化和參會嘉賓進行進一步的探討與合作。
人民網(wǎng):多年來您在研究人工智能的過程中,有沒有覺得它的發(fā)展速度超越了您的想象?
徐波:有句話說,“大多數(shù)人高估了他們一年所能做的事情,卻低估了他們十年所能做的事情。”
這句話來描述人工智能的發(fā)展也很適用。它的影響是潛移默化的。目前人工智能落地碰到一些困難,但過了十年以后回頭來看,人工智能的發(fā)展速度會比你原來想象的要快。
目前,全世界很多優(yōu)秀的人在研究人工智能,每個人都從不同的角度攻克其中一塊磚,最終合力去建立起一座人工智能的高樓大廈。人工智能的發(fā)展非常激動人心。
這里的每一塊磚可能就是一個很小的研究或者應(yīng)用領(lǐng)域,它們正在以飛快的速度不斷迭代和突破。人工智能研究離終極目標還有很遠的距離,但人類正在朝著它光明前景的快速道上大步前進,并看到沿途一路風景。
分享讓更多人看到