亚洲激情无码视频转区_精品国产一区二区三区老师快_国产一级A爱婬片免费播放桃_一区二区有码AV在线播放

歡迎來(lái)訪 東昌府新聞網(wǎng)-聊城視音頻新聞門戶網(wǎng)站

手機(jī)網(wǎng)站  |   幫助中心

首頁(yè) > 國(guó)內(nèi)時(shí)訊

構(gòu)建中國(guó)人自己的智能生態(tài) 解決大模型的“煩惱”

作者:東昌府新聞網(wǎng) 發(fā)表于:2024-05-20 09:28:09  點(diǎn)擊:


熱度不減的大模型是實(shí)現(xiàn)人工智能的唯一解決方法嗎?每個(gè)行業(yè)都要有自己的大模型嗎?對(duì)于大模型,我們現(xiàn)在還是跟隨,那么自主的發(fā)展路徑是什么?當(dāng)預(yù)訓(xùn)練大模型攪動(dòng)起巨大的研發(fā)、應(yīng)用熱潮時(shí),這些問(wèn)題隨之產(chǎn)生。

中國(guó)計(jì)算機(jī)學(xué)會(huì)以“智啟新局”為主題,5月16-18日在浙江寧波舉辦了2024青年精英大會(huì)(YEF2024),1200多名來(lái)自全國(guó)各高校、科研院所、企業(yè)的青年學(xué)者、專家,集中討論了大模型、人工智能安全、國(guó)產(chǎn)算力、開(kāi)源芯片、腦機(jī)接口等多個(gè)前沿領(lǐng)域發(fā)展。

不依賴“一兩個(gè)模型打天下”

大模型為什么不是萬(wàn)能的?面對(duì)現(xiàn)在的大模型熱,南京大學(xué)計(jì)算機(jī)系主任、人工智能學(xué)院院長(zhǎng)周志華教授從兩個(gè)方面進(jìn)行了分析,一方面大模型確實(shí)非常有用,所以業(yè)界特別是企業(yè)應(yīng)該努力“壓榨”這個(gè)大模型路線的技術(shù)紅利,盡可能讓它發(fā)揮更大的作用;另一方面也需要認(rèn)識(shí)到大模型不是所有任務(wù)的最佳解決方案,“很多企業(yè)現(xiàn)在都在做自己的大模型,甚至覺(jué)得不做大模型不正確,但是機(jī)器學(xué)習(xí)里有一個(gè)基本定律‘沒(méi)有免費(fèi)的午餐’。希望一個(gè)算法模型能夠包打天下是不可能,一定有弱點(diǎn),大模型有一些‘煩惱’。”

長(zhǎng)期從事人工智能核心技術(shù)機(jī)器學(xué)習(xí)研究的周志華教授,有一系列原創(chuàng)性成果,他列舉了大模型的多個(gè)“煩惱”。

首先,大模型要先規(guī)劃任務(wù)、收集數(shù)據(jù),然后訓(xùn)練出模型,也就是說(shuō)必須先考慮到要解決某一類任務(wù),然后為它去收集數(shù)據(jù)做模型,這時(shí)如果有一個(gè)新任務(wù),原來(lái)沒(méi)有考慮規(guī)劃過(guò),這時(shí)就沒(méi)有模型可用的。 

其次,大模型訓(xùn)練和使用能耗、碳耗、數(shù)據(jù)耗都很大,一般人用不起。有人作過(guò)預(yù)測(cè),按照現(xiàn)在的趨勢(shì)下去,2025年一個(gè)大模型訓(xùn)練產(chǎn)生的碳排放相當(dāng)于全紐約一個(gè)月的碳排放。  

周志華教授提到,現(xiàn)在人們都希望先訓(xùn)練一個(gè)模型,并希望在使用的過(guò)程中不斷去更新它,但是目前的大模型路線,有一個(gè)問(wèn)題叫“災(zāi)難性遺忘”。他以自動(dòng)汽車駕駛為例,若機(jī)器學(xué)習(xí)模型在對(duì)新環(huán)境獲取的數(shù)據(jù)進(jìn)行學(xué)習(xí)時(shí),會(huì)“沖掉”舊環(huán)境中得到的寶貴信息,會(huì)出現(xiàn)重大安全隱患。

由于前面列舉的各種問(wèn)題,人們都希望大模型能夠持續(xù)學(xué)習(xí)和終身學(xué)習(xí),希望模型學(xué)了一堆任務(wù)之后,隨著應(yīng)用的不斷發(fā)展,能夠不斷地“學(xué)”下去。周志華判斷:“這件事情在今天基于神經(jīng)網(wǎng)絡(luò),或者從基本的數(shù)學(xué)工具上還看不到解決方案。”

“訓(xùn)練大模型要有大量的訓(xùn)練數(shù)據(jù),但是在大數(shù)據(jù)時(shí)代,這仍然是問(wèn)題。”周志華解釋,有的應(yīng)用樣本總量就是小,比如我們要做油田定位,這個(gè)數(shù)據(jù)要通過(guò)人工誘發(fā)地震才能獲得,那就不可能有大量數(shù)據(jù)。再比如銀行信用卡欺詐交易檢測(cè),樣本很小?,F(xiàn)在有人基于大模型在做軟件缺陷檢測(cè),馬上就會(huì)碰到這個(gè)問(wèn)題,雖然互聯(lián)網(wǎng)上這樣的開(kāi)源代碼很多,但是真正由程序員標(biāo)注出缺陷的很少,所以數(shù)據(jù)總量仍舊是問(wèn)題。

此外,數(shù)據(jù)隱私和所有權(quán)問(wèn)題還無(wú)法解決。比如做醫(yī)療診斷,大醫(yī)院有很好的數(shù)據(jù),能做很好的模型,社區(qū)醫(yī)院數(shù)據(jù)不多,做不了很好的模型,大醫(yī)院能不能把這個(gè)數(shù)據(jù)進(jìn)行分享?一旦分享,患者隱私就沒(méi)辦法得到保障。

“所以大模型的成功,更多是在很多日常能夠接觸到的,比如互聯(lián)網(wǎng)語(yǔ)料文本、視頻,容易收集到的語(yǔ)音數(shù)據(jù),都是一些公開(kāi)、開(kāi)源、高頻的任務(wù)數(shù)據(jù),而真正和生產(chǎn)行業(yè)和日常生活,特別是涉及隱私相關(guān)的任務(wù)里面其實(shí)很難做?!彼岢觯骸八砸幸粋€(gè)認(rèn)識(shí),大模型很成功,但是它更適用于資源富集,就是大數(shù)據(jù)、大算力、大資金、大能耗。而且模型可以離線訓(xùn)練,不需要在線更新,更重要的它是高頻任務(wù)。但如果是小資源,模型不能夠離線訓(xùn)練,必須要求在線更新時(shí),就不合適。”

“所以大模型的用處更應(yīng)該是因地制宜,或者因任務(wù)制宜,很多的任務(wù)可能不太適用于像今天的大模型。我們有必要去嘗試其他的研究路線。我們這幾年在研究這么一件事,叫作‘學(xué)件’(learnware),這個(gè)詞也是我們?cè)斐鰜?lái)的?!敝苤救A介紹,學(xué)件=模型+規(guī)約,基本思想是不依賴“一兩個(gè)英雄模型打天下”,可以發(fā)揮多個(gè)模型的集成作用,以適應(yīng)不同任務(wù)需求。在未經(jīng)過(guò)專門訓(xùn)練的新任務(wù)上提供解決方案,同時(shí)強(qiáng)調(diào)保護(hù)用戶和開(kāi)發(fā)者的數(shù)據(jù)安全,實(shí)現(xiàn)模型之間的協(xié)同工作,以推動(dòng)創(chuàng)新和提升問(wèn)題解決能力。

AI應(yīng)用市場(chǎng)繁榮,但這是一座“危樓”

中國(guó)科學(xué)院院士、清華大學(xué)教授胡事民在報(bào)告中提及,本輪人工智能發(fā)展有四駕馬車:算力、框架、算法、數(shù)據(jù),匯聚并促進(jìn)了人類智慧的交融。他認(rèn)為,應(yīng)該更全面看待人工智能發(fā)展,不要只看應(yīng)用端,要從硬件、框架、模型算法和應(yīng)用四個(gè)層面來(lái)看,這四者都對(duì)人工智能的生態(tài)產(chǎn)生重要影響。

胡事民院士分析了目前人工智能發(fā)展,我國(guó)面臨的幾個(gè)不利條件。首先,從硬件來(lái)看,兩種國(guó)外AI芯片占了99%的市場(chǎng)份額。國(guó)產(chǎn)芯片要融入既有生態(tài)非常難,迭代更新慢。

其次,從框架來(lái)看,國(guó)外深度學(xué)習(xí)框架占據(jù)主導(dǎo)的地位,國(guó)產(chǎn)框架面臨生態(tài)屏障。從模型與算法方面來(lái)看,比前兩者要好,但需加強(qiáng)原始創(chuàng)新。

在應(yīng)用層面,我國(guó)市場(chǎng)大、應(yīng)用場(chǎng)景多、落地快、市場(chǎng)繁榮,有許多創(chuàng)業(yè)公司,“但它是一棟危樓,底下的硬件和軟件有問(wèn)題。這是我們的現(xiàn)狀?!?/span>

“需要以深度學(xué)習(xí)框架為牽引,夯實(shí)我國(guó)AI生態(tài)?!焙旅裨菏刻岢?,因?yàn)榭蚣艹猩蠁⑾拢梢栽谛酒懔λ讲桓叩那闆r下盡量挖掘潛力,同時(shí)把應(yīng)用層支撐好。清華大學(xué)在2020年3月20日推出“計(jì)圖”深度學(xué)習(xí)框架,具備兩個(gè)優(yōu)點(diǎn):第一個(gè)好處是快; 第二個(gè)好處是對(duì)硬件的支持廣泛,可以快速適配任何一款國(guó)產(chǎn)硬件?!跋M浴?jì)圖’框架為核心,基于國(guó)產(chǎn)硬件促進(jìn)人工智能算法應(yīng)用的創(chuàng)新,來(lái)推動(dòng)開(kāi)源開(kāi)放,構(gòu)建中國(guó)人工智能的生態(tài)?!?/span>

人工智能自主發(fā)展需要匯聚青年力量

中國(guó)工程院院士、清華大學(xué)教授鄭緯民告訴中青報(bào)·中青網(wǎng)記者,從學(xué)術(shù)角度來(lái)看,現(xiàn)在有四類人在關(guān)注大模型,一是真正做大模型的;二是大模型+,做應(yīng)用的;三是進(jìn)行政策規(guī)范治理的研究學(xué)者;四是如何讓大模型用起來(lái),進(jìn)行基礎(chǔ)設(shè)施建設(shè)的科研人員。

作為大會(huì)程序委員會(huì)主席,清華大學(xué)副教授崔鵬說(shuō),我們現(xiàn)在整體人工智能的發(fā)展路徑還是以跟隨為主,其中一個(gè)很明顯的現(xiàn)象是,OpenAI發(fā)布一個(gè)新的產(chǎn)品,我們趕緊奮起直追,那么中國(guó)人工智能自主發(fā)展路徑在何方,希望匯聚青年精英的力量,共同去探討和商議。

清華大學(xué)公共管理學(xué)院教授,人工智能治理研究中心主任梁正在專題報(bào)告中指出,發(fā)展人工智能,我國(guó)在基礎(chǔ)理論、核心軟硬件和生態(tài)方面還與國(guó)際先進(jìn)水平有一定差距,要平衡創(chuàng)新與治理、踐行價(jià)值對(duì)齊的倫理思路,并吸收國(guó)際經(jīng)驗(yàn),探索理念開(kāi)放、主體多元、對(duì)象分層、工具靈活的敏捷治理新思路,以推動(dòng)我國(guó)人工智能治理的進(jìn)一步發(fā)展。

相較于大語(yǔ)言模型,近期以O(shè)pen AI的SORA、GPT-4o,以及谷歌的Geimini為代表的世界模型,成為學(xué)術(shù)界和工業(yè)界的研究熱點(diǎn),被認(rèn)為是通向強(qiáng)人工智能的關(guān)鍵技術(shù)路徑。但是以多模態(tài)學(xué)習(xí)為基礎(chǔ)的世界模型的路線還不清晰,未來(lái)發(fā)展有很多爭(zhēng)議,復(fù)旦大學(xué)教授邱錫鵬教授發(fā)起的“世界模型之路在何方”的論壇,吸引了更多學(xué)者探討世界模型的發(fā)展路線,以及在國(guó)內(nèi)算力不足的條件下如何輕量化發(fā)展,如何跨模態(tài)相互理解等研究方向。

來(lái)源: 中國(guó)青年報(bào)客戶端