&

熱度不減的大模型是實(shí)現(xiàn)人工智能的唯一解決方法嗎？每個(gè)行業(yè)都要有自己的大模型嗎？對(duì)于大模型，我們現(xiàn)在還是跟隨，那么自主的發(fā)展路徑是什么？當(dāng)預(yù)訓(xùn)練大模型攪動(dòng)起巨大的研發(fā)、應(yīng)用熱潮時(shí)，這些問(wèn)題隨之產(chǎn)生。

中國(guó)計(jì)算機(jī)學(xué)會(huì)以“智啟新局”為主題，5月16-18日在浙江寧波舉辦了2024青年精英大會(huì)（YEF2024），1200多名來(lái)自全國(guó)各高校、科研院所、企業(yè)的青年學(xué)者、專家，集中討論了大模型、人工智能安全、國(guó)產(chǎn)算力、開(kāi)源芯片、腦機(jī)接口等多個(gè)前沿領(lǐng)域發(fā)展。

不依賴“一兩個(gè)模型打天下”

大模型為什么不是萬(wàn)能的？面對(duì)現(xiàn)在的大模型熱，南京大學(xué)計(jì)算機(jī)系主任、人工智能學(xué)院院長(zhǎng)周志華教授從兩個(gè)方面進(jìn)行了分析，一方面大模型確實(shí)非常有用，所以業(yè)界特別是企業(yè)應(yīng)該努力“壓榨”這個(gè)大模型路線的技術(shù)紅利，盡可能讓它發(fā)揮更大的作用；另一方面也需要認(rèn)識(shí)到大模型不是所有任務(wù)的最佳解決方案，“很多企業(yè)現(xiàn)在都在做自己的大模型，甚至覺(jué)得不做大模型不正確，但是機(jī)器學(xué)習(xí)里有一個(gè)基本定律‘沒(méi)有免費(fèi)的午餐’。希望一個(gè)算法模型能夠包打天下是不可能，一定有弱點(diǎn)，大模型有一些‘煩惱’。”

長(zhǎng)期從事人工智能核心技術(shù)機(jī)器學(xué)習(xí)研究的周志華教授，有一系列原創(chuàng)性成果，他列舉了大模型的多個(gè)“煩惱”。

首先，大模型要先規(guī)劃任務(wù)、收集數(shù)據(jù)，然后訓(xùn)練出模型，也就是說(shuō)必須先考慮到要解決某一類任務(wù)，然后為它去收集數(shù)據(jù)做模型，這時(shí)如果有一個(gè)新任務(wù)，原來(lái)沒(méi)有考慮規(guī)劃過(guò)，這時(shí)就沒(méi)有模型可用的。

其次，大模型訓(xùn)練和使用能耗、碳耗、數(shù)據(jù)耗都很大，一般人用不起。有人作過(guò)預(yù)測(cè)，按照現(xiàn)在的趨勢(shì)下去，2025年一個(gè)大模型訓(xùn)練產(chǎn)生的碳排放相當(dāng)于全紐約一個(gè)月的碳排放。

周志華教授提到，現(xiàn)在人們都希望先訓(xùn)練一個(gè)模型，并希望在使用的過(guò)程中不斷去更新它，但是目前的大模型路線，有一個(gè)問(wèn)題叫“災(zāi)難性遺忘”。他以自動(dòng)汽車駕駛為例，若機(jī)器學(xué)習(xí)模型在對(duì)新環(huán)境獲取的數(shù)據(jù)進(jìn)行學(xué)習(xí)時(shí)，會(huì)“沖掉”舊環(huán)境中得到的寶貴信息，會(huì)出現(xiàn)重大安全隱患。

由于前面列舉的各種問(wèn)題，人們都希望大模型能夠持續(xù)學(xué)習(xí)和終身學(xué)習(xí)，希望模型學(xué)了一堆任務(wù)之后，隨著應(yīng)用的不斷發(fā)展，能夠不斷地“學(xué)”下去。周志華判斷：“這件事情在今天基于神經(jīng)網(wǎng)絡(luò)，或者從基本的數(shù)學(xué)工具上還看不到解決方案。”

“訓(xùn)練大模型要有大量的訓(xùn)練數(shù)據(jù)，但是在大數(shù)據(jù)時(shí)代，這仍然是問(wèn)題。”周志華解釋，有的應(yīng)用樣本總量就是小，比如我們要做油田定位，這個(gè)數(shù)據(jù)要通過(guò)人工誘發(fā)地震才能獲得，那就不可能有大量數(shù)據(jù)。再比如銀行信用卡欺詐交易檢測(cè)，樣本很小?，F(xiàn)在有人基于大模型在做軟件缺陷檢測(cè)，馬上就會(huì)碰到這個(gè)問(wèn)題，雖然互聯(lián)網(wǎng)上這樣的開(kāi)源代碼很多，但是真正由程序員標(biāo)注出缺陷的很少，所以數(shù)據(jù)總量仍舊是問(wèn)題。

此外，數(shù)據(jù)隱私和所有權(quán)問(wèn)題還無(wú)法解決。比如做醫(yī)療診斷，大醫(yī)院有很好的數(shù)據(jù)，能做很好的模型，社區(qū)醫(yī)院數(shù)據(jù)不多，做不了很好的模型，大醫(yī)院能不能把這個(gè)數(shù)據(jù)進(jìn)行分享？一旦分享，患者隱私就沒(méi)辦法得到保障。

“所以大模型的成功，更多是在很多日常能夠接觸到的，比如互聯(lián)網(wǎng)語(yǔ)料文本、視頻，容易收集到的語(yǔ)音數(shù)據(jù)，都是一些公開(kāi)、開(kāi)源、高頻的任務(wù)數(shù)據(jù)，而真正和生產(chǎn)行業(yè)和日常生活，特別是涉及隱私相關(guān)的任務(wù)里面其實(shí)很難做?！彼岢觯骸八砸幸粋€(gè)認(rèn)識(shí)，大模型很成功，但是它更適用于資源富集，就是大數(shù)據(jù)、大算力、大資金、大能耗。而且模型可以離線訓(xùn)練，不需要在線更新，更重要的它是高頻任務(wù)。但如果是小資源，模型不能夠離線訓(xùn)練，必須要求在線更新時(shí)，就不合適。”

“所以大模型的用處更應(yīng)該是因地制宜，或者因任務(wù)制宜，很多的任務(wù)可能不太適用于像今天的大模型。我們有必要去嘗試其他的研究路線。我們這幾年在研究這么一件事，叫作‘學(xué)件’（learnware），這個(gè)詞也是我們?cè)斐鰜?lái)的?！敝苤救A介紹，學(xué)件=模型+規(guī)約，基本思想是不依賴“一兩個(gè)英雄模型打天下”，可以發(fā)揮多個(gè)模型的集成作用，以適應(yīng)不同任務(wù)需求。在未經(jīng)過(guò)專門訓(xùn)練的新任務(wù)上提供解決方案，同時(shí)強(qiáng)調(diào)保護(hù)用戶和開(kāi)發(fā)者的數(shù)據(jù)安全，實(shí)現(xiàn)模型之間的協(xié)同工作，以推動(dòng)創(chuàng)新和提升問(wèn)題解決能力。

AI應(yīng)用市場(chǎng)繁榮，但這是一座“危樓”

中國(guó)科學(xué)院院士、清華大學(xué)教授胡事民在報(bào)告中提及，本輪人工智能發(fā)展有四駕馬車：算力、框架、算法、數(shù)據(jù)，匯聚并促進(jìn)了人類智慧的交融。他認(rèn)為，應(yīng)該更全面看待人工智能發(fā)展，不要只看應(yīng)用端，要從硬件、框架、模型算法和應(yīng)用四個(gè)層面來(lái)看，這四者都對(duì)人工智能的生態(tài)產(chǎn)生重要影響。

胡事民院士分析了目前人工智能發(fā)展，我國(guó)面臨的幾個(gè)不利條件。首先，從硬件來(lái)看，兩種國(guó)外AI芯片占了99%的市場(chǎng)份額。國(guó)產(chǎn)芯片要融入既有生態(tài)非常難，迭代更新慢。

其次，從框架來(lái)看，國(guó)外深度學(xué)習(xí)框架占據(jù)主導(dǎo)的地位，國(guó)產(chǎn)框架面臨生態(tài)屏障。從模型與算法方面來(lái)看，比前兩者要好，但需加強(qiáng)原始創(chuàng)新。

在應(yīng)用層面，我國(guó)市場(chǎng)大、應(yīng)用場(chǎng)景多、落地快、市場(chǎng)繁榮，有許多創(chuàng)業(yè)公司，“但它是一棟危樓，底下的硬件和軟件有問(wèn)題。這是我們的現(xiàn)狀?！?/span>

“需要以深度學(xué)習(xí)框架為牽引，夯實(shí)我國(guó)AI生態(tài)?！焙旅裨菏刻岢?，因?yàn)榭蚣艹猩蠁⑾拢梢栽谛酒懔λ讲桓叩那闆r下盡量挖掘潛力，同時(shí)把應(yīng)用層支撐好。清華大學(xué)在2020年3月20日推出“計(jì)圖”深度學(xué)習(xí)框架，具備兩個(gè)優(yōu)點(diǎn)：第一個(gè)好處是快；第二個(gè)好處是對(duì)硬件的支持廣泛，可以快速適配任何一款國(guó)產(chǎn)硬件?！跋Ｍ浴?jì)圖’框架為核心，基于國(guó)產(chǎn)硬件促進(jìn)人工智能算法應(yīng)用的創(chuàng)新，來(lái)推動(dòng)開(kāi)源開(kāi)放，構(gòu)建中國(guó)人工智能的生態(tài)?！?/span>

人工智能自主發(fā)展需要匯聚青年力量

中國(guó)工程院院士、清華大學(xué)教授鄭緯民告訴中青報(bào)·中青網(wǎng)記者，從學(xué)術(shù)角度來(lái)看，現(xiàn)在有四類人在關(guān)注大模型，一是真正做大模型的；二是大模型+，做應(yīng)用的；三是進(jìn)行政策規(guī)范治理的研究學(xué)者；四是如何讓大模型用起來(lái)，進(jìn)行基礎(chǔ)設(shè)施建設(shè)的科研人員。

作為大會(huì)程序委員會(huì)主席，清華大學(xué)副教授崔鵬說(shuō)，我們現(xiàn)在整體人工智能的發(fā)展路徑還是以跟隨為主，其中一個(gè)很明顯的現(xiàn)象是，OpenAI發(fā)布一個(gè)新的產(chǎn)品，我們趕緊奮起直追，那么中國(guó)人工智能自主發(fā)展路徑在何方，希望匯聚青年精英的力量，共同去探討和商議。

清華大學(xué)公共管理學(xué)院教授，人工智能治理研究中心主任梁正在專題報(bào)告中指出，發(fā)展人工智能，我國(guó)在基礎(chǔ)理論、核心軟硬件和生態(tài)方面還與國(guó)際先進(jìn)水平有一定差距，要平衡創(chuàng)新與治理、踐行價(jià)值對(duì)齊的倫理思路，并吸收國(guó)際經(jīng)驗(yàn)，探索理念開(kāi)放、主體多元、對(duì)象分層、工具靈活的敏捷治理新思路，以推動(dòng)我國(guó)人工智能治理的進(jìn)一步發(fā)展。

相較于大語(yǔ)言模型，近期以O(shè)pen AI的SORA、GPT-4o，以及谷歌的Geimini為代表的世界模型，成為學(xué)術(shù)界和工業(yè)界的研究熱點(diǎn)，被認(rèn)為是通向強(qiáng)人工智能的關(guān)鍵技術(shù)路徑。但是以多模態(tài)學(xué)習(xí)為基礎(chǔ)的世界模型的路線還不清晰，未來(lái)發(fā)展有很多爭(zhēng)議，復(fù)旦大學(xué)教授邱錫鵬教授發(fā)起的“世界模型之路在何方”的論壇，吸引了更多學(xué)者探討世界模型的發(fā)展路線，以及在國(guó)內(nèi)算力不足的條件下如何輕量化發(fā)展，如何跨模態(tài)相互理解等研究方向。

來(lái)源：中國(guó)青年報(bào)客戶端

亚洲激情无码视频转区_精品国产一区二区三区老师快_国产一级A爱婬片免费播放桃_一区二区有码AV在线播放

構(gòu)建中國(guó)人自己的智能生態(tài) 解決大模型的“煩惱”

2025年9月20日東昌府新聞

2025年9月19日東昌府新聞

2025年9月18日東昌府新聞

2025年9月17日東昌府新聞