警惕人工智能時(shí)代的“智能體風(fēng)險(xiǎn)”

  來源:新華網(wǎng)彭茜2024-07-17
打印本文
核心提示:一群證券交易機(jī)器人通過高頻買賣合約在納斯達(dá)克等證券交易所短暫地抹去了1萬億美元價(jià)值,世界衛(wèi)生組織使用的聊天機(jī)器人提供了過時(shí)的藥品審核信息,美國一位資深律師沒能判

一群證券交易機(jī)器人通過高頻買賣合約在納斯達(dá)克等證券交易所短暫地抹去了1萬億美元價(jià)值,世界衛(wèi)生組織使用的聊天機(jī)器人提供了過時(shí)的藥品審核信息,美國一位資深律師沒能判斷出自己向法庭提供的歷史案例文書竟然均由ChatGPT憑空捏造……這些真實(shí)發(fā)生的案例表明,智能體帶來的安全隱患不容小覷。

  圖為2023年11月2日,在英國布萊奇利園,一名參會(huì)者經(jīng)過首屆人工智能安全峰會(huì)的宣傳展板。(新華社記者李穎攝)

  智能體進(jìn)入批量化生產(chǎn)時(shí)代

  智能體是人工智能(AI)領(lǐng)域中的一個(gè)重要概念,是指能夠自主感知環(huán)境、做出決策并執(zhí)行行動(dòng)的智能實(shí)體,它可以是一個(gè)程序、一個(gè)系統(tǒng)或是一個(gè)機(jī)器人。

  智能體的核心是人工智能算法,包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等技術(shù)。通過這些算法,智能體可以從大量數(shù)據(jù)中學(xué)習(xí)并改進(jìn)自身的性能,不斷優(yōu)化自己的決策和行為。智能體還可根據(jù)環(huán)境變化做出靈活的調(diào)整,適應(yīng)不同的場景和任務(wù)。

  學(xué)界認(rèn)為,智能體一般具有以下三大特質(zhì):

  第一,可根據(jù)目標(biāo)獨(dú)立采取行動(dòng),即自主決策。智能體可以被賦予一個(gè)高級別甚至模糊的目標(biāo),并獨(dú)立采取行動(dòng)實(shí)現(xiàn)該目標(biāo)。

  第二,可與外部世界互動(dòng),自如地使用不同的軟件工具。比如基于GPT-4的智能體AutoGPT,可以自主地在網(wǎng)絡(luò)上搜索相關(guān)信息,并根據(jù)用戶的需求自動(dòng)編寫代碼和管理業(yè)務(wù)。

  第三,可無限期地運(yùn)行。美國哈佛大學(xué)法學(xué)院教授喬納森·齊特雷恩近期在美國《大西洋》雜志發(fā)表的《是時(shí)候控制AI智能體》一文指出,智能體允許人類操作員“設(shè)置后便不再操心”。還有專家認(rèn)為,智能體具備可進(jìn)化性,能夠在工作進(jìn)程中通過反饋逐步自我優(yōu)化,比如學(xué)習(xí)新技能和優(yōu)化技能組合。

  以GPT為代表的大語言模型(LLM)的出現(xiàn),標(biāo)志著智能體進(jìn)入批量化生產(chǎn)時(shí)代。此前,智能體需靠專業(yè)的計(jì)算機(jī)科學(xué)人員歷經(jīng)多輪研發(fā)測試,現(xiàn)在依靠大語言模型就可迅速將特定目標(biāo)轉(zhuǎn)化為程序代碼,生成各式各樣的智能體。而兼具文字、圖片、視頻生成和理解能力的多模態(tài)大模型,也為智能體的發(fā)展創(chuàng)造了有利條件,使它們可以利用計(jì)算機(jī)視覺“看見”虛擬或現(xiàn)實(shí)的三維世界,這對于人工智能非玩家角色和機(jī)器人研發(fā)都尤為重要。

  風(fēng)險(xiǎn)值得警惕

  智能體可以自主決策,又能通過與環(huán)境交互施加對物理世界影響,一旦失控將給人類社會(huì)帶來極大威脅。哈佛大學(xué)齊特雷恩認(rèn)為,這種不僅能與人交談,還能在現(xiàn)實(shí)世界中行動(dòng)的AI的常規(guī)化,是“數(shù)字與模擬、比特與原子之間跨越血腦屏障的一步”,應(yīng)當(dāng)引起警覺。

  智能體的運(yùn)行邏輯可能使其在實(shí)現(xiàn)特定目標(biāo)過程中出現(xiàn)有害偏差。齊特雷恩認(rèn)為,在一些情況下,智能體可能只捕捉到目標(biāo)的字面意思,沒有理解目標(biāo)的實(shí)質(zhì)意思,從而在響應(yīng)某些激勵(lì)或優(yōu)化某些目標(biāo)時(shí)出現(xiàn)異常行為。比如,一個(gè)讓機(jī)器人“幫助我應(yīng)付無聊的課”的學(xué)生可能無意中生成了一個(gè)炸彈威脅電話,因?yàn)锳I試圖增添一些刺激。AI大語言模型本身具備的“黑箱”和“幻覺”問題也會(huì)增加出現(xiàn)異常的頻率。

  智能體還可指揮人在真實(shí)世界中的行動(dòng)。美國加利福尼亞大學(xué)伯克利分校、加拿大蒙特利爾大學(xué)等機(jī)構(gòu)專家近期在美國《科學(xué)》雜志發(fā)表《管理高級人工智能體》一文稱,限制強(qiáng)大智能體對其環(huán)境施加的影響是極其困難的。例如,智能體可以說服或付錢給不知情的人類參與者,讓他們代表自己執(zhí)行重要行動(dòng)。齊特雷恩也認(rèn)為,一個(gè)智能體可能會(huì)通過在社交網(wǎng)站上發(fā)布有償招募令來引誘一個(gè)人參與現(xiàn)實(shí)中的敲詐案,這種操作還可在數(shù)百或數(shù)千個(gè)城鎮(zhèn)中同時(shí)實(shí)施。

  由于目前并無有效的智能體退出機(jī)制,一些智能體被創(chuàng)造出后可能無法被關(guān)閉。這些無法被停用的智能體,最終可能會(huì)在一個(gè)與最初啟動(dòng)它們時(shí)完全不同的環(huán)境中運(yùn)行,徹底背離其最初用途。智能體也可能會(huì)以不可預(yù)見的方式相互作用,造成意外事故。

  已有“狡猾”的智能體成功規(guī)避了現(xiàn)有的安全措施。相關(guān)專家指出,如果一個(gè)智能體足夠先進(jìn),它就能夠識(shí)別出自己正在接受測試。目前已發(fā)現(xiàn)一些智能體能夠識(shí)別安全測試并暫停不當(dāng)行為,這將導(dǎo)致識(shí)別對人類危險(xiǎn)算法的測試系統(tǒng)失效。

  專家認(rèn)為,人類目前需盡快從智能體開發(fā)生產(chǎn)到應(yīng)用部署后的持續(xù)監(jiān)管等全鏈條著手,規(guī)范智能體行為,并改進(jìn)現(xiàn)有互聯(lián)網(wǎng)標(biāo)準(zhǔn),從而更好地預(yù)防智能體失控。應(yīng)根據(jù)智能體的功能用途、潛在風(fēng)險(xiǎn)和使用時(shí)限進(jìn)行分類管理。識(shí)別出高風(fēng)險(xiǎn)智能體,對其進(jìn)行更加嚴(yán)格和審慎的監(jiān)管。還可參考核監(jiān)管,對生產(chǎn)具有危險(xiǎn)能力的智能體所需的資源進(jìn)行控制,如超過一定計(jì)算閾值的AI模型、芯片或數(shù)據(jù)中心。此外,由于智能體的風(fēng)險(xiǎn)是全球性的,開展相關(guān)監(jiān)管國際合作也尤為重要。

(編輯:映雪)


警惕人工智能時(shí)代的“智能體風(fēng)險(xiǎn)”

 

免責(zé)聲明:

1、本網(wǎng)內(nèi)容凡注明"來源:315記者攝影家網(wǎng)"的所有文字、圖片和音視頻資料,版權(quán)均屬315記者攝影家網(wǎng)所有,轉(zhuǎn)載、下載須通知本網(wǎng)授權(quán),不得商用,在轉(zhuǎn)載時(shí)必須注明"稿件來源:315記者攝影家網(wǎng)",違者本網(wǎng)將依法追究責(zé)任。
2、本文系本網(wǎng)編輯轉(zhuǎn)載,轉(zhuǎn)載出于研究學(xué)習(xí)之目的,為北京正念正心國學(xué)文化研究院藝術(shù)學(xué)研究、宗教學(xué)研究、教育學(xué)研究、文學(xué)研究、新聞學(xué)與傳播學(xué)研究、考古學(xué)研究的研究員研究學(xué)習(xí),并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3、如涉及作品、圖片等內(nèi)容、版權(quán)和其它問題,請作者看到后一周內(nèi)來電或來函聯(lián)系刪除。