大模型拼應用最新戰(zhàn)況：智能助手扎堆襲來

來源：中國青年報中國青年網(wǎng)朱彩云2024-09-10

分享到 :

核心提示：AI將成為人類從事各種生產(chǎn)和活動的代理。AI等技術的大規(guī)模應用將重塑人的內(nèi)涵，進而重塑人們的社會關系?！俺鋈Α苯鼉赡甑拇竽Ｐ?，正迎來應用邊界的進

AI將成為人類從事各種生產(chǎn)和活動的代理。AI等技術的大規(guī)模應用將重塑人的內(nèi)涵，進而重塑人們的社會關系。

——————————

“出圈”近兩年的大模型，正迎來應用邊界的進一步拓寬。

9月5日開幕的2024Inclusion·外灘大會上，復旦大學計算機科學技術學院教授黃萱菁分享了AI智能體（AI Agent）最近有多“熱”：不僅工業(yè)界的國際國內(nèi)巨頭公司開始布局研發(fā)基于大語言模型的智能體，學術界把智能體用于科研創(chuàng)新如預測、分析多蛋白復合物結(jié)構(gòu)，眾多開發(fā)者還在聊天、購物、游戲、具身智能（具有物理實體并具備感知、決策、執(zhí)行及交互能力的智能體——記者注）等領域應用智能體。

“大語言模型更偏向于對話與答疑，基于大模型的智能體更像人類的助手，偏向于感知環(huán)境、規(guī)劃決策并采取行動。”黃萱菁介紹，目前，智能體應用已經(jīng)適配在出行、政務民生、餐飲、景區(qū)、醫(yī)療、金融等領域場景。

大會開幕當天，AI生活管家、AI金融管家、AI健康管家等AI智能體亮相黃浦江畔。在大會所在地、曾見證我國工業(yè)發(fā)展的江南造船廠舊址，共30余項AI新成果相繼發(fā)布。

在清華大學人工智能研究院常務副院長孫茂松看來，當前智能體的發(fā)展得益于語言大模型在生成能力、代碼生成、圖像處理及3D建模等方面的進步。他認為，智能體技術正潤物細無聲地走進大眾生活，但這是一個量變引起質(zhì)變的過程，“可能需要通過幾年迭代和積累，其性能才會有顯著提升?！?

從“拼參數(shù)”到“拼應用”

從1年半前的百模大戰(zhàn)，到今年5月大模型領域掀起的價格戰(zhàn)，出席本次大會的不少大模型廠商感受著大模型近兩年來發(fā)生的變化：性能提升和成本下降。

“去年行業(yè)主要在做模型基礎，中國也在巨大的市場期望里跟進追趕、證明自己?！卑俅ㄖ悄軇?chuàng)始人兼CEO王小川習慣用“全新的時代”形容智能時代，他說，在智能時代，大模型帶來的是生產(chǎn)力的直接提升。

一個明顯的案例是，去年12月谷歌公司推出的大語言模型Gemini在MMLU（大規(guī)模多任務語言理解）測試中，以90.0%的高分首次超過人類專家。該大模型從一開始就被創(chuàng)建為多模態(tài)模型，這意味著它可以歸納并流暢地理解、操作以及組合不同類型的信息，包括文本、代碼、音頻、圖像和視頻。

“大模型正從‘拼參數(shù)’走向‘拼應用’?！蔽浵伡瘓F總裁韓歆毅認為，大模型產(chǎn)品的目標可以濃縮為：好用、有用和用得起。對于用戶，這意味著一種全新的、更加直觀的交互體驗；而對于商家，則意味著能夠更深入地理解用戶需求，進而提供更加結(jié)構(gòu)化和個性化的服務。

他以大會開幕首天發(fā)布的AI生活管家“支小寶”為例說，該應用基于螞蟻百靈大模型打造，具備國內(nèi)首創(chuàng)的服務執(zhí)行與智能陪伴能力。

具體來看，用戶說句話就能辦到的事包括快速訂票、點餐、打車、查詢附近吃喝玩樂、看醫(yī)保余額、異地就醫(yī)備案、給親友轉(zhuǎn)賬或發(fā)紅包、搜尋電子社保卡等。

“智能體能發(fā)揮大語言模型的專業(yè)性，帶來各種服務的迭代升級?！痹邳S萱菁看來，具身語言智能體所具備的視覺問答、圖片生成、標題生成、動作規(guī)劃和操控等多模態(tài)的輸入和具身輸出的方式，很可能是邁向通用人工智能的關鍵之一。

《連線》雜志創(chuàng)始主編、《5000天后的世界》作者凱文·凱利則認為，AI落地產(chǎn)業(yè)需要時間，“僅僅消化現(xiàn)有技術，可能就需要5-8年時間?！彼谂c韓歆毅線上對談時表示，目前人們把AI主要運用于一些工具型任務，價值主要體現(xiàn)在提升效率上。他認為，金融和醫(yī)療領域會最先應用并受益于AI的發(fā)展，“因為這兩個行業(yè)信息密度高。此外，廣告和營銷行業(yè)也會是最早受到影響的行業(yè)之一?！?

人機交互新方式

讓數(shù)字分身分擔工作，由AI健康管家找醫(yī)生、讀報告、陪看診，用語音喊AI金融管家?guī)椭庾x市場熱點、分析行業(yè)板塊……適配不同領域場景的AI助手正進入人們的生產(chǎn)與生活。在復旦大學計算機科學技術學院教授、上海市數(shù)據(jù)科學重點實驗室主任肖仰華看來，AI將成為人類從事各種生產(chǎn)和活動的代理。AI等技術的大規(guī)模應用將重塑人的內(nèi)涵，進而重塑人們的社會關系。

香港科技大學校董會主席、美國國家工程院外籍院士沈向洋則認為，AI智能體時代的到來，不會是一個神奇而強大的模型突然代替了所有的工作流，“它涉及技術、工程與市場的不斷磨合，最終以超預期的服務呈現(xiàn)給人類?！?

他尤其提到人機交互的新方式指向“AI與IA（Intelligent Augmentation，即智能增強——記者注）”的融合共進。這意味著一種以人為本的AI發(fā)展路徑，它聚焦于運用技術提升人類的能力，而非取代人類，強調(diào)人類與AI之間的協(xié)作關系。

“（大模型產(chǎn)業(yè)）未來的發(fā)展路徑已經(jīng)非常明確，將會從之前的大語言模型到多模態(tài)模型，未來邁向世界模型。未來一定會往具身智能方向上發(fā)展，往機器人方向走，其中一個特殊形態(tài)就是自動駕駛。”沈向洋從算力角度介紹，大模型可分為通用大模型、行業(yè)大模型、企業(yè)大模型和個人大模型，其中通用大模型是AI的基礎，要訓練一個通用大模型至少需要萬卡，行業(yè)大模型是做領域應用的底座，需要千卡級別的訓練。

國家網(wǎng)信辦數(shù)據(jù)顯示，截至2024年7月30日，我國已經(jīng)完成備案的生成式人工智能服務大模型已達197個，從大模型的類型看，通用大模型、行業(yè)大模型分別占比31％、69％。從行業(yè)大模型的類型看，教育領域19款、金融領域18款、辦公領域15款、政務領域11款、醫(yī)療領域11款，且正在向傳媒、招聘、家裝、心理等更廣闊的場景延伸。

“更多高質(zhì)量、高價值的數(shù)據(jù)是在私域，在垂直行業(yè)，在千行百業(yè)，再往前走就是個人數(shù)據(jù)。”在肖仰華看來，目前的大模型還不能夠勝任專業(yè)任務，要想做到提供專業(yè)任務，用好私域數(shù)據(jù)可能是關鍵，“所以數(shù)據(jù)待挖掘的潛力仍然十分之大?！?

關注“走得慢”的人

可以肯定的是，以智能體為代表的AI助手在幫助解決具體問題上具備優(yōu)勢。用西湖大學深度學習實驗室成果轉(zhuǎn)化負責人、西湖心辰CEO醒辰的話來說，大部分語音大模型在智商賽道不停比拼，“但大量的溝通場景不是光靠智力就可以完成，還需要情商與溝通能力?！?

這也是很多人面對AI助手的真實需求。既是教師又是父親的嚴鋒，是復旦大學中文系教授、博士生導師，他在大會期間參加圓桌討論“AI重塑未來生活的無限可能”時坦言，自己最希望有一個AI助手、機器人來陪伴自己的孩子?！耙驗槲业暮⒆邮且粋€孤獨癥患者，孤獨癥的核心問題是人際交往（存在）障礙。”

“我買了很多智能音箱，我相信這是未來通向陪伴機器人的一種先驅(qū)，它們也在進化?！眹冷h說，正是通過有意識地問這些放在客廳、臥室的智能音箱，他知道了孩子感興趣的是遠古動物、中世紀歷史，“我再向音箱提問的時候，孩子就會主動參與進來?！?

好消息是，針對陪伴領域的個性化需求如情緒疏導、客戶服務、兒童陪伴等，已有應用落地。醒辰以大會期間正式發(fā)布的國內(nèi)首款端到端通用語音大模型心辰Lingo為例說，該大模型在處理對話時直接理解語音，捕捉語氣、節(jié)奏和情緒，并進行語音回復，通過減少信息處理過程中的損失，讓“機器”更懂人。

“近幾年大部分AI數(shù)字人都是以工具來設計的，所以它首要目的是解決用戶遇到的問題，其次才是提供情緒價值。但是隨著很多AI技術的快速發(fā)展，大模型智能體對話能力越來越強，設計者開始更多關注數(shù)字人等AI助手如何更好地去解決情感方面的問題，提供情緒價值?！蔽浵伡瘓F數(shù)字人算法負責人楊明暉告訴中青報·中青網(wǎng)記者，隨著動態(tài)大模型包括視頻生成技術的快速發(fā)展，可能到明年就會有比較成熟的數(shù)字人方面的應用，“你輸入一張圖片，然后就可以和圖片中的角色語音對話，角色的表情和動作都可以生動自然?！?

強腦科技創(chuàng)始人兼CEO韓璧丞認為，在技術發(fā)展非?？斓臅r候，科研工作者應該更關注那些“走得慢”的人，比如肢體障礙人士、腦疾病患者群體。

過去10多年，這名哈佛大學腦科學中心博士生一直專注于腦機接口底層技術的研發(fā)。他認為，腦機接口技術在未來5-10年內(nèi)，會發(fā)生3個階段的變化，分別是修復、增強和更高階的交互?！跋乱淮慕换兊酶唠A，比如現(xiàn)在是通過語言對話，未來可能不需要再通過語言對話，收到提問我們想一想就（把想法）傳遞出去了?！?

(編輯:月兒)

返回315記者攝影家首頁>>

免責聲明：

1、本網(wǎng)內(nèi)容凡注明"來源：315記者攝影家網(wǎng)"的所有文字、圖片和音視頻資料，版權(quán)均屬315記者攝影家網(wǎng)所有，轉(zhuǎn)載、下載須通知本網(wǎng)授權(quán)，不得商用，在轉(zhuǎn)載時必須注明"稿件來源：315記者攝影家網(wǎng)"，違者本網(wǎng)將依法追究責任。
2、本文系本網(wǎng)編輯轉(zhuǎn)載，轉(zhuǎn)載出于研究學習之目的，為北京正念正心國學文化研究院藝術學研究、宗教學研究、教育學研究、文學研究、新聞學與傳播學研究、考古學研究的研究員研究學習，并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3、如涉及作品、圖片等內(nèi)容、版權(quán)和其它問題，請作者看到后一周內(nèi)來電或來函聯(lián)系刪除。