獨(dú)家對(duì)話騰訊混元?jiǎng)㈧虾辏鹤龃竽P涂梢杂小干钲谒俣取,但不能跳?/h1>
2024-07-03 15:03:46 市場(chǎng)信息 

「越有決心情緒越穩(wěn),已悄然接入騰訊 700 個(gè)產(chǎn)品」。

作者 | 張鵬

整理 | 今夜科技談

加速,狂奔,硝煙四起,是過(guò)去一年大模型創(chuàng)業(yè)浪潮展現(xiàn)出的一番景象。有資源、有能力的騰訊,卻顯得「過(guò)于冷靜」了。

2024 年 5 月 30 日,騰訊推出基于混元大模型的 App——元寶,它的產(chǎn)品設(shè)計(jì)很簡(jiǎn)潔,打開(kāi)的第一屏,是一個(gè)搜索框,核心是先瞄準(zhǔn)生產(chǎn)力場(chǎng)景,重塑信息的組織、交付。

這樣的產(chǎn)品理念從何而來(lái)?一個(gè)做底層技術(shù)出身的團(tuán)隊(duì),做大模型是首先是為了改造內(nèi)部業(yè)務(wù)的工作流和產(chǎn)品。所以對(duì)于做什么,不做什么,騰訊混元大模型團(tuán)隊(duì)有清晰的認(rèn)知。生產(chǎn)率工具容錯(cuò)率低,更考驗(yàn)技術(shù)能力,進(jìn)一步迭代模型能力。

對(duì)外鮮有高調(diào)發(fā)聲,「水下」內(nèi)部卻將大模型擺在戰(zhàn)略位置。推出元寶 App 之前,騰訊混元大模型作為技術(shù)底座的角色,已經(jīng)支持了騰訊內(nèi)部接近 700 個(gè)「客戶(hù)」,并沉淀出一套平臺(tái)工具和合作模式。這讓騰訊對(duì)后來(lái)將模型算法、數(shù)據(jù)、工程能力等技術(shù)能力「外化」有了信心,一切也順其自然。

騰訊元寶發(fā)布之后,騰訊混元大模型負(fù)責(zé)人劉煜宏收到一些反饋,讓他感到驚喜,「一些好的公眾號(hào)內(nèi)容已經(jīng)被『遺忘』,但元寶挖掘出來(lái),重新做了信息組織」!笡](méi)有上帝視角」,用戶(hù)需求越滾越大是產(chǎn)品最好的驗(yàn)證。

「一年后國(guó)內(nèi)的模型能力將拉齊」的預(yù)判在今天被驗(yàn)證,再次證明了圖快走捷徑做大模型沒(méi)有意義。對(duì)于 OpenAI 的示范效應(yīng),劉煜宏說(shuō),即便后來(lái)者看到一條確定性高的路徑,也得走一遍。試過(guò),才能跑得越來(lái)越快,縮短每一次追趕的時(shí)間。被問(wèn)到之后的計(jì)劃,劉煜宏說(shuō),多模態(tài)甚至全模態(tài)的理解和生成都是「必答題」,當(dāng)下也會(huì)讓模型在「多一些思考」、增強(qiáng)推理能力上下功夫。

大模型注定是一場(chǎng)長(zhǎng)跑,「AGI 目前更像信仰」,但將騰訊混元大模型能力在內(nèi)部 700 個(gè)業(yè)務(wù)上用得好,是劉煜宏認(rèn)為對(duì)于 AGI 的務(wù)實(shí)追求。有遠(yuǎn)見(jiàn)但務(wù)實(shí),也是混元團(tuán)隊(duì)在大模型上的世界觀對(duì)齊。

在近兩個(gè)小時(shí)的直播里,關(guān)于騰訊的大模型思考,混元的做與不做,元寶將與騰訊生態(tài)如何產(chǎn)生聯(lián)動(dòng)等話題,劉煜宏為我們做了坦誠(chéng)的梳理和解答。

以下是這次直播對(duì)話的實(shí)錄,經(jīng)極客公園整理后發(fā)布:

01做大模型可以有「深圳速度」,但不能跳步

張鵬:去年 9 月騰訊混元大模型正式對(duì)外亮相,前段時(shí)間也發(fā)布了元寶這樣一個(gè)比較AI Native 的產(chǎn)品。但外界總體感覺(jué),騰訊比較沉穩(wěn),沒(méi)有瘋狂搶先手、也沒(méi)有一下放出很多產(chǎn)品,情緒一直比較穩(wěn)定?

沉穩(wěn)的背后,騰訊在大模型上是怎樣的策略?

劉煜宏:其實(shí)是「外松內(nèi)緊」。外界看到不著急,感知混元推出來(lái)比較晚,但坦白來(lái)講,這是一個(gè)非常卷的賽道,我們內(nèi)部的節(jié)奏是非常緊張的。

騰訊從戰(zhàn)略上一直將大模型和生成式人工智能,視為百年不遇的、類(lèi)似工業(yè)革命一樣的機(jī)遇。

對(duì)外產(chǎn)品上,去年 9 月推出了「騰訊混元助手」小程序,今年 5 月 30 日推出了元寶 App,(也推出智能體開(kāi)發(fā)平臺(tái)——元器),但這些背后的底層能力其實(shí)我們做了很久,像廣告大模型在 21 年就開(kāi)始做了。元寶 App 發(fā)布一個(gè)月不到的時(shí)間里,更新了五六版,每一個(gè)小的迭代都解決了一部分問(wèn)題。

去年我們沒(méi)怎么對(duì)外發(fā)布產(chǎn)品,其實(shí)是內(nèi)部率先用起來(lái)(大模型),比如騰訊會(huì)議、文檔,微信讀書(shū)的 AI 助手,包括它們?cè)趦?nèi)很多內(nèi)部產(chǎn)品已經(jīng)在用了,除了 API 的方式接入,還有一些業(yè)務(wù)會(huì)做精調(diào)。到目前為止,騰訊內(nèi)部有接近 700 個(gè)業(yè)務(wù)接入混元,基本上騰訊所有的業(yè)務(wù)都用。

騰訊內(nèi)部近 700 個(gè)業(yè)務(wù)接入混元大模型|圖片來(lái)源:騰訊

張鵬:OpenAI一聲炮響讓大家看到這個(gè)新的趨勢(shì),去年騰訊內(nèi)部對(duì)于大模型是如何判定的?當(dāng)時(shí)做決策的真實(shí)情況是什么樣的?

劉煜宏:GPT-3.5 出來(lái)前后開(kāi)始做混元這個(gè)項(xiàng)目。一些底層相關(guān)技術(shù)做得更早,剛才提到廣告大模型在 21 年就開(kāi)始做了,搜索相關(guān)的「推廣搜」場(chǎng)景也做了很久,運(yùn)行大模型的底座從一幾年開(kāi)始就在建設(shè)。

對(duì)外的產(chǎn)品節(jié)奏看起來(lái)體感很慢,因?yàn)橐婚_(kāi)始便深知這是一個(gè)長(zhǎng)期的項(xiàng)目。原來(lái)還說(shuō)百年一遇,現(xiàn)在發(fā)現(xiàn)是幾百年一遇的項(xiàng)目。不是短期一窩蜂就能搞定,像做原子彈,只有一步一步積累,把底子打牢。

舉個(gè)例子,做底層涉及到網(wǎng)絡(luò)問(wèn)題,沒(méi)有網(wǎng)絡(luò)、算力,怎么訓(xùn)練?錢(qián)能跟上嗎?預(yù)算怎么投怎么收?等等,都得考慮。我們比較清醒,對(duì)底層困難預(yù)估得足。

一年半前我們判斷,一年后國(guó)內(nèi)的幾家大廠在大模型能力都差不多。目前也認(rèn)證了這個(gè)預(yù)判。我們雖然壓力大但有比較多的試驗(yàn)機(jī)會(huì)。

張鵬:在大模型上,業(yè)界大家都比較著急,也有創(chuàng)業(yè)者認(rèn)為這個(gè)時(shí)候快速跟上是第一目標(biāo),甚至可以基于開(kāi)源模型做 post-train,因?yàn)殚_(kāi)源模型「看」過(guò)的那些數(shù)據(jù),沒(méi)必要重新再「看」一遍。

劉煜宏:我們從來(lái)沒(méi)想過(guò)這條路,一開(kāi)始就決定冷啟動(dòng),從 0 到 1 完全自研,是一條非常艱難的路。

騰訊做產(chǎn)品有個(gè)原則,得自己驗(yàn)證一遍,連顏色、像素、排布的選擇都是試驗(yàn)出來(lái)的,頁(yè)面設(shè)計(jì)成瀑布流留存率就有多高?對(duì)男性用戶(hù)如何?等等這些都是 ABtest 出來(lái)的。

OpenAI 過(guò)去幾年走過(guò)的路,模型從 1.0 版本到 4.0 版本他是怎么走的?就算過(guò)程中你按他披露出來(lái)的一些技術(shù)路線走,該做的實(shí)驗(yàn)一定不能少。比如也有很多超參數(shù)、數(shù)據(jù)配比要調(diào),甚至中英文數(shù)據(jù)比例怎樣才是效果最好都要做大量實(shí)驗(yàn),花了很多時(shí)間在這里。

張鵬:打個(gè)比方說(shuō),下決心要給新時(shí)代生個(gè)孩子,不是說(shuō)趕緊抱一個(gè)過(guò)來(lái),是要生一個(gè)親生的感覺(jué)。

劉煜宏:對(duì),我們從一開(kāi)始就堅(jiān)定了全自研路線,追求自研、可控度、安全。從 0 到 1 自主探索,包括訓(xùn)練、推理的框架平臺(tái),模型預(yù)訓(xùn)練、精調(diào)、強(qiáng)化、怎么對(duì)齊,數(shù)據(jù),投入了大量資源。

坦白來(lái)講,大家都在看OpenAI的路線,但不是你按 GPT-4.0 的套路走,就能行得通。

張鵬:要從 0 到 1 走一遍、但要更快速地走一遍,而不是找個(gè)捷徑只為了追上某個(gè)點(diǎn)。那么設(shè)定的這個(gè)起點(diǎn)是哪?

劉煜宏:如果說(shuō)大模型,可能從 Transformer 甚至更早。

我們會(huì)設(shè)定一些目標(biāo),比如一開(kāi)始對(duì)標(biāo) GPT-3.5,預(yù)計(jì)什么節(jié)點(diǎn)能達(dá)到 3.5 的什么水平,什么時(shí)候能在工程上追上。坦誠(chéng)講,目前很多能力提升還真的是靠數(shù)據(jù)和工程。

目標(biāo)是有的,但不能跳步。不能看到 GPT-4o 出來(lái)了,發(fā)現(xiàn)多模態(tài)融合做得好,就不考慮 GPT-3.5 了。我們?cè)u(píng)測(cè) GPT-4o 確實(shí)比 GPT-4V、GPT-4 Turbo 那些版本的能力都強(qiáng)。但直接按 GPT-4o 路線走,估計(jì)大概率會(huì)失敗。

目前來(lái)看大模型怎么選擇路線,還是一個(gè)實(shí)驗(yàn)科學(xué),你得堆資源,人力,數(shù)據(jù)訓(xùn)練,當(dāng)看到就這么一條路,那么選它有很大概率會(huì)成功,把他們探索的加速走一遍,而不是直接到終點(diǎn)等著說(shuō)就按這個(gè)路線走。

張鵬:大模型技術(shù)變化非?,一邊挖地基、一邊蓋樓的感覺(jué),這樓現(xiàn)在一下都蓋到比方說(shuō) 5、6 層了,統(tǒng)一多模態(tài)什么的全出來(lái)了。壓力會(huì)不會(huì)更大?還是說(shuō),打地基和不斷蓋樓的過(guò)程中,更有信心了?

劉煜宏:跑了一遍,當(dāng)然更有信心。你看到蓋到 5、6 樓,不代表前面 1、2、3、4……樓就不需要,只不過(guò)你可以蓋得更快,深圳速度一天一層樓類(lèi)似這樣,所以一定是要把從零到一的過(guò)程重新走一遍。

張鵬:你們的做法還是很?chē)?yán)謹(jǐn)?shù)。煜宏你在騰訊多少年了?

劉煜宏:我 05 年加入的。

張鵬:20 年了,那你一定對(duì)騰訊的風(fēng)格非常了解。去年很多大廠積極地?fù)屔砦,騰訊好似不爭(zhēng)不搶?zhuān)趦?nèi)部挺較勁的。這個(gè)是騰訊骨子里帶的做事風(fēng)格?

劉煜宏:我在騰訊一直做技術(shù)。坦白講,做技術(shù)、產(chǎn)品是可以借鑒的,但也有個(gè)詞叫「空中樓閣」,沒(méi)有地基你就上不去。這可能也是騰訊的風(fēng)格。

別人用三年從版本 1.0 迭代到 5.0,你用半年走一遍,如果說(shuō)產(chǎn)品和技術(shù)有參考,那么最大的參考意義在這過(guò)程中。走一遍你會(huì)遇到同樣的東西,這時(shí)候會(huì)理解,「哦,為什么是這樣」,走一遍后也才知道,也許因?yàn)橛脩?hù)群、生態(tài)等不同,另外一條路可能是更好的選擇。

02從需求中「長(zhǎng)」出來(lái)的元寶 App

張鵬:你剛講很多騰訊內(nèi)部的產(chǎn)品在用混元大模型了,能不能舉幾個(gè)混元給原有產(chǎn)品帶來(lái)新的 Feature(功能/特性)的例子?

劉煜宏:最新的例子,微信讀書(shū)里的 AI 讀書(shū);微信輸入法 AI 幫助擴(kuò)寫(xiě);騰訊會(huì)議里的 AI 助手,能給晚加入會(huì)議的觀眾總結(jié)之前別人講了什么,把一次很長(zhǎng)會(huì)議的會(huì)議紀(jì)要給摘出來(lái)。還有騰訊文檔里的續(xù)寫(xiě);企業(yè)微信里的翻譯幫助與海外同事交流,F(xiàn)在騰訊旗下的協(xié)作 SaaS 全都接入了騰訊混元大模型。

再早一點(diǎn)的例子,智能客服在內(nèi)部最為普遍。其實(shí)在用大模型之前,智能客服就做得挺成熟的,但大模型還能再提升 20%,這種程度的效率提升。

其實(shí)做了(大模型)產(chǎn)品之后,也幫助了自己很多,比如用 code copilot 寫(xiě)代碼(涵蓋前后端開(kāi)發(fā),C,C++,Java,Go,Python 多開(kāi)發(fā)語(yǔ)言)的采納率有 30%,相當(dāng)于 100 行代碼有 30 行是AI寫(xiě)的,而且被采納。設(shè)計(jì)師設(shè)計(jì) logo 時(shí)也用 AI 文生圖來(lái)幫忙,每天千萬(wàn)級(jí)收入的廣告業(yè)務(wù)的一些素材,就 是用 AI 助手來(lái)做的。大模型對(duì)于降本增效起到很大助力。

張鵬:你剛提到,騰訊內(nèi)部接近 700多個(gè)產(chǎn)品在用混元大模型,算是混元的「內(nèi)部客戶(hù)」已經(jīng)有 700 家了,那你怎么服務(wù)得過(guò)來(lái)?同時(shí)還得兼顧不斷前進(jìn)的技術(shù)。

劉煜宏:內(nèi)部調(diào)用量大概將近 3 億次了。去年我們發(fā)布(節(jié)奏)慢,一部分原因也是我們投了很多資源先服務(wù)好內(nèi)部的「客戶(hù)」。騰訊做事情,對(duì)外開(kāi)放前一定要先在內(nèi)部打磨好,自己的狗糧自己先消化。

同時(shí),騰訊確實(shí)有最齊全的業(yè)務(wù)場(chǎng)景,辦公協(xié)作、游戲、社交、推廣搜等等。在這些豐富的場(chǎng)景中,也能練兵,也能練模型。精調(diào)、以及其他給產(chǎn)品的反饋,反過(guò)來(lái)又反哺到主模型里。比如,會(huì)議總結(jié)、function call 等。

對(duì)于內(nèi)部產(chǎn)品接入混元,我們提供三種模型來(lái)支持。

第一種叫全托管,給沒(méi)有那么強(qiáng)研發(fā)資源的團(tuán)隊(duì),他們提業(yè)務(wù)需求后,我們想辦法把模型精調(diào)好,他拿走直接用;

第二種叫半托管,有些業(yè)務(wù)有自己的研發(fā),也能做算法優(yōu)化,我們一起共建,一人一半,他們搞不定我們?cè)偕。最近兩年「開(kāi)源協(xié)同」在騰訊內(nèi)部很流行。

還有一種,我們把模型開(kāi)放后就不管了,剩下的業(yè)務(wù)如果有需要,自己加數(shù)據(jù)、自己調(diào)。

我們?nèi)ツ暌彩腔舜蟀肽辏褞讉(gè)模式跑通。我們提供一站式精調(diào)服務(wù),叫「混元一站式」,允許他們做各種創(chuàng)作、優(yōu)化,內(nèi)部根據(jù)需求調(diào)用資源,模型、算法、插件。

張鵬:三種模式占比如何?

劉煜宏:7 成左右拉 API 就可以了,啥都不用管。另外 3 成多少要精調(diào),這其中拿走模型完全自己精調(diào)的會(huì)比較少,因?yàn)橛虚T(mén)檻,我們一起參與的進(jìn)展會(huì)更快。

張鵬:70% 的業(yè)務(wù)直接調(diào)用混元API,30% 要精調(diào),哪些產(chǎn)品、業(yè)務(wù)要重點(diǎn)支持?這個(gè)選擇權(quán)到底在誰(shuí),或者看業(yè)務(wù)部門(mén)誰(shuí)更有影響力嗎?

劉煜宏:這時(shí)候我們會(huì)基于兩點(diǎn)考慮,一是復(fù)雜度,投入多少資源能幫你解決問(wèn)題;二是同等難度和投入的情況下,先考慮戰(zhàn)略重點(diǎn)。

資源配置上,其實(shí)主要看客觀需求。目前 70% 是 API 模式就能搞定,用的是大模型的通用能力。那就看什么場(chǎng)景用大模型的通用能力就可以解決,比如像娛樂(lè)場(chǎng)景這樣容錯(cuò)度高的場(chǎng)景,沒(méi)有強(qiáng)解決問(wèn)題的能力也行。但要做金融、醫(yī)療、法律等嚴(yán)肅場(chǎng)景,不能有幻覺(jué),通用 API 不一定搞得定,要專(zhuān)門(mén)精調(diào),為嚴(yán)肅場(chǎng)景做大量?jī)?yōu)化。

所以,第一是看用戶(hù)選擇。第二,這個(gè)數(shù)據(jù)在不同階段也會(huì)變。最開(kāi)始我們支持騰訊會(huì)議、騰訊文檔時(shí),擴(kuò)寫(xiě)、潤(rùn)色、總結(jié)能力都是需要定制的。一旦做好了,這個(gè)能力就能變成通用 API 能力,開(kāi)放出來(lái)給以后接入的業(yè)務(wù)用,這時(shí)候就不再需要定制了。比如給騰訊會(huì)議做好了,騰訊文檔、騰訊郵箱也有類(lèi)似的需求。

張鵬:把模型做好,這幾種模式跑順,服務(wù)好 700 家「內(nèi)部客戶(hù)」,是挺花時(shí)間的,所以你們?nèi)ツ瓴恢睂?duì)外說(shuō),是在忙著解決服務(wù)內(nèi)部的問(wèn)題。

劉煜宏:最開(kāi)始做混元,沒(méi)想要做 ToC 產(chǎn)品,是要把基礎(chǔ)模型打磨好,服務(wù)內(nèi)部需求,這是我們?cè)瓉?lái)的邏輯。

當(dāng)我們?cè)趦?nèi)部很多產(chǎn)品、不同場(chǎng)景里驗(yàn)證后,發(fā)現(xiàn)這個(gè)能力可以拿出來(lái)給大家用,所以去年 9 月份推出了「騰訊混元助手」小程序,因?yàn)橛X(jué)得在微信生態(tài)里也可以用。但后來(lái)發(fā)現(xiàn)這樣做也有不足,比如使用時(shí)被聊天打斷,沒(méi)法持續(xù)地對(duì)話,它就沒(méi)法成為一個(gè)好用的 AI 工具。于是推出了 App。

整個(gè)過(guò)程里,我們不斷地思考、調(diào)整方向。從做一個(gè)底層模型、一個(gè)基礎(chǔ)功能、平臺(tái)服務(wù)內(nèi)部業(yè)務(wù),到后來(lái)發(fā)現(xiàn),如果不探索原生AI大模型應(yīng)用,不知道怎么跟業(yè)務(wù)更好合作,所以又前進(jìn)了一步,從小程序,到 Web 產(chǎn)品,App 產(chǎn)品。

張鵬:市面上也有很多比較熱的大模型產(chǎn)品,主打陪伴類(lèi)等等,你們「元寶」做得比較簡(jiǎn)單,界面就一個(gè)框,當(dāng)時(shí)是怎么思考的?

元寶 App 第一屏界面|圖片來(lái)源:騰訊

劉煜宏:選擇現(xiàn)在這樣的界面,還是想回歸「用戶(hù)到底需要一個(gè)什么樣的AI產(chǎn)品」?

現(xiàn)在大模型的使用人群,學(xué)歷較高、職場(chǎng)人士占多,所以偏工作和學(xué)習(xí)的場(chǎng)景更重要,娛樂(lè)屬性也有,但重要性相對(duì)低。相應(yīng)地,我們的 slogan 也調(diào)整成,「輕松工作,多點(diǎn)生活」。不是不做娛樂(lè),也留了一些智能體在上面。我們也有開(kāi)放的平臺(tái)——元器,上面能做很多智能體,角色扮演、陪伴等等。

先選擇把生產(chǎn)力場(chǎng)景的用戶(hù)痛點(diǎn)用 AI 搞定,信息搜索、寫(xiě)文檔、想創(chuàng)意、知識(shí)獲取、閱讀等需求。比如搜索場(chǎng)景,我們先做好信息搜索、大模型「閱讀」順暢,又改善了信息源的陳列,提供了又簡(jiǎn)潔又分層次的信息源,提高生成內(nèi)容的可信度,規(guī)避大模型的幻覺(jué)。

后面圍繞著搜索、閱讀、寫(xiě)作、畫(huà)畫(huà)和創(chuàng)作等場(chǎng)景做好,這些被視為大模型的基礎(chǔ)能力。

我們做產(chǎn)品經(jīng)常說(shuō),做加法容易,做減法難。這是為什么我們一開(kāi)始就用很少的東西,用一個(gè) AI 搜索做,另外還有一個(gè)發(fā)現(xiàn)頁(yè)面,上面有些智能體,目前并不多。這也代表騰訊一個(gè)做產(chǎn)品的理念,小而精,做減法。先瞄準(zhǔn)能提升大家效率的、最有用的場(chǎng)景,把它做透。我們希望提升信息組織、以及信息被找到的效率。

張鵬:為什么不做娛樂(lè)產(chǎn)品?是產(chǎn)品取向選擇,做提升生產(chǎn)力更重要?還是從技術(shù)上來(lái)看,認(rèn)為做娛樂(lè)對(duì)于技術(shù)提升不重要?

劉煜宏:不是說(shuō)娛樂(lè)不重要,大家還是需要情感陪伴的。當(dāng)下先選擇工作和學(xué)習(xí)場(chǎng)景,第一個(gè)有選擇的原因。第二個(gè),當(dāng)我需要陪伴的時(shí)候,AI 能給到什么樣的幫助?角色扮演的產(chǎn)品有很多,但模型能力做不到那么好。打發(fā)時(shí)間,暫時(shí)只能做到這點(diǎn)。

張鵬:人們對(duì)「殺時(shí)間」的事包容度高,模型能力沒(méi)那么好也能沒(méi)準(zhǔn)讓用戶(hù)愿意掏錢(qián)。

劉煜宏:對(duì)。這是選擇問(wèn)題。我覺(jué)得選擇娛樂(lè)場(chǎng)景這個(gè)目標(biāo),對(duì)目前大模型的這個(gè)階段的發(fā)展不是很好。基于對(duì)自己的認(rèn)識(shí)和選擇,先把技術(shù)能做的做好。我們先把底層模型、基礎(chǔ)的產(chǎn)品體驗(yàn)、元寶體系做好了,在此之上開(kāi)放一些東西,就像微信,小程序,公眾號(hào),都是生態(tài)。那娛樂(lè)的事情就交給生態(tài)產(chǎn)品,QQ、游戲、視頻、音樂(lè),他們做娛樂(lè)場(chǎng)景比我們更擅長(zhǎng)。

張鵬:騰訊本身就是一個(gè)龐大的產(chǎn)品生態(tài),元寶未來(lái)會(huì)跟騰訊的產(chǎn)品體系打通嗎,比如微信?這方面有什么計(jì)劃?

劉煜宏:我們跟微信團(tuán)隊(duì)一直有互動(dòng)。比如元寶里用得好的東西想要分享到微信,或者在微信里傳個(gè)文件,能不能用元寶打開(kāi)?這些互動(dòng),我們有探討怎么做會(huì)更好。但因?yàn)槲⑿庞脩?hù)非常龐大,任何一點(diǎn)小改動(dòng),都可能影響上億人的體驗(yàn),所以也非常謹(jǐn)慎。

5 月 30 號(hào)元寶發(fā)布之后,外部解讀元寶和騰訊生態(tài)產(chǎn)品的打通,有點(diǎn)出乎意料。我們確實(shí)會(huì)考慮與騰訊生態(tài)如何互動(dòng),但畢竟元寶還是一個(gè)很小的產(chǎn)品,還在嘗試階段;另外,用戶(hù)需求真的是慢慢發(fā)展起來(lái),才會(huì)變成所謂的戰(zhàn)略,我們并沒(méi)有上帝視角,還是基于用戶(hù)的需求來(lái)考慮。

比如面對(duì)用戶(hù)搜索的需求,我們要做一個(gè)什么樣的信息檢索,搜哪里?那我們有搜一搜、新聞、視頻、音樂(lè)、企鵝號(hào),包括公眾號(hào)是一個(gè)很好的內(nèi)容源,這是一個(gè)順理成章、跟著用戶(hù)需求慢慢出來(lái)的事情。

我們也看到很多創(chuàng)作者來(lái)說(shuō),元寶 App 里加入公眾號(hào)的內(nèi)容源是一件非常好的事情,一些好的內(nèi)容都被遺忘了,元寶還能把它挖出來(lái),讓它重新火一把。

但我們有一些更長(zhǎng)期的目標(biāo),我們考慮的是,混元怎么支撐內(nèi)部業(yè)務(wù)、做到何種程度。

張鵬:看來(lái)騰訊對(duì)自己要求很高,就像你說(shuō)的,如果沒(méi)有吃過(guò)自己的狗糧,沒(méi)有真正用起來(lái),不太愿意讓別人為我付代價(jià)。但同時(shí),這會(huì)不會(huì)降低了對(duì)外開(kāi)放、快速迭代探索的可能性,讓更多力量一起「共創(chuàng)」本身不就是一種「技術(shù)紅利」嗎?

劉煜宏:確實(shí),讓更多人進(jìn)來(lái),用戶(hù)、開(kāi)發(fā)者、企業(yè)進(jìn)來(lái),一定會(huì)產(chǎn)生更多可能;煸环矫媸峭ㄟ^(guò)內(nèi)部比較全面的生態(tài)體系來(lái)打磨、創(chuàng)新。經(jīng)歷了內(nèi)部的一輪洗禮,外部的需求會(huì)更游刃有余。而且,任何一個(gè)東西,你拉長(zhǎng)看,現(xiàn)在的進(jìn)展可能會(huì)顯得微不足道的,假如外面是個(gè)大海洋,先在湖里面練好游泳再出去會(huì)做得更好。

同時(shí)我們也有混元 API 供外界用,其中混元 lite 的模型是直接可以免費(fèi)使用,還有元器開(kāi)發(fā)平臺(tái),上面已經(jīng)有很多開(kāi)發(fā)者做智能體,然后分發(fā)到元寶、QQ、小程序等渠道上面去用。

比如騰訊云的同事會(huì)基于做好的底層基礎(chǔ)模型,做行業(yè)大模型,針對(duì)企業(yè)做服務(wù)。這部分增長(zhǎng)非常迅猛,免費(fèi)模型的調(diào)用量、付費(fèi)版都增長(zhǎng)了很多,我們也要投很多資源來(lái)支持、優(yōu)化。

03 AGI 是信仰,眼下的目標(biāo)是讓模型多一些思考

張鵬:你怎么看 Character.ai,一個(gè)以前不存在的產(chǎn)品形態(tài)在未來(lái)的發(fā)展空間,以及對(duì)于技術(shù)的要求會(huì)是怎樣的?

劉煜宏:類(lèi)似角色扮演的需求,我們?cè)?ToB 的場(chǎng)景里也遇到了,比如類(lèi)似智能客服的接待助手。會(huì)告訴它「你是誰(shuí)」,但發(fā)現(xiàn)聊了幾十輪之后,它可能就忘了自己是誰(shuí)。

Character.ai 很火,我們做了很多用研,但最后選擇沒(méi)做類(lèi)似產(chǎn)品,因?yàn)榛煸是希望做一個(gè)技術(shù)平臺(tái),我們會(huì)往它所需要的底層能力去做,長(zhǎng)文本、長(zhǎng)窗口的能力、記憶能力等。

這些角色產(chǎn)品的探索可能更適合騰訊的產(chǎn)品團(tuán)隊(duì),他們來(lái)做會(huì)有更多想象空間。另外,從騰訊的角度看,也還是希望做底座能力和產(chǎn)品,把空間開(kāi)放給市場(chǎng)上更多創(chuàng)業(yè)公司。

張鵬:所以你目前看得不是產(chǎn)品,而是產(chǎn)品背后需要的能力和長(zhǎng)期有沒(méi)有意義。我可以理解為,混元的目標(biāo)是做好技術(shù)底座,為騰訊豐富的產(chǎn)品條件和用戶(hù)場(chǎng)景,做好AI Native 的準(zhǔn)備?

劉煜宏:一定程度說(shuō)可以這樣說(shuō)。但混元團(tuán)隊(duì)也沒(méi)走過(guò)大模型這條路,也要探索原生的應(yīng)用和創(chuàng)新。

就像剛提到的元器,我們做好底座,創(chuàng)作、工作流平臺(tái),業(yè)務(wù)部門(mén)和用戶(hù)拿來(lái)做智能體,實(shí)現(xiàn)各種各樣的想法,這是我們的定位。

我們做探索的同時(shí),把底座的技術(shù)能力打造好,這是有門(mén)檻和難度的。

張鵬:有人說(shuō)對(duì)國(guó)內(nèi)的大模型來(lái)說(shuō),GPT-4o 是「必答題」,Sora 是「選答題」,哪些在你們看來(lái)是技術(shù)趨勢(shì)上的必答題和選答題?

劉煜宏:GPT-4o 和 Sora 背后代表的多模態(tài)甚至全模態(tài),對(duì)我們來(lái)說(shuō)都是必答題,但一般沒(méi)做出來(lái)之前,也不會(huì)對(duì)外說(shuō)。

做與不做,可能只是一個(gè)特定資源條件下的選擇問(wèn)題。騰訊為什么必做?因?yàn)轵v訊業(yè)務(wù)場(chǎng)景齊全,社交、游戲、內(nèi)容,每個(gè)模態(tài)跟我們場(chǎng)景都有契合點(diǎn),不做的話,可能某個(gè)方面未來(lái)會(huì)缺。

一個(gè)東西將語(yǔ)音、文本、圖像、視頻都能搞定,全模態(tài)進(jìn),全模態(tài)出,需要一些時(shí)間和資源。也許每個(gè)階段會(huì)有不同重點(diǎn)。

張鵬:從混元的角度,你會(huì)怎么定義 AGI?

劉煜宏:目前 AGI 作為信仰比較合適。業(yè)界沒(méi)有一個(gè)對(duì) AGI 量化的定義,連定性都未必定的出來(lái)。可能從業(yè)務(wù)的角度,可以定義一個(gè)可以操作執(zhí)行的 AGI 目標(biāo)。

但我最近在思考,讓模型稍微多一些思考,這件事挺重要的,因?yàn)榭赡苌傻馁|(zhì)量會(huì)比過(guò)去高很多,我們接下來(lái)可能會(huì)花更多時(shí)間在這里。

ChatGPT 最早你問(wèn)他一個(gè)問(wèn)題,他馬上吐字回答問(wèn)題,有點(diǎn)像「快思考」或者說(shuō)沒(méi)有思考的直覺(jué)反應(yīng),但它可能怎么也想不出來(lái)一個(gè)空城計(jì)。

讓模型做AI搜索,或者其他讓它多加幾層思考、強(qiáng)迫他多做思考的動(dòng)作,有助于進(jìn)一步提高模型的推理能力。

7 月 1 日,「騰訊元寶」AI 搜索能力升級(jí),上線深度搜索模式,可從深度和廣度兩方面,提供更結(jié)構(gòu)化、更豐富的回答,并可同步生成內(nèi)容大綱、思維導(dǎo)圖及相關(guān)人物事件梳理。|來(lái)源:騰訊

張鵬:有沒(méi)有對(duì)需要達(dá)到的能力范疇的定義?

劉煜宏:過(guò)去幾年里有句話比較流行,有多少人工就有多少智能。以前智能是靠人堆起來(lái)的,人類(lèi)對(duì)齊有很多數(shù)據(jù)要標(biāo)注,甚至 OpenAI 也靠高質(zhì)量的標(biāo)注。坦白來(lái)講,目前要做到絕對(duì)的AGI 沒(méi)有那么樂(lè)觀。

務(wù)實(shí)一點(diǎn)看,針對(duì)騰訊內(nèi)部那么多的業(yè)務(wù),如果大模型能把他們的需求都搞定,那可以說(shuō)它具備了比較好的智能,這可能是通向 AGI 的最佳實(shí)踐,工具或技術(shù)從來(lái)都是滿足人的需求。

目前面對(duì)騰訊內(nèi)部接近 700 個(gè)業(yè)務(wù)的需求滿足情況,如果讓我打分,一部分場(chǎng)景合格,但是大部分坦率來(lái)講只是暫時(shí)夠用,要用得好,還有很多努力要做。在這個(gè)過(guò)程中探索 AGI,也可以算我們的一個(gè)實(shí)踐路徑。

當(dāng)然我們也有比較前沿的科學(xué)探索,騰訊 AI Lab 在做等等,要花點(diǎn)耐心,把應(yīng)用和研究結(jié)合起來(lái),一起做。

張鵬:想象一下混元在三年以后會(huì)什么樣?

劉煜宏:這個(gè)年代哪能定三年目標(biāo),因?yàn)榧夹g(shù)曲線仍然陡峭,邊走邊看。

要說(shuō)做產(chǎn)品,很像寫(xiě)小說(shuō),有的時(shí)候不是一開(kāi)始就想好結(jié)局。比如 Sora 出來(lái)之前,做文生視頻的肯定不會(huì)走那條路。GPT-4o 之前,大家覺(jué)得 4V 很牛了,變化太快了。

我們投了很多資源,做好長(zhǎng)期戰(zhàn)斗的準(zhǔn)備。讓我想,三年如何講做成功了,可能無(wú)非是 AI in all。

張鵬:不是一下投進(jìn)去,而是所有的東西都被AI逐漸滲透進(jìn)去。

劉煜宏:大模型要改造流程和產(chǎn)品。我希望不用到三年,騰訊產(chǎn)品和技術(shù)平臺(tái)都用大模型做了改造,讓大模型幫大家做降本增效的事情,這是我對(duì)未來(lái)的所想。

(免責(zé)聲明:此文內(nèi)容為廣告,相關(guān)素材由廣告主提供,廣告主對(duì)本廣告內(nèi)容的真實(shí)性負(fù)責(zé)。本網(wǎng)發(fā)布目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),請(qǐng)自行核實(shí)相關(guān)內(nèi)容。廣告內(nèi)容僅供讀者參考。)

(責(zé)任編輯:董萍萍 )

【免責(zé)聲明】【廣告】本文僅代表作者本人觀點(diǎn),與和訊網(wǎng)無(wú)關(guān)。和訊網(wǎng)站對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。郵箱:news_center@staff.hexun.com

看全文
寫(xiě)評(píng)論已有條評(píng)論跟帖用戶(hù)自律公約
提 交還可輸入500

最新評(píng)論

查看剩下100條評(píng)論

熱門(mén)閱讀

    和訊特稿

      推薦閱讀

        潞西市| 泰和县| 仁怀市| 微山县| 平遥县| 鄂伦春自治旗| 桃园县| 宁都县| 古田县| 环江| 宣汉县| 海淀区| 光山县| 新兴县| 河曲县| 浮梁县| 宁陕县| 郧西县| 宁明县| 桐柏县| 商丘市| 渝北区| 合水县| 海城市| 武强县| 平邑县| 巨鹿县| 布尔津县| 隆子县| 浠水县| 茂名市| 通化县| 莲花县| 孝感市| 遂平县| 沭阳县| 杂多县| 尼勒克县| 水富县| 德昌县| 嘉黎县|