對話小冰李笛、螞蟻徐鵬:大模型最大問題是“雷同”,API商業(yè)模式已落伍
時間:2023-09-09 13:53:23
智東西
【資料圖】
作者 | ZeR0
編輯 | 漠影
智東西9月7日報道,2023Inclusion·外灘大會今日開幕,在下午的“AI前沿技術(shù)發(fā)展與應(yīng)用的新浪潮”論壇期間,來自高校、科研單位、科技企業(yè)及投資機構(gòu)的學(xué)者專家們齊聚,分別從算法、算力、產(chǎn)業(yè)、應(yīng)用、場景等不同視角,探討生成式AI和大模型產(chǎn)業(yè)現(xiàn)存的挑戰(zhàn)與發(fā)展趨勢。
會后,螞蟻集團副總裁徐鵬與小冰公司CEO李笛接受智東西等媒體的采訪,就大模型及AIGC應(yīng)用同質(zhì)化問題、開源與閉源路線的選擇、數(shù)據(jù)及算力稀缺情況等焦點議題進行深入交流。
徐鵬在致辭中談道,當(dāng)前,AI大模型技術(shù)正高速迭代,新模型、新算法、新應(yīng)用、新場景正不斷涌現(xiàn),挑戰(zhàn)也隨之而來,比如算力能耗問題、中文公開數(shù)據(jù)集語料不足問題、大模型應(yīng)用安全問題,解決這些問題,需要產(chǎn)學(xué)研各界力量協(xié)同創(chuàng)新。技術(shù)的公平普惠性也要關(guān)注,無論是大型還是中小企業(yè),都能借助AI大模型技術(shù)提升企業(yè)智能化水平,為用戶帶來更好的服務(wù)和體驗。
一、大模型雷同問題嚴重,應(yīng)用創(chuàng)新才能實現(xiàn)大發(fā)展關(guān)于大模型同質(zhì)化問題,李笛和徐鵬都認為,從應(yīng)用入手,可以做出非常多不一樣的東西。
在論壇圓桌環(huán)節(jié),李笛談道,自己最大的憂慮是國內(nèi)大模型的多樣性,大家用同樣的數(shù)據(jù)集、同樣的訓(xùn)練方法、同樣的master,對比同樣的對象、類似的方法,多樣性確實有很大問題。“現(xiàn)在處于技術(shù)百花齊放的狀態(tài),應(yīng)該嘗試不同的東西,而不是馬上數(shù)理化外語卷起來了。”
“我覺得現(xiàn)在行業(yè)里面最大的問題其實就是「太雷同了」,大家都沿著同一條路徑在往前走,沒有多樣性,這和創(chuàng)新精神是違背的。”李笛認為,創(chuàng)新不是追趕,而是有自己新的方法,去實現(xiàn)自己的優(yōu)勢。他告訴智東西,大模型首先得追及格,再去嘗試多樣化、差異化,重復(fù)造輪子沒有必要,在應(yīng)用上才能實現(xiàn)大的發(fā)展。
徐鵬非常認可李笛的觀點,大家都是在追趕,首先要及格,及格后才有機會發(fā)展的更好,大模型技術(shù)上沒有本質(zhì)的差異,但側(cè)重點不一樣,像Llama是做一個通用的開源基礎(chǔ)模型,GPT本身是閉源的,主要是做ChatGPT對話能力,達到通用人工智能(AGI),在對齊方面要做的很好、上下文長度做的很長,每個既有雷同的地方,又有自己的特色。
他相信像這樣非常基礎(chǔ)的底層技術(shù),開源是未來。中國形成自己的大模型開源生態(tài),還需給一定的時間。開源模型給應(yīng)用創(chuàng)新帶來便利,不用從頭開始浪費大量的財力去訓(xùn)練基礎(chǔ)模型,如果大家都將力量放在應(yīng)用創(chuàng)新上,應(yīng)用生態(tài)更加繁榮,會反過來推動大模型技術(shù)的發(fā)展。
據(jù)他觀察,美國很多公司放棄走基礎(chǔ)模型這條路,直接在上面做能夠創(chuàng)造附加價值的應(yīng)用,而應(yīng)用多樣性才能給人類、給社會帶來價值。
徐鵬感覺,這一波大模型的能力,還不能做出來真正讓人人都能夠獲益的agent,但可能是可以真正往前推進的方向。至于爆款A(yù)IGC應(yīng)用,在他看來,這是可遇不可求的東西,即便如ChatGPT,也會有一定的審美疲勞,能夠持續(xù)增長的應(yīng)用非常少。
在李笛看來,開源模型生態(tài)過去已經(jīng)證明了非常旺盛的生命力,但大模型開源目前為止把整個戰(zhàn)場變得更加混亂。至于未來到底是閉源還是開源,取決于在行業(yè)中的角色定位,如果做大模型,肯定是閉源,如果是一家云計算公司,要兼容各種模型,開源和閉源都是好的生態(tài)。
二、建高質(zhì)量中文數(shù)據(jù)集是苦力活,英偉達GPU并非無可取代大模型不能解決所有的事情,需要組合更多技術(shù)、靠整個系統(tǒng)不停幫它彌補。李笛聯(lián)想到他最欽佩的一家公司任天堂,跟微軟和索尼相比,任天堂不是堆最先進的硬件,而是榨干1080P成熟技術(shù)的最后一點能力,這很重要。
他認為,數(shù)據(jù)并不是問題,中文語料如果做了好好清洗,還是可以的。把語料真正挖清楚,清洗得足夠好,篩選得足夠好,這是苦力活。徐鵬補充說,這個苦力活,誰都逃不開,但是中文本身數(shù)據(jù)的量級應(yīng)該是夠的。
除了需要更多高質(zhì)量數(shù)據(jù),算力也永遠緊缺。
李笛說,算力消耗合不合理,取決于商業(yè)模式效果,比如游戲NPC,拿很多算力陪人聊天,游戲掙得錢都被NPC聊沒了,算力再多也不合理;如果消耗的算力被用于通過生成式AI得到高附加值的收益,算力消耗則是合理的。
根據(jù)徐鵬今日的演講內(nèi)容,螞蟻基礎(chǔ)語言大模型采用Transformer架構(gòu),使用英偉達GPU、螞蟻自研的模型架構(gòu)、高效訓(xùn)練和推理引擎。
作為AI訓(xùn)練芯片的首選,英偉達GPU是當(dāng)前生成式AI算力紅利的大贏家。但徐鵬并不認為英偉達GPU具有非常強的不可替代性,他告訴智東西,這更多是個效率問題,因為英偉達發(fā)展的最快、有很強的軟件優(yōu)勢、用它的產(chǎn)品效率最高,開箱可用。
應(yīng)用方采購硬件,有兩個因素影響決策買哪些硬件、買多少因素:一是性價比高不高,二是能不能買到。其他公司并不是說沒有機會,只是現(xiàn)在還不及英偉達那么成熟,除了硬件本身能力外,還需努力追趕英偉達的軟件銜接能力。
李笛相信,恰恰因為大模型太貴了,大家很快會走到一條好的道路上,因為不可能燒錢燒很久,他相信很快就會有變化。
三、從技術(shù)信仰轉(zhuǎn)向產(chǎn)品驗證,AIGC亟待探索全新商業(yè)模式“很高興看到整個行業(yè)開始進入到了從技術(shù)的信仰到產(chǎn)品的驗證狀態(tài),在未來一年里面的時間,大部分的產(chǎn)品應(yīng)用會進入到證偽階段。”李笛在發(fā)表演講時談道,生成式AI創(chuàng)造的價值與技術(shù)所對應(yīng)的公司實際獲得的價值之間存在巨大的鴻溝,這是他看到的當(dāng)前商業(yè)模式最大問題,無論是To C還是To B都應(yīng)考慮這一問題。
在他看來,目前為止在全球范圍內(nèi),沒有一個成功的AI To C的產(chǎn)品,也沒有To B的產(chǎn)品。
過去API調(diào)用的商業(yè)模式,很大的問題是直接把技術(shù)的特點輸出了,相當(dāng)于把科學(xué)家手頭工作直接懟到客戶面前,中間缺少產(chǎn)品化的階段,也就沒有體現(xiàn)出生成式AI的創(chuàng)造力價值。
很多人已經(jīng)開始探索新的AIGC商業(yè)模式。小冰積極嘗試Revenue Share的方式,以高附加值作為價值回報的考量依據(jù),李笛認為,大模型創(chuàng)造了一個高附加值的一次交互或一次調(diào)用,比期待算力成本下降更加有效,用最貴的GPU、最好的技術(shù)都是合理的。
以小冰通過合作幫助動漫工作室打造的生成作品為例,如果按照傳統(tǒng)商業(yè)模式,游戲廠商總計一次性技術(shù)開發(fā)收費為幾十萬人民幣,而通過Revenue Share的新方式,3分鐘《人和狗》短片上架,小冰獲得了15萬美元的回報。此外,小冰和網(wǎng)易合作推出了一個新的平臺,每一個AI歌手都享有全部生命周期里全部收益的比例,這樣的方法才有可能使得真正獲得創(chuàng)造力價值。
結(jié)語:中國已經(jīng)有好的高原,接下來一定會產(chǎn)生自己的高峰李笛強調(diào)說,技術(shù)發(fā)展不是一飛沖天的,都是進入波峰,很多人有創(chuàng)新,又卡住了,突然不知是誰解決了行業(yè)難題,大家一起又繼續(xù)前進。
面對持久的大模型熱潮,徐鵬建議要冷靜看到它長期能帶來什么樣的價值、它的能力邊界在什么地方,而不是盲目地做太多不切實際的幻想。但又不能離開幻想,因為有幻想才有動力,才有更多的人愿意去做一些看上去不靠譜的事情。
他希望有一定機制去支持有人長期在這個方向做進一步地投入,然后找到核心應(yīng)用場景,找到它真正能夠帶來變化的東西,有了這些,就可以反哺AI技術(shù)的發(fā)展。
這與清華大學(xué)計算機科學(xué)與技術(shù)系副教授劉知遠的觀點不謀而合。劉知遠在今日的圓桌論壇期間談道,為什么ChatGPT被美國做出來了,中國做不出來?結(jié)論是“中國有高原、沒高峰”,最原始創(chuàng)新的工作目前仍缺少相應(yīng)穩(wěn)定支持的機制,但無論怎樣,一切還是在向好的方向發(fā)展。
現(xiàn)在百模大戰(zhàn)有一些內(nèi)卷的傾向,但他相信隨著內(nèi)卷不斷進行,會變成大家開始尋找差異化的過程,“我們有了這么一個非常好的高原,接下來一定會產(chǎn)生自己的高峰。”劉知遠說。
相關(guān)稿件
對話小冰李笛、螞蟻徐鵬:大模型最大問題是“雷同”,API商業(yè)模式已落伍
路人鏡頭下的章小蕙,穿牛仔變五五分肚子還大,但60歲長得像30
認房不認貸后?哪些人涌進了北京“最忙”不動產(chǎn)登記中心|特寫
石英股份:9月8日融券賣出5.06萬股,融資融券余額10.89億元
“救火英雄”、航天人、全科醫(yī)生……這些不平凡的閔行故事暖心人!
扎根母嬰行業(yè)17年,擁有“三駕馬車”的健瑞兒正在加速狂飆
世界上最坑的5個景點,九寨溝上榜,網(wǎng)友:這是沒來過九寨溝吧?
福建艦核心戰(zhàn)力,不是殲35,老將改裝上馬,搭載鷹擊21更兇猛
收起你的緊身裙吧!今年最流行的是“背帶裙”,不挑年齡不挑身材
假面騎士:檀黎斗演員巖永徹也發(fā)生活照,黃色衣服長發(fā)蝦餃真的好看
泉州率先推出“清單+分類處置”措施 可盤活利用新舊海岸線間土地5萬畝
次世代PC游戲?知名游戲總監(jiān)自爆未對《星空》進行優(yōu)化
騰訊助力襄陽打造全國首個“智能網(wǎng)聯(lián)+智慧交管”全域融合應(yīng)用城市
筠誠和瑞過會:今年IPO過關(guān)第232家 中金公司過13.5單
激光投影之戰(zhàn)落下帷幕!ALPD5.0超級全色激光真的無人能比
拓寬舉報獎勵渠道和發(fā)放方式 山東修訂生態(tài)環(huán)境違法行為舉報獎勵規(guī)定