11月16日,阿里巴巴集團(tuán)發(fā)布2024財(cái)年第二季度業(yè)績(jī)公告。阿里巴巴集團(tuán)CEO吳泳銘表示,阿里巴巴將保持創(chuàng)業(yè)心態(tài),重點(diǎn)強(qiáng)調(diào)“用戶為先、AI驅(qū)動(dòng)”的戰(zhàn)略重心。隨著Open AI發(fā)布GPTs,大模型的“場(chǎng)景爭(zhēng)奪戰(zhàn)”進(jìn)入白熱化階段。中文大模型方面,無(wú)論是互聯(lián)網(wǎng)公司還是硬件廠商紛紛下場(chǎng)。阿里作為布局較早的國(guó)內(nèi)廠商之一,明確要抓住AI科技變革帶來(lái)的全新機(jī)會(huì),以創(chuàng)造更多客戶價(jià)值。
在本次財(cái)報(bào)中,作為近幾年持續(xù)增長(zhǎng)的潛力選手,夸克符合各項(xiàng)遴選標(biāo)準(zhǔn),入選第一批戰(zhàn)略級(jí)創(chuàng)新業(yè)務(wù),并與“AI驅(qū)動(dòng)”戰(zhàn)略緊密相連。近日,夸克正式發(fā)布了基于Transformer架構(gòu)的多模態(tài)自研大模型,參數(shù)達(dá)到千億級(jí),一經(jīng)發(fā)布就占據(jù)了C-Eval與CMMLU兩大權(quán)威榜單的榜首,并在社會(huì)科學(xué)等多個(gè)知識(shí)領(lǐng)域排名第一。這無(wú)疑是為阿里的AI戰(zhàn)略及其在2024財(cái)年的增長(zhǎng)信心,再添上了一道炬火。
從技術(shù)底座到用戶驅(qū)動(dòng),中文大模型來(lái)到“深水區(qū)”
夸克大模型的能力與基因優(yōu)勢(shì)主要來(lái)自于三個(gè)方面。首先,以搜索場(chǎng)景作為主體,通過(guò)信息檢索、數(shù)字資產(chǎn)、存儲(chǔ)等服務(wù)立足于“準(zhǔn)國(guó)民級(jí)應(yīng)用”之列,夸克在過(guò)去三年中呈現(xiàn)出了持續(xù)向上的市場(chǎng)表現(xiàn)。尤其是在當(dāng)下AI的主要受眾與消費(fèi)者——年輕人群體中,從口碑到用戶粘性都位于市場(chǎng)前列。可以說(shuō),大模型浪潮如今在中國(guó)最重要的推動(dòng)群體,正是夸克的核心優(yōu)勢(shì)區(qū)。根據(jù)QuestMobile發(fā)布的《2023年輕人群智能效率應(yīng)用研究》報(bào)告顯示,夸克App在泛學(xué)生人群和新生代職場(chǎng)人群的用戶占比最高,年輕用戶使用時(shí)長(zhǎng)位列行業(yè)第一。另一方面,當(dāng)下資本與開(kāi)發(fā)者對(duì)于生成式AI的共識(shí)是:它正在經(jīng)歷一個(gè)從技術(shù)驅(qū)動(dòng)向用戶群體驅(qū)動(dòng)轉(zhuǎn)變的過(guò)程。這也就代表著,數(shù)據(jù)的“質(zhì)”正在悄然平衡著AI對(duì)于數(shù)據(jù)量的過(guò)度崇拜。一是優(yōu)質(zhì)的用戶群與數(shù)據(jù),二則是延展性足夠強(qiáng)的場(chǎng)景。未來(lái),夸克大模型將主要應(yīng)用于通用搜索、醫(yī)療健康、教育、辦公等效率場(chǎng)景,這些場(chǎng)景的用戶行為數(shù)據(jù)也與搜索請(qǐng)求密切相關(guān)。在年輕人用戶群密度足夠大的情況下,夸克大模型的應(yīng)用層再造也呈現(xiàn)出了知識(shí)信息更加專業(yè)、有效的差異化優(yōu)勢(shì)。其次,依靠夸克自身的產(chǎn)品創(chuàng)新與技術(shù)能力,夸克在“AI時(shí)代”快速跨越了新生代階段,其產(chǎn)品爆發(fā)期與大模型爆發(fā)期幾乎無(wú)縫銜接,因此,業(yè)務(wù)升級(jí)與重構(gòu)的難度相對(duì)也會(huì)低很多。第三,夸克大模型之所以沒(méi)有在大模型嘗鮮期急于追逐風(fēng)口,是因?yàn)榭淇俗鳛橐粋€(gè)高度產(chǎn)品化的業(yè)務(wù),需要為用戶解決更加實(shí)際、具體、高頻的問(wèn)題。出于增強(qiáng)效率體驗(yàn)而非接入AI原生化的目的,夸克在這一技術(shù)相對(duì)成熟的階段推出大模型,避免了前期的輿論質(zhì)疑與用戶流失,入局時(shí)間更加合適。
阿里AI戰(zhàn)略下的信息服務(wù)“創(chuàng)新者”
相對(duì)獨(dú)立開(kāi)發(fā)商,大廠自研大模型的研發(fā)與訓(xùn)練具有低成本、高處理量、長(zhǎng)期投入、數(shù)據(jù)量可持續(xù)的特點(diǎn),場(chǎng)景定位與用戶群體也更加精準(zhǔn)。而從整個(gè)生成式AI的發(fā)展路徑來(lái)看,搜索引擎作為實(shí)現(xiàn)AI“入口業(yè)務(wù)價(jià)值”的直接解決方案,自必應(yīng)與OpenAI深度綁定以來(lái),就成為了大廠的“必爭(zhēng)之地”。聚焦到阿里的主要業(yè)務(wù)陣地,電商和信息效率無(wú)疑是其中最重要的兩個(gè)入口級(jí)業(yè)務(wù)線。之于后者,不難得出結(jié)論,本身就擁有效率產(chǎn)品矩陣及爆品的夸克,最適合在未來(lái)大模型插件化的趨勢(shì)下,成為阿里針對(duì)C端用戶的王牌“效率”戰(zhàn)艦。為了實(shí)現(xiàn)全棧自研的技術(shù)路線,夸克搭建了數(shù)百人規(guī)模的獨(dú)立產(chǎn)研團(tuán)隊(duì),每天會(huì)對(duì)億級(jí)的圖文數(shù)據(jù)進(jìn)行訓(xùn)練和精調(diào),這也使得它在大模型權(quán)威評(píng)測(cè)榜單CMMLU和C-Eval中分別獲得第一名的好成績(jī)。C-Eval是由清華大學(xué)、上海交通大學(xué)、愛(ài)丁堡大學(xué)合作構(gòu)建的綜合性考試評(píng)測(cè)集,覆蓋52個(gè)學(xué)科;CMMLU是由MBZUAI、上海交通大學(xué)、微軟亞洲研究院推出的專門(mén)用于評(píng)估語(yǔ)言模型在中文語(yǔ)境下綜合能力的榜單。評(píng)測(cè)數(shù)據(jù)顯示,中文語(yǔ)境下,夸克大模型的整體水平已經(jīng)超過(guò)了GPT-3.5,在寫(xiě)作、考試等部分場(chǎng)景也已經(jīng)超過(guò)了GPT-4的表現(xiàn)。從技術(shù)來(lái)看,夸克大模型在數(shù)據(jù)增強(qiáng)、模型選擇、訓(xùn)練策略、模型融合以及模型評(píng)估上,都表現(xiàn)不俗。比起傳統(tǒng)的知識(shí)數(shù)據(jù)庫(kù),大模型的價(jià)值在于以可交互的方式為人類整合與判斷信息的千變?nèi)f化。因此,從C-Eval、CMMLU等權(quán)威榜單的評(píng)判維度也可以得見(jiàn),目前無(wú)論是對(duì)于GPT還是正在“圈地”的中文大模型,垂類知識(shí)處理能力和專業(yè)級(jí)語(yǔ)言創(chuàng)作能力已經(jīng)變得越來(lái)越重要。
比如,在中文寫(xiě)作上,夸克擁有廣泛的知識(shí)覆蓋、上下文理解、創(chuàng)造性表達(dá)能力,能夠基于各類文本類型進(jìn)行時(shí)效性創(chuàng)作。另一方面,AI能夠模擬的不僅是人類的學(xué)習(xí)能力,還有人類期許的高階推理、專業(yè)辨?zhèn)巍⑻嵝У淖晕因?qū)動(dòng)力。這也是夸克大模型在信息服務(wù)領(lǐng)域中,最擅長(zhǎng)且正在逐步融入產(chǎn)品中的領(lǐng)域之一。今年以來(lái),大模型已經(jīng)陸續(xù)升級(jí)夸克的智能工具產(chǎn)品,夸克掃描王在復(fù)雜場(chǎng)景下掃描的更清晰、夸克網(wǎng)盤(pán)的自然語(yǔ)言搜索功能進(jìn)一步提升了找資產(chǎn)的效率,都很好地印證了這一點(diǎn)。盡管GPT已經(jīng)火了近一年,不少?gòu)S商的大模型卻仍然沒(méi)有廣泛地應(yīng)用于各行各業(yè)的降本增效,而是走向了下游開(kāi)發(fā)者和封閉生態(tài)。可以看出,自建生態(tài)對(duì)于AI的意義,連OpenAI都“真香”了。而如今中文大模型競(jìng)爭(zhēng)的殘酷,本身不在于層出不窮的同質(zhì)化體驗(yàn),而是關(guān)于時(shí)間差的無(wú)效內(nèi)卷。廠商一邊野蠻入場(chǎng),另一邊卻因?yàn)榘扬灝?huà)得太大,反而消磨了大眾的想象力。只有清醒地看到自身的能力邊界,才能更好地利用AI去擴(kuò)張生態(tài)價(jià)值。中文世界,需要的不再是像十年前一樣追趕時(shí)間差,而是進(jìn)擊關(guān)鍵而精準(zhǔn)的多模態(tài)效率,不讓用戶的預(yù)期落空。阿里新CEO上任后,明確提出了對(duì)符合用戶需求和AI驅(qū)動(dòng)變革趨勢(shì)的業(yè)務(wù),將作為第一優(yōu)先級(jí)重點(diǎn)投入;對(duì)于面向未來(lái)的革新型產(chǎn)品,將秉持長(zhǎng)期主義堅(jiān)決投資,為阿里培育面向未來(lái)的新業(yè)務(wù)與新動(dòng)能。普通用戶的生活,也就代表著對(duì)于人工智能更高的信賴和更低的容錯(cuò)空間。正是因?yàn)槠胀ㄈ藳](méi)有那么高的專業(yè)判斷能力,作為國(guó)民級(jí)應(yīng)用廠商,才更需要兼顧前沿技術(shù)的體驗(yàn)性與信息傳達(dá)的簡(jiǎn)便性,讓知識(shí)的門(mén)檻逐步降低。作為從“小而美”邁向“準(zhǔn)國(guó)民應(yīng)用”的信息服務(wù)市場(chǎng)增量新星,夸克或許會(huì)在阿里百花齊放的大模型時(shí)代下,承擔(dān)起用戶體驗(yàn)層面的重?fù)?dān)。
