中國大模型的應用層突破,為何注定從搜尋引擎開始?

2023-10-19 19:01:45 字數 3761 閱讀 7245

沒有人能預見未來,但我們可以因循常識,去捕捉技術創新演進的節奏韻腳。毋論大模型本身,還是基於大模型的應用突破,捕捉它們的演進趨勢,存在乙個放諸海內外皆準的認知框架:「需求-供給」這一最樸素的經濟學原理。也就是說,ai大模型在應用層的最終突破,一定將指向兩個問題:1.最廣泛的需求在**;2.更優質的供給在**。基於對這兩個問題的逐層抽絲剝繭,我們可以得到這樣乙個答案:中國ai大模型的應用層突破,注定從搜尋引擎開始。

科技領域有兩大著名的經驗規律,乙個是為人熟知的摩爾定律,另乙個是相對冷門但十分重要的安迪-比爾定律(andyandbill'slaw,andygives,billtakesaway)。安迪-比爾定律表達的是:提高的硬體效能很快又會被軟體消耗掉。正是因為這個特性,科技進步帶來的優質供給會被需求持續吸收,形成供需相互促進的雙螺旋迴圈,而非惡性的過剩。ai大模型已經進化到需求側的「尋找比爾」階段。大模型到底該怎麼落地到應用?什麼領域可以率先看到爆發?

我們認為,大模型由於極高的智慧型化屬性和極強的廣泛嵌入性,它可以被用作乙個非常優質的效率工具、智慧型夥伴。基於此,大模型在c端的定位理解,就從 「替代」變成了「賦能」「助理」。如何尋找ai大模型應用場景,也就是尋找真實可靠的需求,成了打通行業的任督二脈的關鍵。

回頭看過去30年的網際網絡革命,也遵循同樣的發展軌跡,比如人們的衣食住行的需求被網際網絡實現了顛覆式的優化,但衣食住行這個底層需求並未改變。對於面向未來的大模型同樣如此,拋開api、maas 等不同模式的優劣分歧不談,當務之急是需要找到確定的底層需求,然後探索大模型對底層需求的優化路徑。

聚焦到需求側,各領域智慧型化公升級的節奏顯然將是參差的:

通用性的需求,由於資料密度高、市場空間大、剛性強,是最先可能將被突破的。比如搜尋引擎、行政辦公、創意設計等。

垂直類領域,由於資料孤島、專業性較強、私域封閉,通用的ai大模型可賦能進行公升級改造的空間較小。

更進一步,從第一性原理出發,基於對「最廣泛的需求在**」這一底層問題的審讀,我們可以得到這樣乙個答案:中國ai大模型的應用層突破從搜尋引擎開始。大語言模型,2023年已經全面邁入百億、千億引數規模階段,其已經具備優秀的上下文學習能力、可觀的知識容量、優秀的泛化性和複雜推理能力,簡單來說,就是機器學會了用自然語言進行聆聽和表達。作為賦能的效率工具,大語言模型已經具備切實可行的落地能力。在需求側,無論生活還是工作,人們對於提公升日常行為效率,最大規模、最普惠大眾的數位化與智慧型化應用場景當屬搜尋。從古代的《四庫全書》到如今的搜尋引擎,我們愈發認識到搜尋是資訊時代的通用性剛需。上一次搜尋的革命工具為網際網絡,而ai時代的到來,將促進搜尋的第二次重大革命。

網際網絡解決了搜尋資訊豐度的問題,而ai內容生成與搜尋場景有天然的契合度。大模型與搜尋的結合,會產生以下效果:

搜尋+ai在理解力、準確度和個性化上都有明顯優化,能大幅降低處理資訊複雜度、提公升使用者體驗。展開來講,搜尋+ai能夠很好去除傳統搜尋引擎大量同質化和片面化的低資訊熵內容,過濾資訊噪音,在搜尋準確度上更高;同時ai賦予搜尋更強的自我學習能力,能夠持續優化輸出結果,更好貼合使用者使用習慣,更具個性化。

對於這樣的圖景,集團副總裁、搜尋平台負責人肖陽給出了明確指引:大語言模型(生成式ai)並沒有威脅到搜尋,而是讓搜尋更強了。搜尋與大模型的結合,像倚天劍、屠龍刀雙劍合璧,為使用者提供更大價值。一言以蔽之,搜尋一直是世界上規模最大的ai應用場景和成功的商業模式。我們苦苦尋找的需求場景就在手邊。在海外英文搜尋領域,我們已經看到這樣的趨勢得到驗證。微軟的發布基嵌入ai大模型的new bing,增加了「問答式搜尋」功能,問答機械人可以與使用者聊天、協助撰寫文字、彙總全網資訊,其後app的日均**量增長了超過800%,遠超同期谷歌搜尋的表現;截止到5月,使用者在new bing上已累計完成5億次對話,當前日活已經超過1億人次。不難發現,優質供給在廣泛需求上落地後,產生的效果是立竿見影的。

在我們看來,隨著ai+搜尋的供需商業模式跑通,具有大模型能力+搜尋業務的龍頭玩家,將引領這一次代際變革的潮流。ai+搜尋供需商業模式,需要玩家同時在兩個領域均能夠給出優質的供給,以及將優質的供給無縫對接給廣泛的需求,難度遠超api類的嫁接式做法。放眼中國整個tmt賽道,具備這樣比較優勢能力的目前只有。

1)搜尋與ai均具有極高技術壁壘,搜尋的ai+ 搜尋技術基座最為完善。搜尋是乙個看似簡單,但實際壁壘極高的生意,因為它需要滿足使用者的極致需求。搜尋引擎使用者遷移的成本極低,但格局卻十分固定,正是因為滿足使用者極致需求這個事很難、投入又很大,資料的壁壘又很高。在過去的二十多年裡,的搜尋框仍然是那個簡簡單單的搜尋框,但背後的技術投入和沉澱,非一日之功。作為離搜尋最近的專業人士之一,肖陽對此有著深刻的見解:搜尋有乙個特點,它的馬太效應,擁有使用者的、技術的、資料的、算力的公司,往往它的效果會越來越好,其實大模型也有這個特點,你跑在前面會跑得越來越快,從這個角度來看世界上,一共就4個國家有搜尋引擎,都沒有被後來者顛覆過。另外如我們所知,集團多年all in ai已經形成強大的綜合能力:

在模型層,是我國最早開放邀測知識增強大語言模型產品的企業,文心一言大模型已經構建了 「基礎+任務+行業」**模型,具備強大的通用性。

在算力層,算力基礎設施均由智算中心支援,崑崙芯二代已廣泛應用在文心大模型。

在平台層,飛槳paddle是其自主研發的深度學習平台,文心大模型通過飛槳平台,實現模型訓練、推理部署和場景應用。

合抱之木,生於毫末,九層之台,起於壘土。鮮明的ai+搜尋技術優勢,意味著大模型應用層更優質的供給注定是在搜尋領域。

2)引領搜尋的下一代變革,有硬核技術,也更懂使用者需求。未來**將如何引領搜尋的下一代變革,我們可以從現在長期主義式的使用者需求戰略中管中窺豹。

引領搜尋的下一代變革,發力點仍然是從使用者出發,做好需求端適配。我們不妨再從使用者側推演,作為使用者,我們希望搜尋引擎扮演什麼樣的角色呢?

一位勤奮的全能學者?搜尋引擎通過閱讀、理解、推理和總結海量的知識,充分理解使用者的需求,並對資訊進行整理和加工,讓更多、更復雜的問題在第一條搜尋結果中就得到全面滿足。

一位值得信賴的貼心朋友?使用者可以像與朋友聊天一樣與搜尋引擎對話。它能夠聽懂你的任何問題,並且你可以完全用語音進行互動。它將幫助你標記答案中的重點,提供權威的**,並且可以呼叫各種工具和服務。

一位工作中的得力助手?能幫助使用者處理個性化的任務,如輸出研究報告、提供旅行嚮導、創作應用文案、生成**等。

對於極致滿足而言,在當前搜尋每天已有的問答需求中,首條滿足的比例已達到70%,半年前這個比例只有40%,開年以來,搜尋日均新增問答需求超過3000萬次,搜尋+ai的技術飛輪已經開始越轉越快。

使用者自然是希望新一代的搜尋引擎能夠滿足多重場景化需求。這有沒有可能做到?給出的答案是「ai夥伴」。在使用者表達上,「ai夥伴」可以實現智慧型對話、多輪互動,降低了使用者的輸入表達門檻和成本,ai夥伴將大大拓展搜尋的外延。

目前,ai夥伴雖然還處在內測時期,但我們有理由對其抱有更多期待。今年的6月7日高考首日。搜尋正在內測的「ai夥伴」現場挑戰高考語文考試,包括作文、微寫作、古詩詞賞析、文言文翻譯、閱讀填空等題型。一篇文言文作文甚至「迷惑」了資深語文老師,誤以為是真人所寫,給了很高的評價,認為水平都超過95%的同學。以上,奇點已經降臨,ai大模型引領的經濟新周期變革正在徐徐展開,中國大模型的應用層突破,注定即將從搜尋引擎開始。這既是大模型時代中國在ai原生應用領域彎道超車的機會,也將是每個個體通往新周期所須搭乘的那輛時代列車。

文/知勇

編輯/陸佳

本文刊載於《中外企業文化》2023年8期

中國大模型語料資料聯盟開源發布“書生 萬卷”多模態語料

繼今年7月在2023世界人工智慧大會發起成立 中國大模型語料資料聯盟 以下簡稱 語料資料聯盟 上海人工智慧實驗室 上海ai實驗室 8月14日宣布,聯合語料資料聯盟成員單位共同開源發布 書生 萬卷 1.0多模態預訓練語料。澎湃新聞 www.the cn 記者從上海市經信委獲悉,書生 萬卷 1.0目前包...

資料庫應用層資料加密儲存解決方案

一 什麼是資料庫應用層加密?資料庫應用層加密是一種加密方法,指在應用系統處理資料前,對資料進行加密操作,然後再將加密後的資料傳遞給資料庫進行儲存。這種方法可以有效保護資料在傳輸過程中的安全性,防止資料洩露。應用層加密的原理是在應用系統中使用加密函式或呼叫加密元件,對敏感資料進行加密處理。具體流程是在...

中國大學邏輯學專業的排名 為何這些學校成為前三?

在中國大學中,邏輯學專業的排名一直備受關注。眾所周知,邏輯學是一門重要的學科,它可以培養學生的思維能力 觀察力和判斷力,對於學生的綜合素質提高具有重要意義。那麼,在眾多的高校中,哪些學校在邏輯學專業方面脫穎而出呢?首先,位居中國大學邏輯學排名第一的是北京大學。作為中國頂尖的綜合性大學之一,北京大學一...