大模型創(chuàng)業(yè)路上 小團隊試水數(shù)字人細分方向

2023-05-03 19:07:42

在ChatGPT橫空出世后, 人工智能技術(shù)來到了下一個十年的拐點,最為興奮的是創(chuàng)業(yè)者,生成式AI的巨大潛力,讓他們獲得了挑戰(zhàn)中國互聯(lián)網(wǎng)舊秩序的機會。


(資料圖)

大語言模型創(chuàng)業(yè)潮之下,令人矚目的是王小川、王慧文等資深互聯(lián)網(wǎng)從業(yè)者先后高調(diào)入局,但投身到大模型創(chuàng)業(yè)當中更多的是開發(fā)者,并且已經(jīng)落到了具體的應用場景上。

目前這些創(chuàng)業(yè)項目都在早期,還未有一個確定的商業(yè)模式,距離實現(xiàn)理想效果也仍有距離。小團隊能否找到合適的大模型創(chuàng)業(yè)之路?

小團隊試水數(shù)字人創(chuàng)業(yè)

在《鋼鐵俠》里,AI管家賈維斯(JARVIS)讓人印象深刻,作為一個超智能軟件,他能獨立思考,可以幫助鋼鐵俠處理事務(wù),計算各種信息,還能自主將自己轉(zhuǎn)移到任意一個數(shù)碼終端,全面管控鋼鐵俠的生活。

這是郭澤斌一開始就想對標的數(shù)字人助理,借助大模型語料生成,采集人類的情緒、肢體動作等數(shù)據(jù),他希望模仿人類心理去做一個有情緒的數(shù)字人。

在這之前,郭澤斌創(chuàng)業(yè)已有十多年,一直帶團隊做開發(fā),在2022年他開始對數(shù)字虛擬人感興趣,逐步做了一些嘗試。因為合伙人里有一位資深的心理咨詢師,在做有情緒的數(shù)字人方面,團隊有天然的優(yōu)勢。

"我們認為,所有人的表現(xiàn),包括說的話、情緒、肢體動作,都是受到一定的刺激做出響應,我們就基于這個模型,去采集他人的一些數(shù)據(jù)進行訓練,做出人類一樣的響應。"郭澤斌介紹,這樣的數(shù)據(jù)模型會涉及心理學范疇,做出的數(shù)字人也會更人性化。

但距離實現(xiàn)賈維斯這樣的AI助理,技術(shù)上還有很長的路要走,郭澤斌的團隊規(guī)劃了幾個階段,第一階段希望先做一個可以直播的數(shù)字人,能夠先行變現(xiàn),再一步一步往下做。但在2022年五月推出直播數(shù)字人后,郭澤斌發(fā)現(xiàn)試驗的效果不及預期,在各大平臺上線后都沒有流量,他猜測平臺或許對數(shù)字化的主播有所限制。

在沒有實現(xiàn)理想的商業(yè)化場景后,團隊索性將數(shù)字人項目開源,后續(xù)不斷有人關(guān)注并加入項目。郭澤斌團隊重振旗鼓,結(jié)合開源社區(qū)的力量,更專注地去做數(shù)字人助理的方向。

林奇的數(shù)字社工項目同樣來源于一個契機。在上海疫情封控期間,他加入小區(qū)的志愿者團隊,在當時特殊的情況下人手不夠,他利用自身開發(fā)者的優(yōu)勢,為分發(fā)食物設(shè)計了一個程序,服務(wù)幾個小區(qū)的志愿者隊伍,提高效率。

疫情結(jié)束后,這個項目被上海靜安區(qū)臨汾路街道辦的負責人發(fā)現(xiàn),街道辦找到林奇,希望可以合作推進一個數(shù)字社工的項目。

按現(xiàn)行法律,居委會并不屬于政府組織,其工作人員并非公務(wù)員,而是"社工",但現(xiàn)實中,正是這些"社工"承擔著每一名居民的基層治理事務(wù),居委會長期以來的治理能力不足問題在疫情期間被充分暴露。

以上海為例,街道/鎮(zhèn)下屬的居委會由5-9人組成,但需要對接3500~5000名居民,平均每人對接400-500人,其日常工作多達119項。相對于上海,外地的基層政府(鄉(xiāng)、鎮(zhèn))以及其所管轄的居委會(村委會)人少事多的情況更加嚴重。

"疫情這個場景不在了,但是基層效益的問題是一直都有的,2023年政府這邊也在都在提倡減負增能,而今年人工智能技術(shù)又發(fā)展到了一個新范式,在這個階段也創(chuàng)造了更多的機會。"對于林奇團隊來說,這個數(shù)字社工的項目是天時地利人和。

林奇團隊現(xiàn)階段交付的產(chǎn)品主要包括兩個功能模塊,一個是業(yè)務(wù)知識"外腦",以及另一個業(yè)務(wù)知識培訓,后者旨在提升社工工作能力,前者可以大大提高基層政府對居民的服務(wù)效率。目前這個數(shù)字社工的產(chǎn)品已在上海市靜安區(qū)臨汾路街道、嘉定區(qū)安亭鎮(zhèn)落地。

林奇表示,目前項目仍是和臨汾路街道、安亭鎮(zhèn)一起試點探索的階段,"他們出場景,我們從技術(shù)去打磨,基于國內(nèi)開源的大模型,加上團隊的一些技術(shù)去做架構(gòu)改變、工程完善,面向政務(wù)領(lǐng)域打造一套完全合規(guī)的、甚至至少是在這個專有領(lǐng)域一定程度可以媲美OpenAI的智能系統(tǒng)。"他提到,現(xiàn)在開源的大模型很多屬于學術(shù)性質(zhì),并不能直接用于生產(chǎn),還需基于模型做很多完善和調(diào)教工作。

數(shù)字社工的模型參數(shù)量在百兆到百億之間,和ChatGPT相比并不算很大規(guī)模,但也并不小。"短期內(nèi)客觀看,通用性上各方面我們不太可能超越OpenAI。但我們只是追求在特定場景下能夠達到它一定的水平,我們的優(yōu)勢是滿足數(shù)據(jù)安全的要求。"林奇認為。

作為一個小型創(chuàng)業(yè)團隊,林奇認為現(xiàn)在還沒有面臨壓力,"目前用大模型賦能基層政務(wù)是一個新開辟的賽道,大家都是從今年開始入場,盲人摸象,都在自己的一塊小的領(lǐng)域去摸索,所以還沒有打到一起。"

但在政務(wù)這個大場景,林奇認為未來肯定會有競爭的壓力,沒有大廠會放過,創(chuàng)業(yè)公司也有不少,但團隊的壓力不一定來自大廠,畢竟在這個方向和賽道上,大家都是同時起跑。

天使投資人、資深人工智能專家郭濤對第一財經(jīng)表示,過去幾年,引領(lǐng)虛擬數(shù)字人發(fā)展的多模態(tài)融合交互技術(shù)、AI深度的場景理解技術(shù)等關(guān)鍵核心技術(shù)不成熟,虛擬數(shù)字人落地應用和商業(yè)化變現(xiàn)的步伐都較慢。如今,借助AI大模型和AIGC等技術(shù),將為數(shù)字人構(gòu)建一個有"靈魂"的頭腦,虛擬數(shù)字人發(fā)展有望全面提速。

人才、技術(shù)挑戰(zhàn)不小

對于目前入場的創(chuàng)業(yè)團隊來說,摸索還處于早期,商業(yè)化路徑仍然模糊,同時小型創(chuàng)業(yè)團隊也面臨人才、技術(shù)等方面的挑戰(zhàn)。

林奇團隊目前給項目設(shè)想的盈利模式是訂閱制,相當于給服務(wù)單位派駐一個數(shù)字社工,像勞務(wù)公司按月收費,"但包括團隊也沒有完全正式的商業(yè)化運作,現(xiàn)在都在探索階段,所以整個的商業(yè)模式還在打造。"

林奇表示,未來如果大規(guī)模展開項目,仍然還需要融資,本質(zhì)上這是一個技術(shù)研發(fā)的商業(yè)項目,前期還需要大量的投入,包括產(chǎn)品、算法的開發(fā)等等,雖然初期不存在現(xiàn)金流問題,但如果將目前團隊成員的工作量和時間去換算,項目收入也支撐不了最基礎(chǔ)的人力成本。

郭澤斌同樣對第一財經(jīng)表示,目前團隊還沒有跑通一個商業(yè)模式,"每天都會有一些項目方找過來,比如在商超里加一個數(shù)字導購、做兒童玩具等等,但這些場景利用目前的開源項目就已經(jīng)可以解決問題,我們更多是以個人開發(fā)者的形式進行對接,就給了一個建議,處在為愛發(fā)電的階段。"

據(jù)郭澤斌的觀察,周圍目前并沒有一個成功的AIGC商業(yè)模式落地,能賺錢的更多是提供工具,或者提供培訓、開放平臺。

"AIGC仍然處于一個比較早期的階段,現(xiàn)在大家同步上線的東西也挺多,但是差異化很少,實際出來達到應用層面的東西也不多,更多是覺得這個產(chǎn)品形態(tài)很炫很好玩,"郭澤斌認為,"目前領(lǐng)域內(nèi)還是屬于娛樂玩票性質(zhì)強于商業(yè)現(xiàn)實落地的一個情況。"

之所以沒跑通商業(yè)模式,郭澤斌認為,面臨的問題更多的是理想的技術(shù)還沒實現(xiàn),例如,如果要實現(xiàn)賈維斯這樣數(shù)字人管家,可以隨時交互,并且是唯一為一人服務(wù)的,在技術(shù)上生成的速度還需要更快,"尤其是在助理這個情景,聊天重如果等十來秒再給你回應,感覺就不太智能,而這還只是簡單的一句話生成,如果要處理幾個邏輯分支速度會更慢,時間還要疊加。"

在目前這個階段,林奇面臨最大問題是人手,"兩頭都很旺盛,供給端不斷有新的東西出來,需要去學習,另一端不斷有客戶的需求提出來,但是中間轉(zhuǎn)化的過程受制于目前有限的人手供給,這是一個非常嚴重的問題。"林奇提到,無論是算法還是后端工程,都很缺成員,但是合適的人不太容易找,人才很少,同時有一定工程經(jīng)驗、能夠開發(fā)的就更少了。

林奇認為,目前還沒有到正式的商業(yè)化階段,還是產(chǎn)品轉(zhuǎn)化期,對于自己這樣的小型團隊來說,未來如果進行商業(yè)化運作還會有更多的難題,包括資本、推廣、技術(shù)開發(fā)等都會有不少的坎。

作為業(yè)內(nèi)專家,郭濤對AI大模型賦能的數(shù)字人行業(yè)持樂觀的看法,他向第一財經(jīng)表示,基于AI大模型細分場景訓練的虛擬數(shù)字人,訓練數(shù)據(jù)更加聚焦,算法模型能力更強,在細分場景中虛擬數(shù)字人的專業(yè)性更強,能力表現(xiàn)也更加突出。隨著AI大模型、AIGC等相關(guān)AI新技術(shù)的發(fā)展,虛擬數(shù)字人將更加智能化、擬人化,推動虛擬數(shù)字人在客戶服務(wù)、虛擬主播、傳媒娛樂、電商直播等領(lǐng)域快速落地。

"未來,隨著虛擬數(shù)字人相關(guān)技術(shù)的成熟、產(chǎn)業(yè)鏈布局日益完善和政策扶持與資金支持力度的持續(xù)加強,虛擬數(shù)字行業(yè)將迎來發(fā)展的黃金時期,并有望形成千億級市場規(guī)模。"郭濤表示。

(文章來源:第一財經(jīng))

標簽:

關(guān)閉
新聞速遞