經(jīng)濟(jì)新常態(tài)下,如何對海量數(shù)據(jù)進(jìn)行分析挖掘以支撐敏捷決策、適應(yīng)市場的快速變化,正成為企業(yè)數(shù)字化轉(zhuǎn)型的關(guān)鍵。機(jī)器學(xué)習(xí)算法能識(shí)別數(shù)據(jù)模型,基于規(guī)律完成學(xué)習(xí)、推理和決策,正廣泛的應(yīng)用在金融、消費(fèi)品與零售、制造業(yè)、能源業(yè)、政府與公共服務(wù)等行業(yè)的各種業(yè)務(wù)場景中,如精準(zhǔn)營銷、智能風(fēng)控、產(chǎn)品研發(fā)、設(shè)備監(jiān)管、智能排產(chǎn)、流程優(yōu)化等。企業(yè)傳統(tǒng)的機(jī)器學(xué)習(xí)雖然能有效支撐業(yè)務(wù)決策,但由于嚴(yán)重依賴數(shù)據(jù)科學(xué)家,其技術(shù)門檻高、建模周期長的特點(diǎn)正成為企業(yè)實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的阻礙。數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)是指覆蓋數(shù)據(jù)采集、數(shù)據(jù)探索、數(shù)據(jù)處理、特征工程、模型構(gòu)建、模型訓(xùn)練、模型部署與發(fā)布、模型管理與運(yùn)營等建模全流程的平臺(tái),提供一站式建模服務(wù),能顯著提升建模效率、降低建模門檻。數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)能支持并賦能企業(yè)各業(yè)務(wù)場景實(shí)現(xiàn)智能決策,幫助企業(yè)打造數(shù)據(jù)驅(qū)動(dòng)型組織。本報(bào)告對數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)市場進(jìn)行重點(diǎn)研究,面向金融、消費(fèi)品與零售、制造與能源、政府與公共服務(wù)等行業(yè)企業(yè),以及人工智能軟件與服務(wù)提供商的數(shù)據(jù)部門、業(yè)務(wù)部門負(fù)責(zé)人,通過對業(yè)務(wù)場景的需求定義和代表廠商的能力評(píng)估,為企業(yè)數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)的建設(shè)規(guī)劃、廠商選型提供參考。本次入選報(bào)告的廠商需同時(shí)符合以下條件:
廠商的產(chǎn)品服務(wù)滿足市場分析的廠商能力要求;
近一年廠商具備一定數(shù)量以上的付費(fèi)客戶(參考第3章市場分析部分);
近一年廠商在特定市場的收入達(dá)到指標(biāo)要求(參考第3章市場分析部分)。
1. 2023年數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)市場規(guī)模達(dá)到55億元
圖1:2022-2026年數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)市場規(guī)模
據(jù)愛分析推測,2022年數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)市場規(guī)模為41億元,2023年將達(dá)到55億元,同比增長35%。未來愛分析測算2026年數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)市場規(guī)模將達(dá)到154億元,2022-2026四年CAGR為40%。未來幾年,數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)市場的快速增長主要受AI大模型驅(qū)動(dòng)。ChatGPT的爆火推升了企業(yè)對生成式大模型的認(rèn)知,也提高了企業(yè)對AI解決方案的預(yù)算投入,數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)模型作為AI解決方案的基礎(chǔ)設(shè)施建設(shè),將與AI解決方案一起保持高速增長。目前,數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)市場在金融、電信、互聯(lián)網(wǎng)等行業(yè)滲透率最高;大中型企業(yè)正加速平臺(tái)落地。分行業(yè)來看,受數(shù)據(jù)體量和質(zhì)量水平影響,數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)在金融、電信、互聯(lián)網(wǎng)等行業(yè)滲透程度較高。大型企業(yè)均已通過采購或自建的方式搭建起數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái),中型企業(yè)也在加速部署落地。其次是政府機(jī)構(gòu),數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)在省級(jí)部門單位的滲透率逐漸提升。此外,數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)在零售、新能源、工業(yè)、醫(yī)療等行業(yè)的滲透率較低,其中大型企業(yè)尚處于引入、籌備階段。從企業(yè)規(guī)模來看,大中型企業(yè)的業(yè)務(wù)線條復(fù)雜、潛在AI應(yīng)用場景數(shù)量可觀,且自身技術(shù)人員儲(chǔ)備充足,從長遠(yuǎn)來看,使自身具備AI建模能力是更持久、性價(jià)比也更高的方式,因此待數(shù)據(jù)條件成熟后大中型企業(yè)更傾向引入數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái);小型企業(yè)業(yè)務(wù)簡單,技術(shù)人員有限,更傾向直接從算法商店直接購買成熟的AI算法部署實(shí)施,實(shí)現(xiàn)AI應(yīng)用的快速驗(yàn)證,后續(xù)AI應(yīng)用場景增多或是采購的算法不支持個(gè)性化業(yè)務(wù)場景時(shí),才會(huì)考慮采購數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)。2. 大模型將升級(jí)平臺(tái)使用體驗(yàn),成為廠商差異化競爭關(guān)鍵
AI大模型熱潮激發(fā)大模型與千行百業(yè)的結(jié)合,大模型與數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)的融合已明確成為數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)的進(jìn)化新方向。數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)廠商在功能上區(qū)別不明顯,平臺(tái)使用體驗(yàn)成為差異化關(guān)鍵,大模型與數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)的融合能有效改善平臺(tái)使用體驗(yàn),將成為廠商獲取未來競爭優(yōu)勢的發(fā)力點(diǎn)。據(jù)愛分析調(diào)研,廠商對大模型與機(jī)器學(xué)習(xí)平臺(tái)的融合實(shí)踐路徑主要基于以下三種形式展開:
圖2:大模型與數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)融合形式
通過預(yù)訓(xùn)練大模型進(jìn)行智能標(biāo)注,如應(yīng)用CV大模型對圖片、語義進(jìn)行智能標(biāo)注,高效生成訓(xùn)練數(shù)據(jù)。
用大模型對業(yè)務(wù)創(chuàng)新思路進(jìn)行快速初步驗(yàn)證。大模型的通用性使得它能快速給出結(jié)果,用戶可先通過大模型驗(yàn)證業(yè)務(wù)思路后,再使用數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)開發(fā)訓(xùn)練小模型以保證模型效果和穩(wěn)定性。
通過大模型實(shí)現(xiàn)建模全流程智能化。既有的低代碼建模仍需要人工拖拉拽進(jìn)行配置,過程中也需要對算子細(xì)節(jié)進(jìn)行設(shè)置,人工操作不可避免,而自動(dòng)化建模方式下,缺少數(shù)據(jù)科學(xué)家的專業(yè)性,只能適用于分類、回歸等簡單的場景。大模型建模的理想愿景是實(shí)現(xiàn)用戶通過自然語言與大模型互動(dòng),大模型可自動(dòng)化完成數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、模型部署全流程。在這個(gè)過程中,大模型會(huì)為用戶提供數(shù)據(jù)科學(xué)家級(jí)別的專業(yè)引導(dǎo)。這一方式的落地難度系數(shù)極高,需完成包括不限于完成從自然語言(NLP)到數(shù)據(jù)處理(SQL)的轉(zhuǎn)化、數(shù)據(jù)的圖形化、建立模型訓(xùn)練知識(shí)庫等過程。
圖3:人通過自然語言與大模型互動(dòng)智能完成建模全流程
目前,前兩種形式已經(jīng)落地實(shí)現(xiàn),第三種形式還處于研發(fā)階段。3. 數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)廠商應(yīng)滿足企業(yè)信創(chuàng)需求信創(chuàng)國產(chǎn)化已經(jīng)成為國家發(fā)展的重要戰(zhàn)略之一。隨著信創(chuàng)產(chǎn)業(yè)的發(fā)展,以金融、政府為代表的領(lǐng)域正沿著從基礎(chǔ)設(shè)施到支撐平臺(tái)再到企業(yè)應(yīng)用的思路進(jìn)行國產(chǎn)化替換,目前,大中型企業(yè)及機(jī)構(gòu)在基礎(chǔ)設(shè)施端的國產(chǎn)替換完成度較高,包括芯片、服務(wù)器、操作系統(tǒng)、數(shù)據(jù)庫、中間件等。數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)支撐數(shù)據(jù)資產(chǎn)價(jià)值變現(xiàn)的關(guān)鍵環(huán)節(jié),且與以上基礎(chǔ)軟硬件關(guān)系緊密,需要適應(yīng)企業(yè)國產(chǎn)化環(huán)境。這要求技術(shù)廠商盡快完成平臺(tái)軟件與國產(chǎn)化軟硬件環(huán)境的兼容、適配及認(rèn)證,保證平臺(tái)能在國產(chǎn)CPU、AI加速芯片以及操作系統(tǒng)上穩(wěn)定運(yùn)行。圖4:數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)的國產(chǎn)化適配要求
愛分析對本次數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)項(xiàng)目的市場分析如下。同時(shí),針對參與此次報(bào)告的部分代表廠商,愛分析撰寫了廠商能力評(píng)估。數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)
數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)是指覆蓋數(shù)據(jù)采集、數(shù)據(jù)探索、數(shù)據(jù)處理、特征工程、模型構(gòu)建、模型訓(xùn)練、模型部署與發(fā)布、模型管理與運(yùn)營等建模全流程的平臺(tái),提供一站式建模服務(wù),能顯著提升建模效率、降低建模門檻。大模型開發(fā)平臺(tái)也屬于數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)的范疇。
金融、消費(fèi)品與零售、制造與能源、政府與公共服務(wù)等行業(yè)企業(yè),以及人工智能軟件與服務(wù)提供商的數(shù)據(jù)科學(xué)家、風(fēng)控建模人員、營銷建模人員、業(yè)務(wù)分析人員、模型應(yīng)用人員。企業(yè)對機(jī)器學(xué)習(xí)的應(yīng)用越來越廣泛。一方面,數(shù)據(jù)量的激增、算法的突破以及CPU、GPU、DPU等多種算力技術(shù)的發(fā)展,為以機(jī)器學(xué)習(xí)為基礎(chǔ)的數(shù)據(jù)挖掘、計(jì)算機(jī)視覺、自然語言處理、生物特征識(shí)別等技術(shù)在企業(yè)的應(yīng)用奠定了技術(shù)基礎(chǔ);另一方面,市場環(huán)境的快速變化對企業(yè)決策敏捷性要求增強(qiáng),不僅推動(dòng)企業(yè)將機(jī)器學(xué)習(xí)模型應(yīng)用到營銷、廣告、風(fēng)控、生產(chǎn)等更多業(yè)務(wù)場景,也對模型精度、模型開發(fā)敏捷性以及模型應(yīng)用廣度提出更高要求。然而,機(jī)器學(xué)習(xí)技術(shù)門檻高、建模周期長,難以滿足企業(yè)通過基于機(jī)器學(xué)習(xí)模型提升經(jīng)營效率的需求。數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)具備工具豐富集成、建模效率提升以及模型資產(chǎn)復(fù)用等特點(diǎn),能充分滿足企業(yè)對智能應(yīng)用的需求,正成為企業(yè)智能化基礎(chǔ)設(shè)施的必要構(gòu)成。不同企業(yè)對數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)的需求不同,其差異取決于企業(yè)自身機(jī)器學(xué)習(xí)建模能力和對算法的需求。1. 對于金融、消費(fèi)品與零售、制造與能源、政府與公共服務(wù)等行業(yè)企業(yè)除大型金融機(jī)構(gòu)外,傳統(tǒng)企業(yè)普遍不具備機(jī)器學(xué)習(xí)建模能力。大型金融機(jī)構(gòu)數(shù)據(jù)科學(xué)團(tuán)隊(duì)人才完善,對機(jī)器學(xué)習(xí)算法的探索和應(yīng)用更前沿,如將機(jī)器學(xué)習(xí)模型應(yīng)用在精準(zhǔn)營銷、智能風(fēng)控、產(chǎn)品研發(fā)、客戶體驗(yàn)管理等多個(gè)場景中。但更多的傳統(tǒng)企業(yè)面臨IT人才缺失、尚未開始智能化應(yīng)用或處于局部試驗(yàn)的初期階段。傳統(tǒng)企業(yè)對數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)的需求主要體現(xiàn)在以下五個(gè)方面:圖5:傳統(tǒng)企業(yè)對數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)的需求
1)降低機(jī)器學(xué)習(xí)建模門檻,使非專業(yè)建模人員也能掌握機(jī)器學(xué)習(xí)建模技術(shù),賦能業(yè)務(wù)。傳統(tǒng)機(jī)器學(xué)習(xí)建模技術(shù)門檻高,需要組建專門的數(shù)據(jù)科學(xué)團(tuán)隊(duì),包括數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家、開發(fā)工程師等,人力成本高昂。傳統(tǒng)企業(yè)希望能降低機(jī)器學(xué)習(xí)建模門檻,如平臺(tái)能實(shí)現(xiàn)數(shù)據(jù)自動(dòng)處理、自動(dòng)特征工程、圖形化建模或自動(dòng)建模等功能,使非專業(yè)的業(yè)務(wù)人員也能快速開展建模工作,廣泛賦能業(yè)務(wù),實(shí)現(xiàn)普惠AI。2)提供定制化算法、模型部署和運(yùn)營服務(wù),快速創(chuàng)造業(yè)務(wù)價(jià)值。傳統(tǒng)行業(yè)多具備行業(yè)特性,行業(yè)垂直場景下的模型開發(fā)耗時(shí)耗力,而且傳統(tǒng)企業(yè)對AI智能應(yīng)用的探索尚處于初期,更傾向“小步快跑”,因此購買定制化算法能節(jié)約人力、實(shí)現(xiàn)快速產(chǎn)出以及驗(yàn)證AI智能應(yīng)用效果。企業(yè)需要廠商提供定制化算法服務(wù)、模型在硬件平臺(tái)和操作系統(tǒng)平臺(tái)的部署服務(wù)以及模型運(yùn)營服務(wù)。3)縮短建模周期,提高業(yè)務(wù)敏捷響應(yīng)度。以金融行業(yè)為例,金融企業(yè)的產(chǎn)品、服務(wù)、風(fēng)控模型均需隨著客戶行為改變而持續(xù)迭代更新。但傳統(tǒng)的機(jī)器學(xué)習(xí)建模周期長達(dá)數(shù)月,無法敏捷響應(yīng)業(yè)務(wù)需求。企業(yè)需要數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)內(nèi)置豐富的行業(yè)算法、模型模板、案例等,供建模人員直接調(diào)用,加速模型訓(xùn)練;或是提供一鍵部署功能,實(shí)現(xiàn)模型在生產(chǎn)環(huán)境的快速部署。4)提供咨詢服務(wù),提升模型質(zhì)量。對于具備一定機(jī)器學(xué)習(xí)建模能力的金融機(jī)構(gòu),需要廠商提供建模咨詢支持,協(xié)助企業(yè)完成數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、模型部署等環(huán)節(jié),提升模型質(zhì)量。5)支持國產(chǎn)化適配。以金融、政府、電信為代表的行業(yè),其底層軟硬件基礎(chǔ)設(shè)施已經(jīng)基本實(shí)現(xiàn)國產(chǎn)化,廠商需支持平臺(tái)對國產(chǎn)軟硬件的兼容、適配。對于中小企業(yè)或是剛開始試點(diǎn)智能應(yīng)用的企業(yè),相較于數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)需要的組織、人才、流程上的變革與支持,采購適用于特定場景的AI智能應(yīng)用是性價(jià)比更高、更迅捷的解決方案。人工智能軟件與服務(wù)商如算法服務(wù)商、ISV即面向此類需求,提供模型和智能應(yīng)用服務(wù)。以算法服務(wù)商為例,盡管具備專業(yè)的數(shù)據(jù)科學(xué)團(tuán)隊(duì),但中小型企業(yè)的算法需求多樣且個(gè)性化,如雖然都是AI視覺算法,智慧城市、智慧工業(yè)下的應(yīng)用場景如安全帽識(shí)別、產(chǎn)品瑕疵識(shí)別的模型卻截然不同,需要基于業(yè)務(wù)數(shù)據(jù)集、業(yè)務(wù)思路分別進(jìn)行訓(xùn)練。這使得算法服務(wù)商常常面臨嚴(yán)格的算法交付周期和算法精度要求。具體而言,人工智能軟件與服務(wù)提供商對數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)的核心需求主要體現(xiàn)在以下四個(gè)方面:圖6:人工智能軟件與服務(wù)提供商對數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)的需求
1)提高機(jī)器學(xué)習(xí)建模效率。軟件開發(fā)公司、算法提供商面臨嚴(yán)格的交付周期,但在傳統(tǒng)AI應(yīng)用開發(fā)方式下,數(shù)據(jù)接入、數(shù)據(jù)處理、模型訓(xùn)練等一系列建模流程都需要人工操作,建模周期長。其中數(shù)據(jù)接入環(huán)節(jié)因開源算法工具對不同類型的數(shù)據(jù)兼容性較差,需人工將原始數(shù)據(jù)轉(zhuǎn)化為開源算法所支持的數(shù)據(jù)類型;數(shù)據(jù)標(biāo)注環(huán)節(jié)往往通過人工完成,并且部分領(lǐng)域的標(biāo)注過程嚴(yán)重依賴專業(yè)知識(shí),整體數(shù)據(jù)準(zhǔn)備將耗費(fèi)數(shù)周時(shí)間;模型部署中對模型的集成、監(jiān)控和更新需要大量的調(diào)研和實(shí)施工作,單個(gè)模型部署到上線需要3-5個(gè)月。企業(yè)需要完善的數(shù)據(jù)科學(xué)工具和建模功能,支持實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)準(zhǔn)備、特征工程、模型訓(xùn)練、模型部署等建模全流程,提高建模效率。2)滿足數(shù)據(jù)科學(xué)家復(fù)雜場景建模需求。平臺(tái)需支持?jǐn)?shù)據(jù)科學(xué)家在復(fù)雜場景下進(jìn)行靈活建模,如提供豐富的算法,預(yù)置主流機(jī)器學(xué)習(xí)框架,支持NoteBook建模方式,以及支持?jǐn)?shù)據(jù)科學(xué)家在模型訓(xùn)練中手動(dòng)調(diào)參等。3)對模型開發(fā)資源和計(jì)算資源進(jìn)行統(tǒng)一管理,支持計(jì)算資源彈性擴(kuò)容,加速建模計(jì)算性能。傳統(tǒng)開發(fā)模式中重復(fù)建設(shè)嚴(yán)重,如各項(xiàng)目數(shù)據(jù)準(zhǔn)備、特征工程、模型訓(xùn)練等各自研發(fā),造成模型開發(fā)管理資源、計(jì)算資源浪費(fèi),難以適應(yīng)大規(guī)模智能應(yīng)用開發(fā)需求。另外,機(jī)器學(xué)習(xí)模型訓(xùn)練過程中耗費(fèi)大量計(jì)算資源,而一旦結(jié)束訓(xùn)練,計(jì)算資源又處于閑置狀態(tài)。企業(yè)需要實(shí)現(xiàn)計(jì)算資源彈性擴(kuò)容,滿足模型開發(fā)不同階段的計(jì)算需求。4)為多角色的數(shù)據(jù)科學(xué)團(tuán)隊(duì)提供協(xié)作平臺(tái)。機(jī)器學(xué)習(xí)建模過程需要數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師等多角色共同協(xié)作完成,存在反復(fù)溝通、協(xié)作流程不明確等問題,帶來重復(fù)性工作。為滿足金融、消費(fèi)品與零售、制造與能源、政府與公共服務(wù)等行業(yè)企業(yè),以及人工智能軟件與服務(wù)提供商等甲方客戶的核心需求,廠商需具備以下能力:1. 廠商應(yīng)具備完善的機(jī)器學(xué)習(xí)模型開發(fā)功能,提供包括數(shù)據(jù)采集、數(shù)據(jù)準(zhǔn)備、特征工程、模型訓(xùn)練、模型部署等功能在內(nèi)的一站式端到端數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)。1)數(shù)據(jù)采集方面,平臺(tái)應(yīng)具備整合多源異構(gòu)數(shù)據(jù)的能力,支持實(shí)時(shí)接入結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)(如表格、圖片、時(shí)間序列數(shù)據(jù)、語音和文本等),并具備基本的ETL能力、數(shù)據(jù)實(shí)時(shí)更新和同步能力。2)數(shù)據(jù)準(zhǔn)備方面,平臺(tái)應(yīng)提供豐富的數(shù)據(jù)清洗、數(shù)據(jù)探索工具。其中數(shù)據(jù)清洗環(huán)節(jié),應(yīng)能支持進(jìn)行數(shù)據(jù)融合、數(shù)據(jù)缺失處理、數(shù)據(jù)分類、數(shù)據(jù)標(biāo)注、數(shù)據(jù)異常處理、數(shù)據(jù)平滑以及整合非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)等數(shù)據(jù)清洗工作,減少人工干預(yù)。數(shù)據(jù)探索環(huán)節(jié),廠商需具備單變量和多變量統(tǒng)計(jì)、聚類分析、地理定位圖、相似度度量等分析能力。3)模型訓(xùn)練環(huán)節(jié),針對非專業(yè)建模人員,平臺(tái)應(yīng)提供簡便易用的建模工具,降低機(jī)器學(xué)習(xí)建模門檻。如平臺(tái)可通過建模全流程可視化降低用戶使用門檻,尤其在模型構(gòu)建環(huán)節(jié),應(yīng)支持以拖拉拽的方式完成建模。針對專業(yè)建模人員,平臺(tái)應(yīng)具備較高的靈活性和開放性,提供主流開源算法和建模工具。如為專業(yè)的數(shù)據(jù)科學(xué)家提供自由靈活的NoteBook建模方式,并預(yù)置主流機(jī)器學(xué)習(xí)框架R、TensorFlow、Pytorch、Spark等,以及豐富的機(jī)器學(xué)習(xí)算法。4)模型部署環(huán)節(jié),平臺(tái)應(yīng)支持模型一鍵部署,使建模人員可快速將模型從開發(fā)環(huán)境部署到生產(chǎn)環(huán)境中,并提供API接口供業(yè)務(wù)人員調(diào)用。此外,平臺(tái)還應(yīng)提供模型版本管理和模型監(jiān)控功能,實(shí)時(shí)監(jiān)測模型性能,保證模型質(zhì)量。5)資源管理方面,平臺(tái)需能對CPU、GPU資源進(jìn)行管理和整合,以容器化方式對算力虛擬化,實(shí)現(xiàn)彈性擴(kuò)容、性能加速等功能,且不同部門和項(xiàng)目之間可共享集群資源。6)平臺(tái)應(yīng)具備AutoML能力,包括提供數(shù)據(jù)自動(dòng)清洗、智能標(biāo)注、自動(dòng)特征工程和自動(dòng)模型訓(xùn)練等功能,提高建模效率。其中特征工程環(huán)節(jié),數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)應(yīng)能實(shí)現(xiàn)自動(dòng)化特征構(gòu)建、特征選擇、特征降維和特征編碼;模型訓(xùn)練環(huán)節(jié),平臺(tái)應(yīng)支持自動(dòng)化模型選擇、自動(dòng)化調(diào)參、自動(dòng)化超參數(shù)搜索、模型自動(dòng)驗(yàn)證等,減少模型訓(xùn)練時(shí)間成本和人力成本。7)此外,平臺(tái)還應(yīng)支持多角色的數(shù)據(jù)科學(xué)團(tuán)隊(duì)協(xié)作,協(xié)同數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家、業(yè)務(wù)人員等不同角色在建模工作流程中的模型注解、討論、答疑、評(píng)論等,使建模過程可追溯、模型可復(fù)用,減少重復(fù)性工作。2. 廠商需具備垂直行業(yè)Know-how能力,為企業(yè)提供咨詢和實(shí)施部署服務(wù)。廠商的專業(yè)服務(wù)能力體現(xiàn)在三個(gè)方面:一方面,基于豐富的垂直行業(yè)知識(shí)和經(jīng)驗(yàn)積累,廠商能為用戶提供行業(yè)場景相關(guān)的算法、模型模板,或是將行業(yè)經(jīng)驗(yàn)與模型算法相結(jié)合,形成諸如精準(zhǔn)營銷、智能推薦、反欺詐、設(shè)備預(yù)警等智能業(yè)務(wù)模型,供用戶直接調(diào)用;另一方面,廠商能提供建模咨詢服務(wù),通過數(shù)據(jù)科學(xué)專家團(tuán)隊(duì)規(guī)劃有效的模型應(yīng)用到特定業(yè)務(wù)的運(yùn)營方案,協(xié)助用戶完成數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、模型部署、模型運(yùn)營等工作,以及將企業(yè)既有的數(shù)據(jù)集經(jīng)驗(yàn)、特征工程經(jīng)驗(yàn)、模型經(jīng)驗(yàn)等提煉形成數(shù)字資產(chǎn),內(nèi)嵌到平臺(tái)中。此外,廠商應(yīng)具備較強(qiáng)的實(shí)施部署能力,包括提供定制化模型算法在硬件平臺(tái)和操作系統(tǒng)平臺(tái)的部署服務(wù)、以及數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)的部署服務(wù)。3. 廠商需支持?jǐn)?shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)與國產(chǎn)化軟硬件生態(tài)體系適配。如在服務(wù)器方面,應(yīng)支持華為、曙光、浪潮等國產(chǎn)服務(wù)器品牌,在操作系統(tǒng)方面,支持中標(biāo)麒麟、銀河麒麟的適配認(rèn)證;在國產(chǎn)CPU方面,支持與飛騰、鯤鵬、海光、龍芯等國產(chǎn)廠商適配。2.2022Q1至2022Q4該市場付費(fèi)客戶數(shù)量≥10個(gè);3.2021Q1至2022Q4該市場合同收入≥1000萬元。
力維智聯(lián)
深圳力維智聯(lián)技術(shù)有限公司(簡稱“力維智聯(lián)”),前身為中興通訊的子公司“中興力維”,是一家專注于泛在數(shù)據(jù)監(jiān)測預(yù)警和大數(shù)據(jù)人工智能技術(shù)的科技公司。公司擁有170+授權(quán)發(fā)明專利,承擔(dān)國家“科技創(chuàng)新2030—新一代人工智能”重大項(xiàng)目和“物聯(lián)網(wǎng)與智慧城市關(guān)鍵技術(shù)及示范”重點(diǎn)專項(xiàng)的研發(fā)任務(wù),是國內(nèi)通用人工智能與機(jī)器學(xué)習(xí)平臺(tái)DSML軟件產(chǎn)品的核心供應(yīng)商。Sentosa數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)(簡稱“ Sentosa_DSML”)是力維智聯(lián)自主研發(fā)的一站式通用人工智能開發(fā)部署應(yīng)用平臺(tái),通過低代碼方式幫助客戶實(shí)現(xiàn)AI算法模型的開發(fā)、評(píng)估與部署,且具備完善的數(shù)據(jù)資產(chǎn)化管理模式、支持開箱即用簡捷部署。Sentosa_DSML 以 Sentosa Data Cube 數(shù)據(jù)魔方平臺(tái)為主體,集成了 Sentosa ML 機(jī)器學(xué)習(xí)平臺(tái)與Sentosa DL 深度學(xué)習(xí)平臺(tái)等組件,支持組合定制、靈活搭配。Sentosa_DSML已應(yīng)用在政府、出版、電信、科研院所、高校、能源等多個(gè)行業(yè),通用性較強(qiáng)。
力維智聯(lián) Sentosa_DSML 在降低用戶使用門檻、縮短模型開發(fā)周期、平臺(tái)實(shí)用性以及運(yùn)維服務(wù)等方面具有明顯優(yōu)勢。其中,在易用性方面,力維智聯(lián)已經(jīng)將大模型能力融入平臺(tái)中。此外,平臺(tái)可適配國產(chǎn)硬件,滿足信創(chuàng)需求。提供端到端一站式低代碼人工智能開發(fā)部署平臺(tái),降低用戶使用門檻。為適應(yīng)非專業(yè)建模人員使用,Sentosa_DSML 可全流程零代碼實(shí)現(xiàn)數(shù)據(jù)準(zhǔn)備、模型開發(fā)、評(píng)估與部署。平臺(tái)部署近300個(gè)標(biāo)準(zhǔn)算子,包括數(shù)據(jù)讀入算子、數(shù)據(jù)處理算子、數(shù)據(jù)可視化算子、特征工程算子、機(jī)器學(xué)習(xí)算子、深度學(xué)習(xí)算子、模型評(píng)估算子等,支持用戶通過拖拉拽的形式自定義算子流,之后算子流可直接發(fā)布為服務(wù)進(jìn)行部署。除零代碼可視化模型開發(fā)外,Sentosa_DSML 還支持自動(dòng)化模型開發(fā),支持自動(dòng)化數(shù)據(jù)準(zhǔn)備、自動(dòng)化進(jìn)行特征工程、自動(dòng)選擇模型、自動(dòng)調(diào)參等模型開發(fā)全流程。此外,針對專業(yè)數(shù)據(jù)科學(xué)家,平臺(tái)通過提供數(shù)據(jù)視圖和模型庫訪問插件的形式支持低代碼Notebook開發(fā),提升模型開發(fā)效率。
具備高效的項(xiàng)目執(zhí)行效率,顯著縮短開發(fā)周期。Sentosa_DSML 高效的執(zhí)行效率體現(xiàn)在模型開發(fā)、團(tuán)隊(duì)協(xié)作、資源管理、數(shù)據(jù)資產(chǎn)管理等多個(gè)方面。
在模型開發(fā)的編譯環(huán)節(jié),平臺(tái)對算子流編譯統(tǒng)一進(jìn)行后臺(tái)優(yōu)化,包括優(yōu)化編譯器設(shè)計(jì)框架、代碼結(jié)構(gòu)以及內(nèi)存,提高編譯效率。
在團(tuán)隊(duì)協(xié)作方面,基于力維智聯(lián)完全的自主研發(fā),平臺(tái)定義了一套接口規(guī)范,保證建模各環(huán)節(jié)之間的銜接流暢,如清洗好的數(shù)據(jù)可直接拖入建模平臺(tái)中,數(shù)據(jù)讀入算子、統(tǒng)計(jì)分析算子等進(jìn)一步處理分析。規(guī)范的接口可使數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家、軟件工程師等多角色無縫協(xié)作,減輕代碼開發(fā)工作量的同時(shí)也讓團(tuán)隊(duì)更專注于模型精度的優(yōu)化與領(lǐng)域知識(shí)的落地應(yīng)用。
數(shù)據(jù)資產(chǎn)管理中,支持算子流、Notebook、模型、服務(wù)、工作流和應(yīng)用等全流程數(shù)據(jù)資產(chǎn)的版本管理,實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)的沉淀和共享復(fù)用,提高模型開發(fā)團(tuán)隊(duì)工作效率。并且,模型的版本管理中支持一鍵切換,更輕便靈活,減少繁瑣的更新部署工作。
在資源管理方面,平臺(tái)以容器化的方式對計(jì)算資源包括CPU、GPU、內(nèi)存和存儲(chǔ)等進(jìn)行統(tǒng)一納管、分配和動(dòng)態(tài)擴(kuò)容,尤其支持對不同項(xiàng)目資源進(jìn)行隔離,避免因資源錯(cuò)配或搶占導(dǎo)致任務(wù)效率低及中斷的現(xiàn)象。
平臺(tái)操作界面互動(dòng)友好,實(shí)用性較強(qiáng)。力維智聯(lián)秉持“用戶友好”的理念,對用戶操作細(xì)節(jié)進(jìn)行改進(jìn)。如Sentosa_DSML 支持一鍵部署,開箱即用,且具有良好的跨平臺(tái)特性,可在私有云和公有云上部署。又如在模型開發(fā)中,用戶對Notebook類型任務(wù)節(jié)點(diǎn)的條件參數(shù)構(gòu)建表達(dá)式時(shí),平臺(tái)可自動(dòng)提示數(shù)據(jù)集列名、自動(dòng)校驗(yàn)表達(dá)式正確與否。如在AI調(diào)度中心,可對算子流、Notebook、腳本等調(diào)度單元進(jìn)行定時(shí)調(diào)度、周期調(diào)度、消息觸發(fā)調(diào)度等,作業(yè)執(zhí)行方式更靈活。
與此同時(shí),力維智聯(lián)已將大模型能力融入機(jī)器學(xué)習(xí)平臺(tái)中,提高平臺(tái)的可用性,例如在深度學(xué)習(xí)數(shù)據(jù)預(yù)處理中,用戶可通過預(yù)訓(xùn)練大模型提供的AI自動(dòng)標(biāo)注功能,輔助完成數(shù)據(jù)標(biāo)注工作。另外,在平臺(tái)Chat with Data 大模型功能模塊,用戶可通過自然語言輸入,實(shí)現(xiàn)對數(shù)據(jù)的預(yù)處理。
此外,Sentosa_DSML可滿足金融、政府、電信等多領(lǐng)域的信創(chuàng)需求。力維智聯(lián)對Sentosa_DSML有完全自主知識(shí)產(chǎn)權(quán),且平臺(tái)在底層硬件上全面適配Intel、鯤鵬、飛騰CPU處理器和Windows、Linux、麒麟等操作系統(tǒng)。
實(shí)力雄厚,可為用戶提供持久運(yùn)維服務(wù)。力維智聯(lián)前身為中興通訊子公司“中興力維”,公司已申請并積累700余項(xiàng)發(fā)明專利與軟件著作權(quán),全業(yè)務(wù)覆蓋全球70+國家和地區(qū),可為用戶提供算法更新、算法開發(fā)、人員培訓(xùn)以及后續(xù)運(yùn)維升級(jí)等服務(wù)支持。
上海世紀(jì)出版集團(tuán)、中海油惠州石化、南網(wǎng)科研院、航天科技、國家城安院