2023年,雖然工業(yè)機器人版塊并沒有迎來業(yè)內(nèi)期盼已久的“行業(yè)大復(fù)蘇”,但在“機器人+”政策以及人形機器人、GPT大模型、具身智能等各種概念的利好之下,工業(yè)機器人的熱度有增無減,甚至在今年上半年還實現(xiàn)了銷量上的正增長。
據(jù)高工機器人產(chǎn)業(yè)研究所(GGII)數(shù)據(jù)顯示,2023年H1,工業(yè)機器人銷量15.19萬臺,同比增長10.98%。GGII預(yù)計,2023年中國工業(yè)機器人全年銷量約33.3萬臺,同比增長9.90%。
不僅在銷量上保住了正增長趨勢,在融資層面也仍舊強勢,尤其是機器視覺領(lǐng)域。
據(jù)高工機器人產(chǎn)業(yè)研究所(GGII)數(shù)據(jù)顯示,2023年Q2,中國工業(yè)機器人領(lǐng)域融資事件23例,涉及融資金額約14億元人民幣;按融資案例分布來看,2023年Q2融資案例數(shù)量最多的是工業(yè)機器人本體(26%),其次是機器視覺和零部件領(lǐng)域(22%);融資金額最大的領(lǐng)域主要是核心零部件(33.57%)和機器視覺(23.43%)領(lǐng)域。
然而,在機器視覺持續(xù)火熱的背后,國內(nèi)機器視覺市場規(guī)模正在逐步擴大,國產(chǎn)機器視覺企業(yè)也憑借新的差異化發(fā)展路徑,逐步崛起。
GGII數(shù)據(jù)顯示,2022年中國機器視覺市場規(guī)模170.65 億元(該數(shù)據(jù)未包含自動化集成設(shè)備規(guī)模),同比增長23.51%。其中,2D視覺市場規(guī)模約為152.24億元,同比增長20.21%,3D 視覺市場約為18.40億元,同比增長59.90%。
GGII預(yù)測,至2027年我國機器視覺市場規(guī)模將超過560億元,其中,2D視覺市場規(guī)模將超過400億元,3D視覺市場規(guī)模將接近160億元。
面對機器視覺領(lǐng)域的持續(xù)火熱,有企業(yè)負責(zé)人卻表示:“其實,我覺得行業(yè)前兩年是有‘虛火’的,但是任何一個行業(yè)都類似,這個‘虛火’本身代表了對于賽道的認可。而這兩年的‘虛火’有一個很大的好處,就是基本上大家認為人工智能與3D視覺在機器視覺解決方案中已經(jīng)走通,技術(shù)上已經(jīng)不存在問題,當前的要務(wù)就是如何才能把方案落地,并更加突出性價比。”
也正是在這樣的背景之下,跨維智能憑借創(chuàng)始人的“熱愛”與深厚的技術(shù)優(yōu)勢成功脫穎而出,并為機器視覺領(lǐng)域注入全新的發(fā)展思路。
跨維智能創(chuàng)始人賈奎博士的一句話,更是直接道出了當下3D視覺領(lǐng)域的問題核心:“我們需要用AI的能力解決物理世界三維的感知問題。”
“AI+3D”的技術(shù)路徑,在業(yè)內(nèi)并不算是新鮮的名詞,但AI對3D視覺算法的漸進式優(yōu)化并沒有解決行業(yè)痛點,項目的非標定制化問題仍然存在�?缇S智能倡導(dǎo)一條基于100%合成數(shù)據(jù)和AI能力平臺的新一代3D視覺算法生產(chǎn)模式,以無人化、標準化的視覺算法生產(chǎn)流程打破了視覺項目非標定制的瓶頸,產(chǎn)品化的交付能力讓行業(yè)看到了3D視覺技術(shù)普及的希望�?缇S智能作為一家以AI為內(nèi)核的企業(yè),其新一代3D視覺解決方案已經(jīng)成功落地在越來越多的具體案例中,而且還提出了基于物理世界模擬的生成式AI 2.0的概念。
那么究竟何為“生成式AI 2.0”?又有何魔力?要想揭開個中奧秘,或許還需從跨維智能本身來尋找答案。
躬身入局
據(jù)悉,跨維智能是一家專注于3D視覺軟硬件產(chǎn)品研發(fā)的高科技人工智能企業(yè),其致力于將先進的三維幾何深度學(xué)習(xí)技術(shù)應(yīng)用于工業(yè)智能化領(lǐng)域,為客戶提供AI視覺算法、3D智能相機和高性價比的軟硬件一體化3D視覺解決方案,讓機器人以靈活主動的方式完成復(fù)雜環(huán)境下基于3D視覺的定位、識別、引導(dǎo)等任務(wù)。
成立一年內(nèi),跨維智能就成功完成兩輪近億元融資,目前已獲得來自松禾資本、真格基金、聯(lián)創(chuàng)資本等知名機構(gòu)投資,并由此引發(fā)了資本圈以及業(yè)界的高度關(guān)注。
那么,當初跨維智能是基于何種初衷選擇了AI作為入局3D視覺的主要方向?據(jù)賈奎博士透露,2016年回國后,其在華南理工大學(xué)便選擇用新型AI作為攻克三維感知的研究方向,彼時該校還建立了“幾何感知與智能”實驗室。
也正是基于這樣的長期技術(shù)積累,讓賈奎博士看到了AI在三維感知層面的商業(yè)化潛在機會。
賈奎博士表示:“用AI來做三維感知,它本身有兩大應(yīng)用方向,第一是泛機器人的感知,其次是虛擬現(xiàn)實的增強,不管是前者還是后者都存在著現(xiàn)實三維空間中的感知問題。而經(jīng)過了前期的技術(shù)沉淀,我們需要考慮從興趣到產(chǎn)業(yè)化的機會,為此,選擇了與機器人相關(guān),譬如機械臂、無人車、人形機器人等。如何讓這些機器人能夠真正具備智能決策的能力,這就涉及到眼和腦的協(xié)同,倘若缺乏對三維世界的感知,那么機器人相關(guān)產(chǎn)品便不能做出相應(yīng)的決策,它也就不是一個智能體。當然,這里面還有很多的應(yīng)用方向,但為何跨維偏偏選擇去賦能機械臂相關(guān)的操作感知決策?關(guān)鍵一點就是我們要垂直打穿一個業(yè)務(wù)落地方向。”
正是基于這樣的發(fā)展方向,跨維智能在產(chǎn)品層面也屢獲突破。今年5月底,跨維智能發(fā)布了一款專為工業(yè)生產(chǎn)領(lǐng)域設(shè)計的Xema系列3D相機產(chǎn)品,該款產(chǎn)品一經(jīng)推出在業(yè)界就引發(fā)了巨大關(guān)注。
技術(shù)開源
“我們此次推出的產(chǎn)品為Xema北極鷗系列開源相機,在小/中/大不同的工作視野下,跨維智能Xema系列劃分了Xema-P/S/L三款相機,以合適的價格、優(yōu)質(zhì)的技術(shù)方案,為不同的工業(yè)應(yīng)用場景提供可靠的相機硬件方案。用戶可根據(jù)實際應(yīng)用場景及使用需求,選擇相應(yīng)的相機型號。”跨維智能相機部負責(zé)人吳迪介紹道。
據(jù)了解,跨維智能Xema北極鷗系列開源相機不僅提供先進的API接口和SDK二次開發(fā)軟件包,使用戶能夠以極大的靈活性進行二次開發(fā)。同時,通過開源平臺,用戶還將獲得對3D相機的完全掌控權(quán)。
“我們其實是希望通過開源的模式,來降低整個工業(yè)界對3D成像硬件的研發(fā)成本。因為當下普遍存在著這樣一個現(xiàn)象——每家企業(yè)都希望自己研發(fā)而不是采購別人的3D相機,如此,每家企業(yè)勢必就得從零開始研發(fā),這對整個社會而言是巨大的浪費,與其如此,大家還不如把力量合在一起,研發(fā)出最通用、效果最好的3D相機�,F(xiàn)在,我們在技術(shù)上有一些優(yōu)勢,所有我們把自己的代碼、設(shè)計圖紙通過開源的方式,向整個工業(yè)界揭開,希望通過這樣的方式來促進行業(yè)乃至社會的發(fā)展進步。”談及開源的初衷時,吳迪如此說道。
對于跨維智能而言,開源只是邁向理想路上的第一步,打造3D視覺大模型實現(xiàn)“降本增效”方為其真正目的。
生成式AI 2.0
目前,3D視覺在工業(yè)制造的落地方面,依舊存在著諸多難點和痛點,譬如碎片化、多變等需求。以拆垛為例,可能是拆箱子、拆帶子,也可能是混合的拆垛、拆木板、拆電器門板等;還有工件,可能是半無序的工件,也可能是完全無序的工件,高反的工件或者是異形工件和大長寬比,所有的這些需求也就決定了場景定制化落地,縱然有些軟件產(chǎn)品的輔助,但仍存在著不同程度的定制調(diào)優(yōu)。
面對這樣的復(fù)雜情況,在賈奎博士眼里,生成式AI無疑是最優(yōu)解。
但當前的生成式AI本身也有局限性,以圖文為主,側(cè)重通過對自然語言的理解嘗試對需求做出示意性的反饋,但無法保證精度,因而在科技、工程等領(lǐng)域應(yīng)用受到諸多限制,要想打破這樣的局限,就必須將生成式AI與物理世界結(jié)合,為此賈奎博士認為:“基于物理世界模擬的生成式AI,是生成式AI 2.0”。通過這樣組合,生成式 AI便可預(yù)測物理世界中的千萬種、甚至上億種可能性,形成有價值的合成數(shù)據(jù)。
以機械臂的抓取為例,通過仿真模擬平臺掌握了“光線對場景目標的反射、折射影響”等物理規(guī)律,生成式 AI就能預(yù)測模擬出一個瓶子,在不同場景光照下,周身不同的反光程度;一堆釘子,所有可能出現(xiàn)的散落狀態(tài)等。
而這也恰恰是跨維智能的優(yōu)勢所在,通過生成式AI不僅能夠輕松解決了業(yè)內(nèi)普遍存在的痛點和難點——據(jù)了解,目前業(yè)內(nèi)大多數(shù)企業(yè)都是采用自行采集真實樣本的方式來開發(fā)或訓(xùn)練算法,但自采的方式不僅成本高、效率低,加上終端應(yīng)用場景碎片化,數(shù)據(jù)通用的概率相對較低,需要經(jīng)過一系列的優(yōu)化,這無形之中又增加了數(shù)道工序,性價比極低。
對此,賈奎博士曾表示:“用五六年、上千個案例積累的真實數(shù)據(jù),通過合成數(shù)據(jù),幾天就能完成。相比于人工采集與標注數(shù)據(jù),合成數(shù)據(jù)的成本能夠?qū)崿F(xiàn)幾個數(shù)量級的降低。”
最關(guān)鍵的還是,在訓(xùn)練效果上,合成數(shù)據(jù)能夠更優(yōu)于真實數(shù)據(jù)。由于本身就是基于物理規(guī)律合成,合成數(shù)據(jù)天生自帶絕對精確的標注,這就意味著,AI學(xué)習(xí)起來效率非常高。另外,合成數(shù)據(jù)的“全面性”是真實數(shù)據(jù)難以比擬的。
“跨維智能其實就是用新型的AI對物理規(guī)律進行建模,讓機器人的感知更智能、更精確,然后做出更好的決策,從而賦能到垂直場景,解決工業(yè)制造等領(lǐng)域所需的柔性抓取操作需求。”
據(jù)介紹,跨維智能旗下的生成式AI產(chǎn)品,目前,無需使用一張真實圖片就可完成機械臂復(fù)雜場景作業(yè)的3D視覺模型訓(xùn)練,僅通過使用合成數(shù)據(jù)訓(xùn)練的模型引導(dǎo)機械臂的柔性操作,便可以實現(xiàn)現(xiàn)場99.9%以上的穩(wěn)定抓取。
相較于行業(yè)傳統(tǒng)定制化開發(fā)的模式,企業(yè)基于生成式AI 2.0,就可以利用通用大模型,實現(xiàn)產(chǎn)品模塊化開發(fā),做到開箱即用的部署,進而實現(xiàn)同行業(yè)直接拓展,不同行業(yè)也能有效復(fù)用,3D視覺行業(yè)的商業(yè)化難題也就迎刃而解。而這恰恰是跨維智能所憧憬的行業(yè)未來,賈奎博士承諾,跨維智能從3D合成數(shù)據(jù)到基于AI平臺的3D視覺算法等中臺能力未來也將向行業(yè)開放。
雖為新生代企業(yè),但跨維智能的大局觀、長期主義及開放性,都為行業(yè)帶來了全新氣象。俗語有云:“相聚為始,并行乃濟,無欲則成”。只有足夠開放,才能聚眾智、合眾力,從而推動3D視覺行業(yè)的全面繁榮發(fā)展。









