阿丘科技:生成式AI與行業(yè)視覺大模型驅(qū)動(dòng)工業(yè)AI視覺2.0
5月21日,阿丘科技CEO黃耀應(yīng)邀參加北京機(jī)器視覺助力智能制造創(chuàng)新發(fā)展大會(huì),并發(fā)表《AI+工業(yè)視覺探索與展望》主題演講,下文根據(jù)黃耀先生的主題演講主要內(nèi)容撰寫而成??牲c(diǎn)擊文末“閱讀原文”下載原版PPT資料。
一、AI+工業(yè)檢測的難點(diǎn)與挑戰(zhàn)
現(xiàn)代制造業(yè)中,質(zhì)量管控是一個(gè)至關(guān)重要但充滿挑戰(zhàn)的環(huán)節(jié)。制造企業(yè)使用AI的具體場景中,“質(zhì)量檢測”占據(jù)了約40%的比例。在質(zhì)量管控中,面對(duì)大規(guī)模的產(chǎn)量,企業(yè)需要管理眾多的工藝控制點(diǎn)。
這導(dǎo)致單個(gè)產(chǎn)品的檢測參數(shù)量多,總體檢測的參數(shù)量大,給質(zhì)量控制帶來了極大的壓力。其次,極限制造的環(huán)境下,對(duì)產(chǎn)品的精度和品質(zhì)要求極為嚴(yán)格。不僅生產(chǎn)線上對(duì)過檢和漏檢的指標(biāo)控制非常嚴(yán)格,同時(shí)產(chǎn)線速度的加快進(jìn)一步增加了檢測的難度。
此外,缺陷的種類復(fù)雜多變,許多缺陷非常微小,區(qū)分度低,使得檢測工作更加困難。最后,傳統(tǒng)的質(zhì)量管控方式需要投入大量的人力和財(cái)力,即使如此,仍然存在漏檢的風(fēng)險(xiǎn)。這些因素共同構(gòu)成了質(zhì)量管控的主要難點(diǎn),亟需通過技術(shù)創(chuàng)新和改進(jìn)來解決。
工業(yè)AI視覺檢測作為制造業(yè)中新興的領(lǐng)域,在高速發(fā)展的同時(shí)也一直面臨著一系列難點(diǎn)與挑戰(zhàn)。
第一,嚴(yán)苛的性能指標(biāo)。工業(yè)場景對(duì)AI檢測提出了極為嚴(yán)苛的性能指標(biāo),要求極高的準(zhǔn)確度、AI模型高度的穩(wěn)定性和魯棒性,適應(yīng)復(fù)雜多變的工業(yè)環(huán)境。
第二,工業(yè)場景的數(shù)據(jù)基礎(chǔ)薄弱。工業(yè)數(shù)據(jù)往往數(shù)量有限且私有化,導(dǎo)致數(shù)據(jù)的獲取和應(yīng)用面臨高度碎片化的難題。數(shù)據(jù)基礎(chǔ)的薄弱是制約工業(yè)AI發(fā)展的重要因素,缺乏數(shù)據(jù)、數(shù)據(jù)質(zhì)量差或數(shù)據(jù)量不足的問題,都嚴(yán)重影響了AI模型的訓(xùn)練和優(yōu)化效果。
第三,工業(yè)場景的AI大多需要與硬件緊密結(jié)合。這不僅增加了系統(tǒng)的復(fù)雜性,還可能引入各種干擾因素,對(duì)AI的性能造成影響。
第四,AI+工業(yè)人才缺乏。人才缺乏是工業(yè)AI發(fā)展中的另一個(gè)瓶頸,既懂得AI技術(shù)又熟悉工業(yè)領(lǐng)域的復(fù)合型人才十分稀缺,很大程度上限制了AI技術(shù)在工業(yè)場景中的應(yīng)用和推廣。
二、工業(yè)AI視覺進(jìn)入2.0時(shí)代
中國工業(yè)AI視覺的落地大約始于2019年,經(jīng)過5年的積累、迭代,正在從1.0進(jìn)入2.0時(shí)代。
工業(yè)AI視覺進(jìn)化論
1、工業(yè)AI視覺1.0時(shí)代:聚焦工業(yè)場景的AI算法,實(shí)現(xiàn)“可用”
在工業(yè)AI視覺1.0時(shí)代,由于沒有足夠的數(shù)據(jù),通常需要通過小樣本技術(shù)來解決問題。
這一時(shí)期的工業(yè)AI視覺主要表現(xiàn)為以下3個(gè)特征:
第一,小樣本學(xué)習(xí)。在工業(yè)生產(chǎn)環(huán)境中,訓(xùn)練AI模型可用的標(biāo)注圖像樣本采集、標(biāo)注耗時(shí)耗力,往往數(shù)量非常有限,所以此時(shí)的AI算法訓(xùn)練只能夠在有限的數(shù)據(jù)基礎(chǔ)上進(jìn)行。
第二,高精度。工業(yè)質(zhì)檢的標(biāo)準(zhǔn)要求AI檢測系統(tǒng)以很高的準(zhǔn)確度檢測、識(shí)別和分類圖像中的目標(biāo)對(duì)象,如缺陷檢測、尺寸測量、物體識(shí)別和分類等任務(wù)。高精度是工業(yè)視覺檢測系統(tǒng)的一個(gè)關(guān)鍵性能指標(biāo),它對(duì)生產(chǎn)效率、產(chǎn)品質(zhì)量和企業(yè)信譽(yù)都有直接影響。
第三,低算力依賴。在實(shí)際的生產(chǎn)環(huán)境中, AI檢測系統(tǒng)在執(zhí)行圖像處理和分析任務(wù)時(shí)可用的計(jì)算資源相對(duì)較少,工業(yè)級(jí)AI視覺算法經(jīng)過專門的優(yōu)化,可以在相對(duì)性能有限的計(jì)算資源上完成高性能檢測。
這一時(shí)期的典型客戶群體主要是對(duì)新技術(shù)持開放態(tài)度的企業(yè),它們通常面臨明顯的生產(chǎn)或質(zhì)量管控痛點(diǎn),并且愿意投資于前沿技術(shù)以獲得競爭優(yōu)勢。這些企業(yè)通常對(duì)AI有清晰的認(rèn)識(shí),能夠定義明確的需求邊界,并有能力進(jìn)行有效的數(shù)據(jù)和模型管理。
工業(yè)AI視覺1.0時(shí)代
在這一時(shí)期,從AI全面落地的角度,也僅僅算是解決了工業(yè)視覺中“可用”的問題。
首先,數(shù)據(jù)困局明顯。由于工業(yè)缺陷數(shù)據(jù)難以搜集,外加清洗、標(biāo)注等成本偏高,使得AI模型的訓(xùn)練和整理都變得充滿挑戰(zhàn)。
其次,部署周期長。較長的上線部署周期,嚴(yán)重延緩了企業(yè)所需的應(yīng)用速度。
而且,未知缺陷無法識(shí)別。一些新的缺陷類型難以識(shí)別,很大程度限制了AI的應(yīng)用。
最后,昂貴的成本。高昂的AI落地成本門檻使得只有具備一定支付能力的企業(yè)才可能采用這項(xiàng)技術(shù)。
總體而言,工業(yè)AI視覺1.0時(shí)代為工業(yè)AI視覺技術(shù)的未來發(fā)展奠定了基礎(chǔ),盡管存在諸多挑戰(zhàn),但通過不斷的技術(shù)創(chuàng)新和市場適應(yīng),AI視覺技術(shù)逐步從可用走向成熟。
2、工業(yè)AI視覺2.0時(shí)代:生成式AI及垂直細(xì)分通用模型,達(dá)到“好用”
工業(yè)AI視覺2.0時(shí)代的來臨,標(biāo)志著工業(yè)AI視覺技術(shù)的重要演進(jìn)。
基于Transformer神經(jīng)網(wǎng)絡(luò)的技術(shù)也在工業(yè)AI領(lǐng)域迅速發(fā)展,更強(qiáng)的通用性和泛化能力,可以把過去針對(duì)單一場景解決問題擴(kuò)展到可應(yīng)對(duì)垂類場景解決問題。
具體來說,包括單場景的規(guī)模復(fù)制和多場景模型的泛化遷移,這為工業(yè)AI視覺的應(yīng)用提供了更大的靈活性和擴(kuò)展性,同時(shí)也大大降低了AI落地的成本。
同時(shí),這些轉(zhuǎn)變也會(huì)涉及到成像模組、算法模組以及自動(dòng)化模組的創(chuàng)新和簡化,使得AI解決方案更加易于開發(fā)及落地。
工業(yè)AI視覺2.0時(shí)代的客戶群體更加普遍,即客戶有明確的痛點(diǎn)、關(guān)注性價(jià)比,他們可從AI成本的進(jìn)一步下降中受益,使得AI視覺技術(shù)的應(yīng)用擴(kuò)展到更大規(guī)模。
工業(yè)AI視覺2.0時(shí)代
在工業(yè)AI視覺2.0時(shí)代,三大關(guān)鍵技術(shù)起到了重要作用。
(1)關(guān)鍵技術(shù)一:智能良品學(xué)習(xí)
阿丘科技認(rèn)為,工業(yè)AI視覺2.0時(shí)代的關(guān)鍵技術(shù)之一即智能良品學(xué)習(xí),它包括非監(jiān)督分割和非監(jiān)督分類兩種模塊。這項(xiàng)技術(shù)可有效應(yīng)對(duì)產(chǎn)線中出現(xiàn)的未知新缺陷,以及需要在極短的時(shí)間內(nèi)完成模型部署和上線的問題。
智能良品學(xué)習(xí)的核心優(yōu)勢在于,它只需利用良品圖像,就能夠?qū)λ幸阎臀粗娜毕葸M(jìn)行像素級(jí)別的檢測和整圖分類,從而實(shí)現(xiàn)快速的上線驗(yàn)證。目前,阿丘科技已將智能良品學(xué)習(xí)技術(shù)應(yīng)用在數(shù)十個(gè)實(shí)際場景中,尤其適用于一些產(chǎn)線良品率高、樣本收集周期長、可能面臨未知缺陷,以及產(chǎn)線上異常類別檢測等場景。
然而,對(duì)于小缺陷場景,智能良品學(xué)習(xí)技術(shù)的效果仍有待提升。
關(guān)鍵技術(shù)一
智能良品學(xué)習(xí)技術(shù)展示了AI在工業(yè)視覺檢測領(lǐng)域中的巨大潛力,尤其是在快速適應(yīng)產(chǎn)線變化和提高生產(chǎn)效率等方面。
(2)關(guān)鍵技術(shù)二:生成式AI——智能缺陷數(shù)據(jù)生成
在工業(yè)AI視覺2.0時(shí)代中的另一項(xiàng)關(guān)鍵技術(shù)即生成式AI——智能缺陷數(shù)據(jù)生成。
在以往方式中,搜集缺陷樣本數(shù)據(jù)需要花費(fèi)數(shù)天甚至是數(shù)月時(shí)間,一旦產(chǎn)品換型,整個(gè)搜集過程又必須重新開始。此外,搜集那些不常出現(xiàn)的長尾缺陷(一年可能只出現(xiàn)一次),也為樣本收集帶來了巨大挑戰(zhàn)。
為了解決這些問題,阿丘科技通過多年來在工業(yè)AI視覺領(lǐng)域的探索和實(shí)踐,利用積累的大量場景和經(jīng)驗(yàn),構(gòu)建出預(yù)訓(xùn)練模型?;陬A(yù)訓(xùn)練模型,結(jié)合具體場景的缺陷特征描述,通過Stable Diffusion框架,即可生成真實(shí)缺陷的仿真圖像。
這意味著,AI可以創(chuàng)造出接近真實(shí)情況的目標(biāo)缺陷圖像,并能適應(yīng)復(fù)雜結(jié)構(gòu)缺陷、背景變化、缺陷邊緣處理等多樣場景,高度還原真實(shí)缺陷紋理、立體度和色彩細(xì)節(jié)等。
智能缺陷生成技術(shù)為工業(yè)視覺檢測系統(tǒng)提供了一個(gè)強(qiáng)大的工具,以便于在缺乏實(shí)際缺陷樣本的情況下,也能訓(xùn)練和優(yōu)化模型,顯著提高了模型的泛化能力與適應(yīng)性。
關(guān)鍵技術(shù)二
(3)關(guān)鍵技術(shù)三:工業(yè)視覺大模型
關(guān)鍵技術(shù)三為工業(yè)視覺大模型,即專門針對(duì)工業(yè)應(yīng)用領(lǐng)域而設(shè)計(jì)的算法模型,其構(gòu)建和訓(xùn)練需要利用Transformer,以及大量的領(lǐng)域特定數(shù)據(jù)。
工業(yè)視覺大模型具備領(lǐng)域泛化能力,能夠適應(yīng)多變的工業(yè)環(huán)境,特別是單場景的規(guī)模復(fù)制和多場景模型的泛化遷移。
工業(yè)視覺大模型具有一定的垂直場景通用性,在特定領(lǐng)域可以有效降低AI算法開發(fā)、訓(xùn)練的成本,因此在智能制造和自動(dòng)化質(zhì)量控制方面的應(yīng)用非常迅速。
關(guān)鍵技術(shù)三(部分素材來源Landing.AI)
從工業(yè)AI視覺1.0時(shí)代向工業(yè)AI視覺2.0時(shí)代轉(zhuǎn)變的過程,也是工業(yè)AI視覺從“可用”邁向“好用”的過程。
在“可用”的時(shí)代,“算法驅(qū)動(dòng)”是破局的關(guān)鍵,小樣本、AI算法、軟件工具鏈、AI落地方法論這些成為企業(yè)開發(fā)和應(yīng)用工業(yè)AI視覺的關(guān)鍵點(diǎn)。
在“好用”的時(shí)代,“以數(shù)據(jù)為中心”逐漸成為共識(shí)。高質(zhì)量的數(shù)據(jù)開始作為構(gòu)建強(qiáng)大AI算法的基礎(chǔ),同時(shí),生成式AI算法能夠利用有限的數(shù)據(jù)樣本生成更多的可用數(shù)據(jù),從而可以低成本達(dá)成AI模型訓(xùn)練。
而且,工業(yè)AI視覺2.0時(shí)代將更強(qiáng)調(diào)平臺(tái)化,構(gòu)建的AI平臺(tái)將包裹并整合以往的軟件、工具鏈和方法論等內(nèi)容,解決企業(yè)中碎片化場景的應(yīng)用問題,助力AI技術(shù)在企業(yè)各個(gè)分支工廠、不同場景的落地應(yīng)用。
在工業(yè)AI視覺2.0時(shí)代的革新浪潮中,阿丘科技希望能夠推動(dòng)工業(yè)AI視覺平臺(tái)及行業(yè)基礎(chǔ)模型在工業(yè)視覺領(lǐng)域的垂直應(yīng)用,降低企業(yè)AI落地成本和難度,幫助企業(yè)實(shí)現(xiàn)智能化升級(jí)。
工業(yè)視覺AI從1.0時(shí)代到2.0時(shí)代
三、工業(yè)AI垂直行業(yè)視覺大模型的實(shí)踐落地
從2017年創(chuàng)業(yè)以來,阿丘科技始終致力于將先進(jìn)的人工智能、機(jī)器視覺等技術(shù)應(yīng)用于工業(yè)領(lǐng)域的智能化檢測。目前,已落地800+工廠,標(biāo)準(zhǔn)工業(yè)AI視覺軟件批量部署套數(shù)10000+,獲得3C電子、動(dòng)力電池、PCB等行業(yè)50+標(biāo)桿客戶的認(rèn)可。在充滿生機(jī)的工業(yè)AI視覺2.0時(shí)代,阿丘科技秉持開放的心態(tài),將已實(shí)際落地的AI垂直行業(yè)視覺大模型實(shí)踐與同行分享。
以工業(yè)視覺大模型在PCB行業(yè)中的實(shí)踐為例。
PCB(Printed Circuit Board,印制電路板)是現(xiàn)代電子產(chǎn)品制造中的核心組成部分,被廣泛用于計(jì)算機(jī)、手機(jī)、醫(yī)療設(shè)備、汽車、航空航天等眾多領(lǐng)域,PCB的設(shè)計(jì)和制造質(zhì)量直接影響到電子產(chǎn)品的性能。
隨著技術(shù)的發(fā)展,PCB的設(shè)計(jì)工藝越來越復(fù)雜,缺陷種類多達(dá)上百種,根據(jù)產(chǎn)品應(yīng)用場景不同,其檢測情況也存在差異。
由于背景復(fù)雜,工藝屬性強(qiáng),產(chǎn)品尺寸規(guī)格多樣,算法兼容適配難度大。PCB生產(chǎn)廠早期均采用基于傳統(tǒng)算法的AOI(自動(dòng)光學(xué)檢測)和 AVI(自動(dòng)視覺檢測)設(shè)備檢測PCB缺陷,設(shè)備調(diào)試復(fù)雜且誤報(bào)率高,需要大量人工對(duì)假點(diǎn)復(fù)判。平均一臺(tái)設(shè)備需要配置3-6名質(zhì)檢人員,人工復(fù)判的成本高、一致性差,質(zhì)量難以把控。
針對(duì)這些難點(diǎn),阿丘科技通過構(gòu)建PCB行業(yè)垂直視覺大模型,通過三大步驟,落地實(shí)踐。
步驟一,數(shù)據(jù)積累。阿丘科技收集了大量PCB行業(yè)現(xiàn)場的私有化部署缺陷數(shù)據(jù),并進(jìn)行了部分缺陷的仿真,不僅實(shí)現(xiàn)了行業(yè)場景數(shù)據(jù)的積累,還覆蓋了上百種缺陷、細(xì)分類別,準(zhǔn)確率達(dá)到95%以上。同時(shí),基于阿丘科技AIDG智能缺陷生成工具,低成本、快速生成大量的缺陷樣本數(shù)據(jù),滿足大模型訓(xùn)練的需求。
步驟二:標(biāo)準(zhǔn)定義。阿丘科技對(duì)各類出貨檢測標(biāo)準(zhǔn)進(jìn)行匯總、整理和分級(jí),逐步探索并確定了適用于PCB各交付場景的檢測標(biāo)準(zhǔn)。
步驟三:預(yù)制模型訓(xùn)練。在AOI和AVI等場景中,阿丘科技使預(yù)制模型的覆蓋度達(dá)到了90%以上。
這一過程極大地提升了交付效率,將原本需要120天的流程縮短至14天。不僅極大縮短了數(shù)據(jù)處理時(shí)間,還使得模型可以更快更穩(wěn)地上線。截止目前,阿丘科技AI垂直行業(yè)視覺大模型在PCB行業(yè)已經(jīng)導(dǎo)入了超過 100個(gè)工廠,累計(jì)升級(jí)設(shè)備數(shù)超過1000臺(tái),Top30的PCB客戶覆蓋率達(dá)到70%以上。
PCB行業(yè)案例
阿丘科技通過數(shù)據(jù)積累、標(biāo)準(zhǔn)定義和預(yù)制模型訓(xùn)練,成功將AI垂直行業(yè)視覺大模型應(yīng)用于PCB行業(yè),提升了PCB行業(yè)的工業(yè)視覺檢測效率,縮短了交付周期,通過流程優(yōu)化,提高了數(shù)據(jù)處理速度及模型穩(wěn)定性。同時(shí),阿丘科技也會(huì)繼續(xù)擴(kuò)大在工業(yè) AI 垂直行業(yè)的技術(shù)能力,進(jìn)一步深化和拓展其視覺大模型的應(yīng)用范圍,實(shí)現(xiàn)更高效的模型訓(xùn)練和更精準(zhǔn)的缺陷檢測,以滿足市場對(duì)快速響應(yīng)和高效生產(chǎn)的需求。
作為AI+工業(yè)先行者,阿丘科技將繼續(xù)保持創(chuàng)新,不斷將最前沿的AI技術(shù)應(yīng)用于工業(yè)領(lǐng)域,為行業(yè)帶來驚艷的AI產(chǎn)品解決方案,推動(dòng)AI從可用變得好用。攜手行業(yè)伙伴一同推動(dòng)AI for Every Factory!