聚時科技2018年11月提交的核心技術(shù)發(fā)明型專利“一種基于監(jiān)督式生成對抗網(wǎng)絡(luò)的異常圖像檢測方法”,在2020年7月正式獲得中華人民共和國國家知識產(chǎn)權(quán)局頒發(fā)的發(fā)明專利證書。經(jīng)過近2年的嚴(yán)格審查,該專利被正式授權(quán)。
作為核心技術(shù),聚時科技的眾多專利創(chuàng)新已被廣泛應(yīng)用于“聚芯”系列半導(dǎo)體檢測產(chǎn)品中,以提高系統(tǒng)的可靠性與先進性。
從“大數(shù)據(jù)小模型”到“小數(shù)據(jù)大模型”,是AI未來的發(fā)展方向之一,也是深度學(xué)習(xí)、計算機視覺、機器人AI的核心基礎(chǔ)方向。在制造業(yè)的很多實際場景中,尤其對傳統(tǒng)制造業(yè),“大數(shù)據(jù)”往往是偽命題,“小樣本”更為常見,也更具挑戰(zhàn)性。例如:在半導(dǎo)體先進制造的復(fù)雜機器視覺場景中、在機器人應(yīng)用場景中,稀缺數(shù)據(jù)(比如稀有缺陷)和特殊場景數(shù)據(jù)往往難以獲得足夠樣本或者獲得樣本成本極高,這些特殊“場景數(shù)據(jù)”或“缺陷數(shù)據(jù)”雖然出現(xiàn)概率不高,但一旦出現(xiàn)極為“致命”,需要機器視覺檢測系統(tǒng)能及時在線精準(zhǔn)捕獲。
如何在盡可能少樣本的情況下,讓機器智能去學(xué)習(xí)和駕馭隱藏的規(guī)律,具有很大挑戰(zhàn)性:這當(dāng)中,一方面由于工業(yè)場景(例如半導(dǎo)體先進制造領(lǐng)域)存在的缺陷形式多樣,更有某些場景缺陷多達幾十種、上百種,而針對某種形式的缺陷難以定量描述;另一方面,針對某一批次的樣本總體,負樣本的占比稀少,所包含的缺陷形式種類不全。這導(dǎo)致傳統(tǒng)算法或者一般開源深度學(xué)習(xí)算法無法駕馭復(fù)雜機器視覺場景。
在各類涉及異常視覺檢測問題中,正常良品樣本通常非常充足,而異常缺陷樣本通常較少,類別不平衡問題嚴(yán)重,因而很難用一般的有監(jiān)督學(xué)習(xí)方法來有效解決。無監(jiān)督學(xué)習(xí)方法雖然能充分利用正常樣本信息,但不能有效利用有限的異常樣本信息,這些信息對學(xué)習(xí)任務(wù)來說是非常有價值的。更重要的一點,無監(jiān)督學(xué)習(xí)方法通常需要對數(shù)據(jù)分布作一些較強的假設(shè),而這些假設(shè)在實際應(yīng)用中不一定能滿足,因而很難取得很好的檢測效果。為此,本專利提出了一種基于監(jiān)督式生成對抗網(wǎng)絡(luò)的方法,該方法能有效彌補監(jiān)督學(xué)習(xí)方法和無監(jiān)督學(xué)習(xí)方法的在異常檢測中的不足,從而得到精確的異常機器視覺檢測結(jié)果。
也就是說,在博弈論范式下,基于監(jiān)督式生成對抗網(wǎng)絡(luò)的異常圖像檢測方法,使算法具備了將缺陷特征遷移至同類產(chǎn)品下的能力,模仿了人類積累經(jīng)驗的過程。特別在面對多批次小批量的生產(chǎn)場景中,當(dāng)缺陷樣本數(shù)量多,且針對某種形式的樣本數(shù)量不足或難以定義時。該方法可以更智能的對各種缺陷進行定義與分類。
該核心技術(shù)解決了工業(yè)視覺場景中缺陷樣本不足的難題,給以往只能依靠傳統(tǒng)圖像處理技術(shù)、傳統(tǒng)視覺算法來解決的場景提供了新思路,擴大了AI技術(shù)在復(fù)雜場景中的實用性和魯棒性。
該發(fā)明提出的方法除應(yīng)用在工業(yè)視覺領(lǐng)域外,還可以廣泛應(yīng)用在其它機器視覺領(lǐng)域,包括醫(yī)療影像疾病診斷、自動駕駛車輛異常檢測、廣義的監(jiān)控視頻異常檢測等領(lǐng)域。