計(jì)算機(jī)視覺與人工智能有密切聯(lián)系,但也有本質(zhì)的不同。人工智能的目的是讓計(jì)算機(jī)去看、去聽和去讀。圖像、語音和文字的理解,這三大部分基本構(gòu)成了我們現(xiàn)在的人工智能。而在人工智能的這些領(lǐng)域中,視覺又是核心。大家知道,視覺占人類所有感官輸入的80%,也是最困難的一部分感知。如果說人工智能是一場革命,那么它將發(fā)軔于計(jì)算機(jī)視覺,而非別的領(lǐng)域。
人工智能更強(qiáng)調(diào)推理和決策,但至少計(jì)算機(jī)視覺目前還主要停留在圖像信息表達(dá)和物體識別階段?!拔矬w識別和場景理解”也涉及從圖像特征的推理與決策,但與人工智能的推理和決策有本質(zhì)區(qū)別。
1、計(jì)算機(jī)視覺是一個(gè)人工智能需要解決的很重要的問題。2、計(jì)算機(jī)視覺是目前人工智能的很強(qiáng)的驅(qū)動(dòng)力。因?yàn)橛?jì)算機(jī)視覺有很多應(yīng)用,很多技術(shù)是從計(jì)算機(jī)視覺誕生出來以后,再反運(yùn)用到AI領(lǐng)域中去。
3、計(jì)算機(jī)視覺擁有大量的量子AI的應(yīng)用基礎(chǔ)。
在深度學(xué)習(xí)出現(xiàn)之前,計(jì)算機(jī)視覺可以執(zhí)行的任務(wù)非常有限,并且需要開發(fā)人員和人工操作人員進(jìn)行大量的人工編碼和工作。
例如,如果要執(zhí)行人臉識別,則必須執(zhí)行以下步驟:
創(chuàng)建數(shù)據(jù)庫:你必須以特定格式捕獲要跟蹤的所有主題的單個(gè)圖像。
為圖像添加注釋:對于每個(gè)單獨(dú)的圖像,你都必須輸入幾個(gè)關(guān)鍵數(shù)據(jù)點(diǎn),例如眼睛之間的距離,鼻梁的寬度,上唇與鼻子之間的距離以及數(shù)十種定義獨(dú)特特征的其他測量值每個(gè)人。
捕獲新圖像:接下來,你必須捕獲新圖像,無論是照片還是視頻內(nèi)容。然后,你必須再次執(zhí)行測量過程,在圖像上標(biāo)記關(guān)鍵點(diǎn)。你還必須考慮拍攝圖像的角度。
經(jīng)過所有這些手動(dòng)工作,應(yīng)用程序最終將能夠?qū)⑿聢D像中的測量結(jié)果與數(shù)據(jù)庫中存儲的測量結(jié)果進(jìn)行比較,并告訴你它是否與所跟蹤的任何配置文件相對應(yīng)。實(shí)際上,涉及到的自動(dòng)化很少,大部分工作都是手動(dòng)完成的。而且誤差幅度仍然很大。
盡管最近取得了令人印象深刻的進(jìn)步,但我們甚至還沒有解決計(jì)算機(jī)視覺問題。但是,已經(jīng)有多家機(jī)構(gòu)和AI公司找到了將由神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的C計(jì)算機(jī)視覺系統(tǒng)應(yīng)用于解決實(shí)際問題的方法。而且,AI人工智能下的機(jī)器學(xué)習(xí)與深度學(xué)習(xí)已經(jīng)成為了趨勢。
從應(yīng)用前景看,基于計(jì)算機(jī)視覺的視頻監(jiān)控技術(shù)所面臨的巨大市場潛力為視頻結(jié)構(gòu)化技術(shù)提供了廣闊的應(yīng)用前景。
聯(lián)系客服