光學(xué)字符識(shí)別(OCR)是工業(yè)環(huán)境中的重要技術(shù)。OCR技術(shù)在辦公室通信中尤為出色。紙張文件(如發(fā)票,發(fā)貨單和其他記錄)的掃描可以將其快速轉(zhuǎn)換為數(shù)字格式,從中提取相關(guān)信息,并將這些數(shù)據(jù)整合到一個(gè)連續(xù)的電子信息流中。
機(jī)器視覺(jué)使得可以基于印刷或沖壓字符可靠地識(shí)別整個(gè)價(jià)值鏈中的工件和產(chǎn)品。借助于現(xiàn)代深度學(xué)習(xí)技術(shù)和卷積神經(jīng)網(wǎng)絡(luò)(CNN),某些字體可以以字體識(shí)別率顯著提高的方式進(jìn)行訓(xùn)練。該方法也在工業(yè)設(shè)計(jì)和生產(chǎn)過(guò)程中發(fā)揮關(guān)鍵作用,特別是在工業(yè)4.0或工業(yè)物聯(lián)網(wǎng)的背景下。
印刷字母或數(shù)字組合使得可以清楚和快速地識(shí)別組件并使其可用于自動(dòng)化過(guò)程鏈。使用光學(xué)字符識(shí)別,諸如掃描儀和攝像機(jī)之類(lèi)的圖像采集設(shè)備記錄數(shù)字圖像信息,并將其轉(zhuǎn)換成光柵圖形,將文本準(zhǔn)確地表示為后面一個(gè)像素。 OCR軟件讀出這些圖形,識(shí)別數(shù)字組合或字母,并將它們組合成單詞或甚至整個(gè)句子。機(jī)器視覺(jué)技術(shù)支持設(shè)計(jì)和生產(chǎn)過(guò)程中字符組合的光學(xué)識(shí)別。這些技術(shù)包括針對(duì)工業(yè)環(huán)境的特殊要求的特定功能。
例如,經(jīng)過(guò)深思熟慮的分類(lèi)技術(shù)即使在困難的條件下也能確保非常高的識(shí)別率。也可以毫無(wú)問(wèn)題地識(shí)別模糊或傾斜的文字,即使是打印到或蝕刻到反射表面或高度紋理的彩色背景上的扭曲的字母或字符。
深度學(xué)習(xí)技術(shù)的特點(diǎn)是分析大量的數(shù)字圖像數(shù)據(jù),從而訓(xùn)練必須識(shí)別的某些對(duì)象的模型。這對(duì)于物理對(duì)象以及字母或數(shù)字都有用。標(biāo)簽附加到標(biāo)識(shí)對(duì)象的數(shù)據(jù),例如“狗”或“字母A”?,F(xiàn)在可以基于經(jīng)過(guò)訓(xùn)練的模型對(duì)新記錄的圖像信息的內(nèi)容進(jìn)行可靠的聲明。因此,每當(dāng)新圖像被“標(biāo)記”時(shí),該技術(shù)就會(huì)得到學(xué)習(xí)。這增加了可靠地識(shí)別盡可能多的不同版本的圖像內(nèi)容的可能性,例如其他種類(lèi)的狗或具有變化的字體或形狀的字符。