來源 | 數(shù)字人才實訓基地

知圈 |

前言

OCR的應用范疇:

OCR對圖片都做了什么:

實踐上我們預期的結(jié)果是把只要包含單個文字的圖片交給計算機去翻譯。

機器是怎樣看到紙質(zhì)或者電子文檔或是圖片上的文字的呢?接下來看一下他的工作流程。

工作流程:

首先要去掉雜質(zhì),這樣程序就能夠集中留意到文字上面。

預處置:

預處置主要包括灰度化,二值化,噪聲去除,傾斜矯正等。

灰度化:

灰度圖是只含亮度信息,不含顏色信息的圖片。

在RGB模型中,假如R=G=B時,則彩色表示一種灰度顏色,其中R=G=B的值叫灰度值。

普通滿足下面這個公式:

Gray=0.299R+0.587G+0.114B 這種參數(shù)思索到了人眼的生理特性。

原圖.jpg

免責聲明:本文僅代表文章作者的個人觀點,與本站無關。其原創(chuàng)性、真實性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容文字的真實性、完整性和原創(chuàng)性本站不作任何保證或承諾,請讀者僅作參考,并自行核實相關內(nèi)容。

舉報郵箱:3220065589@qq.com,如涉及版權(quán)問題,請聯(lián)系。