2024/11/21
請收藏本頁。 如果閣下可以點擊廣告支持我們,我們將不勝感激。
光學字符識別 (OCR)
是將打字、手寫或打印文本的圖像以電子或機械方式轉換為機器編碼的文本,無論是來自掃描文檔、文檔照片還是場景照片(例如,風景中的標誌和廣告牌上的文本)照片),或來自疊加在圖像上的字幕文本(例如:來自電視廣播)。
廣泛用於從打印的紙質記錄中輸入數據——無論是護照、發票、銀行對賬單、計算機化收據、名片、郵件、靜態數據的打印件或任何其他合適的文檔——它是一種將打印文本數字化的常用方法,因此它們可以以電子方式編輯、搜索、更緊湊地存儲、在線顯示以及用於機器過程,例如認知計算、機器翻譯和(提取)文本到 sp OCR 是模式識別研究的一個子領域,包括人工智能和計算機視覺。
早期版本需要使用單個字符的照片進行培訓,並且一次使用一種字體。能夠為大多數字體提供高度識別精度的高級系統現在已廣泛使用,接受多種數字圖片文件格式作為輸入的系統也是如此。某些系統能夠複製與原始頁面盡可能相似的格式化輸出,包括圖形、列和其他非文本組件。