23.11.2024
Lütfen bu sayfayı yer imlerine ekleyin.
Optik karakter tanıma (OCR)
daktilo edilmiş, elle yazılmış veya basılı metin görüntülerinin, taranmış bir belgeden, bir belgenin fotoğrafından, bir sahne fotoğrafından (örneğin, bir manzaradaki tabelalar ve reklam panolarındaki metinler) makinede kodlanmış metne elektronik veya mekanik olarak dönüştürülmesidir. fotoğraf) veya bir görüntünün üzerine bindirilmiş altyazı metninden (örneğin: bir televizyon yayınından).
Pasaportlar, faturalar, banka hesap özetleri, bilgisayarlı makbuzlar, kartvizitler, postalar, statik verilerin çıktıları veya diğer uygun belgeler olsun, basılı kağıt kayıtlardan veri girmek için yaygın olarak kullanılır - basılı metinleri dijitalleştirmenin yaygın bir yöntemidir; elektronik olarak düzenlenebilir, aranabilir, daha kompakt bir şekilde saklanabilir, çevrimiçi görüntülenebilir ve bilişsel bilgi işlem, makine çevirisi ve (çıkarılmış) metinden sp'ye gibi makine süreçlerinde kullanılabilir OCR, yapay zekayı kapsayan örüntü tanıma çalışmasının bir alt alanıdır ve bilgisayar görüşü.
Daha önceki sürümler, bireysel karakterlerin fotoğraflarıyla eğitim gerektiriyordu ve her seferinde tek bir yazı tipi üzerinde çalışıyordu. Yazı tiplerinin çoğu için yüksek derecede tanımlama doğruluğu sağlayabilen gelişmiş sistemler ve bir dizi dijital resim dosyası formatını girdi olarak kabul eden sistemler artık yaygın olarak bulunmaktadır. Bazı sistemler, grafikler, sütunlar ve diğer metinsel olmayan bileşenler dahil olmak üzere, orijinal sayfaya mümkün olduğunca benzeyen biçimlendirilmiş çıktıyı çoğaltabilir.