05/10/1403
لطفا این صفحه را نشانه گذاری کنید.
تشخیص نویسه نوری (OCR)
تبدیل الکترونیکی یا مکانیکی تصاویر متن تایپ شده، دست نویس یا چاپ شده به متن کدگذاری شده ماشینی است، خواه از یک سند اسکن شده، یک عکس از یک سند، یک عکس صحنه (به عنوان مثال، متن روی علائم و بیلبوردهای تبلیغاتی در یک منظره عکس)، یا از متن زیرنویس قرار داده شده بر روی یک تصویر (به عنوان مثال: از یک پخش تلویزیونی).
به طور گسترده ای برای وارد کردن داده ها از سوابق کاغذی چاپ شده - اعم از گذرنامه، صورتحساب، صورتحساب بانکی، رسید رایانه ای، کارت ویزیت، پست، پرینت داده های ثابت، یا هر سند مناسب دیگری استفاده می شود - این یک روش رایج برای دیجیتالی کردن متون چاپی است تا بتوانند به صورت الکترونیکی ویرایش شود، جستجو شود، فشردهتر ذخیره شود، به صورت آنلاین نمایش داده شود، و در فرآیندهای ماشینی مانند محاسبات شناختی، ترجمه ماشینی، و (استخراج) متن به sp OCR مورد استفاده قرار گیرد، زیرشاخهای از مطالعه تشخیص الگو است که شامل هوش مصنوعی و بینایی کامپیوتر.
نسخههای قبلی نیاز به آموزش با عکسهای شخصیتهای فردی داشتند و هر بار روی یک تایپ فیس کار میکردند. سیستم های پیشرفته ای که قادر به ارائه درجه بالایی از دقت شناسایی برای اکثر حروف چاپی هستند، اکنون به طور گسترده در دسترس هستند، همانطور که سیستم هایی که تعدادی فرمت فایل تصویر دیجیتال را به عنوان ورودی می پذیرند، در حال حاضر به طور گسترده در دسترس هستند. سیستمهای خاصی میتوانند خروجیهای قالببندیشده را که تا حد امکان شبیه به صفحه اصلی است، از جمله گرافیک، ستونها و سایر اجزای غیر متنی تکرار کنند.