OCR مخفف عبارت(Optical Character Recognition) است و به مفهوم بازشناسی خودکار متون موجود در تصاویر و تبدیل آنها به متون قابل جستجو و ویرایش توسط رایانه. تصویر غالبا شامل تعدادی پیکسل با رنگهای مختلف و سطوح روشنایی گوناگون است. از دید انسان، یک سند تصویری ممکن است ارزش اطلاعاتی زیادی داشته باشد، لیکن از دید رایانه تصویر یک سند با تصویر یک منظره تفاوتی ندارد، چرا که هر دوی آنها مجموعه‌ای از پیکسل‌ها هستند. نرم افزارهای OCR مثل یک نفر تایپیست، متن سند را می‌خوانند و آن را به قالب مناسب برای ذخیره در رایانه تبدیل می‌کنند. معمولاً یک اسکنر، تصویر سند را برای OCR فراهم می‌کند. نرم افزار OCR، اشیاء موجود در تصویر سند را که ارقام، حروف، علائم و کلمات هستند، بازشناسی کرده و رشته‌ی متناظر با آن‌ها را در...

بیشتر بخوانید