OCR چیست؟
OCR مخفف عبارت(Optical Character Recognition) است و به مفهوم بازشناسی خودکار متون موجود در تصاویر و تبدیل آنها به متون قابل جستجو و ویرایش توسط رایانه. تصویر غالبا شامل تعدادی پیکسل با رنگهای مختلف و سطوح روشنایی گوناگون است. از دید انسان، یک سند تصویری ممکن است ارزش اطلاعاتی زیادی داشته باشد، لیکن از دید رایانه تصویر یک سند با تصویر یک منظره تفاوتی ندارد، چرا که هر دوی آنها مجموعهای از پیکسلها هستند. نرم افزارهای OCR مثل یک نفر تایپیست، متن سند را میخوانند و آن را به قالب مناسب برای ذخیره در رایانه تبدیل میکنند. معمولاً یک اسکنر، تصویر سند را برای OCR فراهم میکند. نرم افزار OCR، اشیاء موجود در تصویر سند را که ارقام، حروف، علائم و کلمات هستند، بازشناسی کرده و رشتهی متناظر با آنها را در...
بیشتر بخوانید