تشخیص کاراکتر نوری Optical Character Recognition – OCR

تشخیص کاراکتر نوری یا Optical Character Recognition – OCR چیست؟

تشخیص کاراکتر نوری (Optical Character Recognition) یا به اختصار اُ سی آر (OCR) به فرایندی گفته می‌شود که طی آن تصویری از یک متن تایپ شده، دست نوشته یا چاپ شده به متن کدگذاری شده‎‌ی ماشینی تبدیل می‌شود. پس از انجام OCR، متن موجود در این تصاویر معمولا به صورت قابل ویرایش در اختیار کاربر قرار می‌گیرد.

تصویر ابتدایی که روی آن فرایند اُ سی آر انجام می‌شود می‌تواند یک سند اسکن شده، عکسی از یک برگه‌ی اطلاعیه یا تابلوهای تبلیغاتی خیابانی باشد که توسط یک دوربین ثبت شده و یا حتی زیرنویس یک فیلم تلویزیونی باشد.

امروزه روش‌های OCR با پیشرفت چشمگیری همراه بوده‌اند و نرم افزارها و سرویس‌های آنلاین مختلفی برای تشخیص متون موجود در تصاویر و کتاب‌های الکترونیکیِ اسکن شده تولید شده است که قادر به شناسایی کاراکترهای زبان‌های مختلف (از جمله زبان فارسی) و فونت‌های گوناگون با خطای بسیار پایین می‌باشند.

فواید و کاربردهای OCR

کاربر می‌تواند تمام اموری که روی یک متن معمولی قابل انجام است را روی خروجی فرایند OCR اعمال نماید. به عنوان مثال می‌توان در متن دیجیتال به دست آمده واژه‌ای را جستجو نمود، آن را به زبانی دیگر ترجمه کرد و یا به وسیله‌ی خواننده‌های متون دیجیتال به محتوای آن گوش فراداد (این کاربرد به ویژه برای افراد نابینا از اهمیت بالایی برخوردار است). به علاوه با توجه به اینکه ذخیره متن به جای تصویر متن، نیازمند فضای کمتری می‌باشد امکان انتشار یا نگه‌داری محتوا به صورت کم‌حجم‌تر نیز فراهم می‌شود. محبوبیت OCR به حدی بالاست که در اسکنرهای حرفه‌ای، امکان انجام مستقیم این فرایند روی اسناد اسکن شده در نظر گرفته شده است.

از جمله کاربردهای دیگر اُ سی آر می‌توان به تشخیص خودکار شماره پلاک خودرو یا استخراج داده‌های مندرج روی پاسپورت و رسیدهای بانکی اشاره نمود که می‌تواند دخالت انسانی را حد زیادی کاهش داده و منجر به افزایش سرعت عمل سازمان‌های مختلف شود.

او سی آر OCR
نمایی از یک نرم افزار که یک صفحه اسکن شده را با کمک OCR به متن قابل ویرایش تبدیل کرده است

پیوندهای پیشنهادی تک دیک

لینک واژه در ویکیپدیا

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *