تشخیص کاراکتر نوری Optical Character Recognition – OCR
تشخیص کاراکتر نوری یا Optical Character Recognition – OCR چیست؟
تشخیص کاراکتر نوری (Optical Character Recognition) یا به اختصار اُ سی آر (OCR) به فرایندی گفته میشود که طی آن تصویری از یک متن تایپ شده، دست نوشته یا چاپ شده به متن کدگذاری شدهی ماشینی تبدیل میشود. پس از انجام OCR، متن موجود در این تصاویر معمولا به صورت قابل ویرایش در اختیار کاربر قرار میگیرد.
تصویر ابتدایی که روی آن فرایند اُ سی آر انجام میشود میتواند یک سند اسکن شده، عکسی از یک برگهی اطلاعیه یا تابلوهای تبلیغاتی خیابانی باشد که توسط یک دوربین ثبت شده و یا حتی زیرنویس یک فیلم تلویزیونی باشد.
امروزه روشهای OCR با پیشرفت چشمگیری همراه بودهاند و نرم افزارها و سرویسهای آنلاین مختلفی برای تشخیص متون موجود در تصاویر و کتابهای الکترونیکیِ اسکن شده تولید شده است که قادر به شناسایی کاراکترهای زبانهای مختلف (از جمله زبان فارسی) و فونتهای گوناگون با خطای بسیار پایین میباشند.
فواید و کاربردهای OCR
کاربر میتواند تمام اموری که روی یک متن معمولی قابل انجام است را روی خروجی فرایند OCR اعمال نماید. به عنوان مثال میتوان در متن دیجیتال به دست آمده واژهای را جستجو نمود، آن را به زبانی دیگر ترجمه کرد و یا به وسیلهی خوانندههای متون دیجیتال به محتوای آن گوش فراداد (این کاربرد به ویژه برای افراد نابینا از اهمیت بالایی برخوردار است). به علاوه با توجه به اینکه ذخیره متن به جای تصویر متن، نیازمند فضای کمتری میباشد امکان انتشار یا نگهداری محتوا به صورت کمحجمتر نیز فراهم میشود. محبوبیت OCR به حدی بالاست که در اسکنرهای حرفهای، امکان انجام مستقیم این فرایند روی اسناد اسکن شده در نظر گرفته شده است.
از جمله کاربردهای دیگر اُ سی آر میتوان به تشخیص خودکار شماره پلاک خودرو یا استخراج دادههای مندرج روی پاسپورت و رسیدهای بانکی اشاره نمود که میتواند دخالت انسانی را حد زیادی کاهش داده و منجر به افزایش سرعت عمل سازمانهای مختلف شود.
پیوندهای پیشنهادی تک دیک