تبدیل فایل های تصویر یا PDF حاوی متن به متن قابل ویرایش با کمک گوگل درایو

احتمالا برای شما هم بارها پیش آمده است که یک تصویر یا فایل PDF حاوی یک متن تایپ شده در اختیار داشته‌اید و قصد داشته‌اید آن را به یک متن قابل انتخاب و قابل ویرایش تبدیل کنید. تصویری که می‌تواند یک صفحه اسکن شده از یک کتاب باشد یا از نوشته‌ای روی یک تابلو با استفاده از دوربین گوشی همراه تهیه شده باشد.

در چنین شرایطی احتمالا سر-راست‌ترین فکری که به ذهن بسیاری از افراد می‌رسد تایپ کردن دستی متن است. این موضوع برای متون کوتاه شاید قابل قبول به نظر بیاید. اما اگر با یک کتاب چند صد صفحه‌ای روبرو هستید که در قالب یک فایل PDF ذخیره شده است یا حجم عظیمی از تصاویر حاوی متن را باید در زمانی کوتاه به متن قابل ویرایش تبدیل کنید بهتر است فکر تایپ کردن آن‌ها را از ذهن‌تان بیرون کنید.

کپی کردن متن موجود در تصویر و استفاده از آن در مقاله‌ای که در حال نگارش آن هستید و همچنین ایجاد تغییراتی در متن یا نوع فونت و ابعاد آن برای چاپ از جمله مواردی هستند که استخراج متن موجود در تصاویر را به موضوعی با اهمیت برای بسیاری از کاربران تبدیل می‌کند.

خوشبختانه اینجا هم فناوری شما را دست تنها نمی‌گذارد. شما می‌توانید با استفاده از فرایندی موسوم به OCR (یا Optical Character Recognition) تصویر متون را به متن معمولی تبدیل کنید.

بیشتر بخوانید: تشخیص کاراکتر نوری یا Optical Character Recognition – OCR چیست؟

اگر دنبال یکی از ساده‌ترین روش‌های تبدیل تصاویر حاوی متن به متن معمولی هستید در این مقاله با نحوه انجام این کار از طریق گوگل درایو (Google Drive) آشنا می‌شوید.

چگونه می‌توانم متن موجود در تصاویر یا فایل های PDF را با کمک گوگل درایو از آن‌ها استخراج کنم؟

برای انجام این کار نیاز به نصب نرم افزارهای اضافی ندارید. تنها کافیست روی رایانه خود که به اینترنت متصل شده است مراحل ساده زیر را به ترتیب دنبال کنید:

گام اول: مرورگر وب خود را باز کرده و به نشانی https://drive.google.com مراجعه کنید.

گام دوم: در صورت نیاز، به حساب کاربری خود در گوگل لاگین کنید.

گام سوم: فایل تصویر (با فرمت JPEG یا PNG و GIF) و یا فایل PDF خود را در گوگل درایو آپلود کنید.

گام چهارم: روی فایل خود راست کلیک کنید و از منوی زمینه ظاهر شده گزینه Open with -> Google Docs را انتخاب کنید.

تبدیل فایل های تصویر یا PDF حاوی متن به متن قابل ویرایش با کمک گوگل درایو

اندکی صبر کنید تا محتویات متنی موجود در فایل به صورت یک متن قابل ویرایش در قالب یک فایل Google Docs برای شما آماده شود. خوشبختانه گوگل درایو به صورت خودکار زبان این متن را تشخیص می‌دهد. در تصویر زیر می‌توانید نتیجه انجام این کار را روی یک قطعه متن کوتاه مشاهده کنید. تصویر اصلی نیز بالای نتیجه استخراج متن دیده می‌شود.

تبدیل فایل های تصویر یا PDF حاوی متن به متن قابل ویرایش با کمک گوگل درایو

شما می‌توانید متن حاصل را کپی کنید یا فایل مربوطه را از فضای گوگل درایو خود دانلود کنید. توجه داشته باشید که این متن ممکن است نیاز به تصحیح داشته باشد. همچنین احتمالا لازم است فرمت آن را به شیوه موردنظر خود تغییر دهید، فونت و ابعاد آن را تنظیم کنید و به هم ریختگی‌های موجود در متن را مرتب کنید. با این وجود در حالت معمولی استفاده از این روش در مقایسه با تایپ دستی کل متن به مراتب وقت کمتری از شما می‌گیرد.

چند نکته در مورد تبدیل تصاویر به متن قابل ویرایش با استفاده از گوگل درایو

آیا این روش برای OCR عبارات نوشته شده به زبان فارسی نیز قابل استفاده است؟

نرم افزارهای زیادی برای انجام OCR وجود دارد که بسیاری از آن‌ها در پشتیبانی از زبان‌های مختلف دچار نقایص و کمبودهایی هستند یا این امکان را در ازای پرداخت هزینه برای کابران خود فراهم می‌کنند. اما خوشبختانه همانطور که در تصویر بالا مشاهده می‌کنید گوگل انجام این کار را برای بسیاری از زبان‌ها از جمله زبان فارسی به صورت رایگان فراهم کرده است.

چگونه بهترین نتیجه را با کمترین اشتباه به دست بیاورم؟

به طور کلی کیفیت استخراج ماشینی متن از تصویر به فاکتورهای مختلفی بستگی دارد. کیفیت مناسب و وضوح بالای تصویر، نور و ابعاد مناسب آن و اینکه متن موجود در تصویر با فونت های متداول نگاشته شده باشد از جمله مهم‌ترین عواملی هستند که باعث می‌شود نتیجه انجام OCR خطای کمتری داشته باشد.

از سوی دیگر تصاویر مبهم، تاریک و حاوی متون نوشته شده با فونت های تزئینی یا غیر مرسوم و همچنین دست نوشته ها احتمال داشتن خطا در نتیجه را افزایش می‌دهد.

شما هم می‌توانید نظر یا سوال‌های خود را در مورد این مقاله در بخش دیدگاه ها با ما در میان بگذارید. اگر از گوگل درایو برای استخراج متن از تصویر استفاده کرده‌اید تجربه خود را توصیف کنید؟ اگر هم از ابزار دیگری برای انجام این کار استفاده کرده‌اید خوشحال می‌شویم نتیجه آن را با ما به اشتراک بگذارید.

امیرحسین شهسواری

عاشق دنیای رایانه و فناوری به خصوص برنامه نویسی هستم؛ یادگرفتن و البته یاد دادن چیزای جالبی که یاد گرفتم باعث خوشحالیم میشه و از اولویت‌های اصلی زندگیم به حساب میاد. از مدیریت و نوشتن در تک دیک هم واقعا لذت می‌برم :)

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *