تبدیل فایل های تصویر یا PDF حاوی متن به متن قابل ویرایش با کمک گوگل درایو
احتمالا برای شما هم بارها پیش آمده است که یک تصویر یا فایل PDF حاوی یک متن تایپ شده در اختیار داشتهاید و قصد داشتهاید آن را به یک متن قابل انتخاب و قابل ویرایش تبدیل کنید. تصویری که میتواند یک صفحه اسکن شده از یک کتاب باشد یا از نوشتهای روی یک تابلو با استفاده از دوربین گوشی همراه تهیه شده باشد.
در چنین شرایطی احتمالا سر-راستترین فکری که به ذهن بسیاری از افراد میرسد تایپ کردن دستی متن است. این موضوع برای متون کوتاه شاید قابل قبول به نظر بیاید. اما اگر با یک کتاب چند صد صفحهای روبرو هستید که در قالب یک فایل PDF ذخیره شده است یا حجم عظیمی از تصاویر حاوی متن را باید در زمانی کوتاه به متن قابل ویرایش تبدیل کنید بهتر است فکر تایپ کردن آنها را از ذهنتان بیرون کنید.
کپی کردن متن موجود در تصویر و استفاده از آن در مقالهای که در حال نگارش آن هستید و همچنین ایجاد تغییراتی در متن یا نوع فونت و ابعاد آن برای چاپ از جمله مواردی هستند که استخراج متن موجود در تصاویر را به موضوعی با اهمیت برای بسیاری از کاربران تبدیل میکند.
خوشبختانه اینجا هم فناوری شما را دست تنها نمیگذارد. شما میتوانید با استفاده از فرایندی موسوم به OCR (یا Optical Character Recognition) تصویر متون را به متن معمولی تبدیل کنید.
بیشتر بخوانید: تشخیص کاراکتر نوری یا Optical Character Recognition – OCR چیست؟
اگر دنبال یکی از سادهترین روشهای تبدیل تصاویر حاوی متن به متن معمولی هستید در این مقاله با نحوه انجام این کار از طریق گوگل درایو (Google Drive) آشنا میشوید.
چگونه میتوانم متن موجود در تصاویر یا فایل های PDF را با کمک گوگل درایو از آنها استخراج کنم؟
برای انجام این کار نیاز به نصب نرم افزارهای اضافی ندارید. تنها کافیست روی رایانه خود که به اینترنت متصل شده است مراحل ساده زیر را به ترتیب دنبال کنید:
گام اول: مرورگر وب خود را باز کرده و به نشانی https://drive.google.com مراجعه کنید.
گام دوم: در صورت نیاز، به حساب کاربری خود در گوگل لاگین کنید.
گام سوم: فایل تصویر (با فرمت JPEG یا PNG و GIF) و یا فایل PDF خود را در گوگل درایو آپلود کنید.
گام چهارم: روی فایل خود راست کلیک کنید و از منوی زمینه ظاهر شده گزینه Open with -> Google Docs را انتخاب کنید.
اندکی صبر کنید تا محتویات متنی موجود در فایل به صورت یک متن قابل ویرایش در قالب یک فایل Google Docs برای شما آماده شود. خوشبختانه گوگل درایو به صورت خودکار زبان این متن را تشخیص میدهد. در تصویر زیر میتوانید نتیجه انجام این کار را روی یک قطعه متن کوتاه مشاهده کنید. تصویر اصلی نیز بالای نتیجه استخراج متن دیده میشود.
شما میتوانید متن حاصل را کپی کنید یا فایل مربوطه را از فضای گوگل درایو خود دانلود کنید. توجه داشته باشید که این متن ممکن است نیاز به تصحیح داشته باشد. همچنین احتمالا لازم است فرمت آن را به شیوه موردنظر خود تغییر دهید، فونت و ابعاد آن را تنظیم کنید و به هم ریختگیهای موجود در متن را مرتب کنید. با این وجود در حالت معمولی استفاده از این روش در مقایسه با تایپ دستی کل متن به مراتب وقت کمتری از شما میگیرد.
چند نکته در مورد تبدیل تصاویر به متن قابل ویرایش با استفاده از گوگل درایو
آیا این روش برای OCR عبارات نوشته شده به زبان فارسی نیز قابل استفاده است؟
نرم افزارهای زیادی برای انجام OCR وجود دارد که بسیاری از آنها در پشتیبانی از زبانهای مختلف دچار نقایص و کمبودهایی هستند یا این امکان را در ازای پرداخت هزینه برای کابران خود فراهم میکنند. اما خوشبختانه همانطور که در تصویر بالا مشاهده میکنید گوگل انجام این کار را برای بسیاری از زبانها از جمله زبان فارسی به صورت رایگان فراهم کرده است.
چگونه بهترین نتیجه را با کمترین اشتباه به دست بیاورم؟
به طور کلی کیفیت استخراج ماشینی متن از تصویر به فاکتورهای مختلفی بستگی دارد. کیفیت مناسب و وضوح بالای تصویر، نور و ابعاد مناسب آن و اینکه متن موجود در تصویر با فونت های متداول نگاشته شده باشد از جمله مهمترین عواملی هستند که باعث میشود نتیجه انجام OCR خطای کمتری داشته باشد.
از سوی دیگر تصاویر مبهم، تاریک و حاوی متون نوشته شده با فونت های تزئینی یا غیر مرسوم و همچنین دست نوشته ها احتمال داشتن خطا در نتیجه را افزایش میدهد.
شما هم میتوانید نظر یا سوالهای خود را در مورد این مقاله در بخش دیدگاه ها با ما در میان بگذارید. اگر از گوگل درایو برای استخراج متن از تصویر استفاده کردهاید تجربه خود را توصیف کنید؟ اگر هم از ابزار دیگری برای انجام این کار استفاده کردهاید خوشحال میشویم نتیجه آن را با ما به اشتراک بگذارید.
سلام من Google doc رو دانلود کردم ولی وقتی میزنم باز کردن با این برنامه جز پیش فرض ها نمیاد بالا . چکار کنم؟