5 خدمات OCR مجانية على الإنترنت تم اختبارها ومراجعتها

هل لديك مستند PDF(PDF document) أو صورة تود تحويلها إلى نص؟ في الآونة الأخيرة ، أرسل لي شخص ما مستندًا في البريد أحتاجه لتحريره وإرساله مرة أخرى مع التصحيحات. لم يتمكن الشخص من تحديد موقع نسخة رقمية ، لذلك تم تكليفي بتحويل كل هذا النص إلى تنسيق رقمي.

لم تكن هناك طريقة لقضاء ساعات في كتابة كل شيء مرة أخرى ، لذلك انتهى بي الأمر بالتقاط صورة لطيفة عالية الجودة للمستند ثم شق طريقي عبر مجموعة من خدمات التعرف الضوئي على الحروف(OCR) عبر الإنترنت لمعرفة أي منها سيعطيني الأفضل النتائج.

في هذه المقالة ، سوف أتصفح موقعين من مواقعي المفضلة لـ OCR المجانية. تجدر الإشارة إلى أن معظم هذه المواقع توفر خدمة مجانية أساسية ومن ثم خيارات مدفوعة إذا كنت تريد ميزات إضافية مثل الصور الكبيرة ومستندات PDF متعددة الصفحات ولغات الإدخال المختلفة وما إلى ذلك.

من الجيد أيضًا أن تعرف مسبقًا أن معظم هذه الخدمات لن تتمكن من مطابقة تنسيق المستند الأصلي. هذه بشكل أساسي لاستخراج النص وهذا كل شيء. إذا كنت بحاجة إلى أن يكون كل شيء بتنسيق أو تنسيق(layout or format) معين ، فسيتعين عليك القيام بذلك يدويًا بمجرد حصولك على كل النص من OCR .

بالإضافة إلى ذلك ، ستأتي أفضل النتائج للحصول على النص من المستندات بدقة 200 إلى 400 نقطة في البوصة(DPI resolution) . إذا كانت لديك صورة DPI(DPI image) منخفضة ، فلن تكون النتائج جيدة.

أخيرًا ، كان هناك الكثير من المواقع التي اختبرتها ولم تعمل للتو(t work) . إذا كنت تستخدم ميزة التعرف الضوئي على الحروف(OCR) عبر الإنترنت مجانًا من Google ، فسترى مجموعة من المواقع ولكن العديد من المواقع في النتائج العشرة الأولى لم تكمل التحويل. قد تنتهي مهلة البعض ، والبعض الآخر قد يعرض أخطاء والبعض الآخر عالق للتو في صفحة "التحويل" ، لذلك لم أكلف نفسي عناء ذكر هذه المواقع.

لكل موقع ، اختبرت وثيقتين لمعرفة مدى جودة المخرجات. بالنسبة لاختباراتي ، قمت ببساطة باستخدام iPhone 5S الخاص بي لالتقاط صورة لكلا المستندين ثم تحميلهما مباشرة إلى مواقع الويب للتحويل.

في حال كنت تريد أن ترى شكل الصور التي استخدمتها في الاختبار ، فقد أرفقتها هنا: Test1 و Test2 . لاحظ أن هذه ليست إصدارات الدقة الكاملة للصور المأخوذة من الهاتف. لقد استخدمت الصورة كاملة الدقة(resolution image) عند التحميل على المواقع.

اون لاين

يعد OnlineOCR.net(OnlineOCR.net) موقعًا نظيفًا وبسيطًا قدم نتائج جيدة جدًا في الاختبار الذي أجريته. الشيء الرئيسي الذي يعجبني فيه هو أنه لا يحتوي على الكثير من الإعلانات في كل مكان ، وهو ما يحدث عادةً مع هذه الأنواع من مواقع الخدمات المتخصصة .(niche service)

OCR على الإنترنت مجانًا

للبدء ، حدد ملفك وانتظر حتى(file and wait till) ينتهي التحميل. الحجم الأقصى للتحميل لهذا الموقع هو 100 ميغا بايت. إذا قمت بالتسجيل للحصول على حساب مجاني ، فستحصل على بعض الميزات الإضافية مثل حجم التحميل الأكبر ، وملفات PDF(PDFs) متعددة الصفحات ، ولغات الإدخال المختلفة ، والمزيد من التحويلات في الساعة ، وما إلى ذلك.

بعد ذلك ، اختر لغة الإدخال(input language) الخاصة بك ثم اختر تنسيق الإخراج(output format) . يمكنك الاختيار من بين Word أو Excel أو Plain Text . انقر فوق(Click) الزر " تحويل(Convert) " وسترى النص المعروض في الأسفل في مربع مع رابط التنزيل(download link) .

إخراج ocr

إذا كان كل ما تريده هو النص ، فما عليك سوى نسخه ولصقه(copy and paste) من المربع. ومع ذلك ، أقترح عليك تنزيل مستند Word(Word document) لأنه يقوم بعمل رائع بشكل مدهش في الحفاظ على تخطيط المستند الأصلي.

على سبيل المثال ، عندما فتحت مستند Word(Word document) للاختبار الثاني ، فوجئت عندما وجدت أن المستند يحتوي على جدول بثلاثة أعمدة ، تمامًا كما في الصورة.

إخراج OCR عبر الإنترنت

من بين جميع المواقع ، كان هذا هو الأفضل على الإطلاق. الأمر يستحق التسجيل تمامًا إذا كنت بحاجة إلى إجراء الكثير من التحويلات.

للتأكد من اكتمالها ، سأقوم أيضًا بالربط بملفات الإخراج التي تم إنشاؤها بواسطة كل خدمة حتى تتمكن من رؤية النتائج بنفسك. فيما يلي النتائج من OnlineOCR : Test1 Doc و Test2 Doc(Test1 Doc and Test2 Doc) .

لاحظ أنه عند فتح مستندات Word هذه على جهاز الكمبيوتر الخاص بك ، ستتلقى رسالة في Word تفيد بأنه من الإنترنت وتم تعطيل التحرير . (Internet and editing)هذا جيد تمامًا لأن Word لا(Word doesn) يثق في المستندات من الإنترنت(Internet) ولا يتعين عليك فعلاً تمكين التحرير إذا كنت ترغب فقط في عرض المستند.

i2OCR

هناك موقع آخر أعطى نتائج جيدة وهو i2OCR . العملية متشابهة جدًا: اختر لغتك ، ملفك ، ثم اضغط على Extract Text .

i2ocr

سيتعين عليك الانتظار دقيقة أو دقيقتين هنا لأن هذا الموقع يستغرق وقتًا أطول قليلاً. أيضًا ، في الخطوة 2(Step 2) ، تأكد من أن صورتك تظهر في الجانب الأيمن لأعلى في المعاينة ، وإلا ستحصل على مجموعة من الثرثرة كإخراج. لسبب ما ، كانت الصور من جهاز iPhone الخاص بي تظهر في الوضع الرأسي(portrait mode) على جهاز الكمبيوتر الخاص بي ، ولكن بشكل أفقي عندما قمت بتحميلها إلى هذا الموقع.

خرج i2ocr

اضطررت إلى فتح الصورة يدويًا في أحد تطبيقات تحرير الصور ، وتدويرها 90 درجة ، ثم تدويرها مرة أخرى إلى الوضع الرأسي ثم حفظها مرة أخرى. بمجرد(Once) الانتهاء ، قم بالتمرير لأسفل وسيظهر لك معاينة للنص مع زر تنزيل(download button) .

حقق هذا الموقع أداءً جيدًا مع مخرجات الاختبار الأول ، لكنه لم يكن جيدًا في الاختبار الثاني الذي كان يحتوي على تخطيط العمود(column layout) . فيما يلي نتائج i2OCR: Test1 Doc و Test2 Doc(Test1 Doc and Test2 Doc) .

FreeOCR

سيأخذ موقع Free-OCR.com صورك ويحولها(Free-OCR.com) إلى نص عادي(plain text) . ليس لديها خيار للتصدير إلى تنسيق Word(Word format) . اختر ملفك وحدد لغة ثم انقر فوق ابدأ(Start) .

الموقع سريع وستحصل على الإخراج بسرعة إلى حد ما. ما عليك سوى النقر فوق(Just click) الارتباط لتنزيل الملف النصي(text file) على جهاز الكمبيوتر الخاص بك.

فريوكر

كما هو الحال مع NewOCR المذكورة أدناه ، فإن هذا الموقع يستغل كل حرف T في المستند. ليس لدي أي فكرة عن سبب قيامه بذلك ، ولكن لسبب غريب قام كل من هذا الموقع و NewOCR(site and NewOCR) بذلك. ليس تغييرها مشكلة كبيرة ، لكنها عملية شاقة لا يجب عليك فعلها.

فيما يلي نتائج FreeOCR : Test1 Doc و Test2 Doc(Test1 Doc and Test2 Doc) .

ABBYY FineReader عبر الإنترنت

من أجل استخدام FineReader Online ، يجب عليك التسجيل للحصول على حساب ، والذي يمنحك نسخة تجريبية مجانية مدتها 15 يومًا لـ OCR تصل إلى 10 صفحات مجانًا. إذا كنت تحتاج فقط إلى إجراء OCR(OCR) لمرة واحدة لبضع صفحات ، فيمكنك استخدام هذه الخدمة. تأكد(Make) من النقر فوق ارتباط التحقق(verify link) في رسالة البريد الإلكتروني للتأكيد(confirmation email) بعد التسجيل.

finereader عبر الإنترنت

انقر فوق التعرف(Recognize) في الجزء العلوي ثم انقر فوق تحميل(Upload) لتحديد ملفك. اختر لغتك ، تنسيق الإخراج ، ثم انقر فوق التعرف(Recognize) في الأسفل. هذا الموقع لديه واجهة نظيفة ولا توجد إعلانات أيضًا.

في الاختبارات التي أجريتها ، كان هذا الموقع قادرًا على الحصول على النص من مستند الاختبار(test document) الأول ، ولكنه كان هائلاً للغاية عندما فتحت مستند Word(Word doc) ، لذلك انتهى بي الأمر بفعل ذلك مرة أخرى واختيار نص عادي(Plain Text) كتنسيق الإخراج(output format) .

بالنسبة للاختبار الثاني مع الأعمدة ، كان مستند Word(Word document) فارغًا ولم أتمكن حتى من العثور على النص. لست متأكدًا مما حدث هناك ، لكن لا يبدو أنه قادر على التعامل مع أي شيء آخر غير الفقرات البسيطة. فيما يلي نتائج FineReader : Test1 Doc و Test2 Doc.

نيو أوكر

الموقع التالي ، NewOCR.com ، كان جيدًا ، لكن ليس بجودة الموقع الأول تقريبًا. أولاً ، إنه يحتوي على إعلانات ، لكن لحسن الحظ ليس طنًا. حدد ملفك أولاً ثم انقر فوق الزر معاينة(Preview) .

تحميل الصور

يمكنك بعد ذلك تدوير الصورة وضبط المنطقة التي تريد البحث فيها عن نص. يشبه إلى حد كبير كيفية عمل عملية المسح(scanning process) على جهاز كمبيوتر به ماسح ضوئي متصل.

صورة ocr

إذا كان المستند يحتوي على أعمدة متعددة ، فيمكنك التحقق من زر تحليل تخطيط الصفحة( Page layout analysis) وسيحاول تقسيم النص إلى أعمدة. انقر فوق(Click) الزر OCR(OCR button) ، وانتظر بضع ثوانٍ حتى يكتمل ، ثم قم بالتمرير لأسفل إلى أسفل عند تحديث الصفحة.

في الاختبار الأول ، حصل على كل النص بشكل صحيح ، ولكن لسبب ما استخدم الأحرف الكبيرة في كل حرف T في المستند! لا فكرة عن سبب قيامها بذلك ، لكنها فعلت. في الاختبار الثاني مع تمكين تحليل الصفحة(page analysis) ، حصل على معظم النص ، لكن التخطيط كان معطلاً تمامًا.

فيما يلي النتائج من NewOCR : Test1 Doc و Test2 Doc.

خاتمة

كما ترى ، لا يمنحك التطبيق المجاني نتائج جيدة جدًا في معظم الأوقات لسوء الحظ. الموقع الأول المذكور هو الأفضل على الإطلاق لأنه لم يقم بعمل رائع في التعرف على كل النص فحسب ، بل تمكن أيضًا من الاحتفاظ بتنسيق المستند الأصلي.

إذا كنت تحتاج فقط إلى نص ، على الرغم من ذلك ، يجب أن تكون معظم المواقع المذكورة أعلاه قادرة على القيام بذلك نيابة عنك. إذا كان لديك أي أسئلة ، فلا تتردد في التعليق. استمتع!



About the author

أهلاً! أنا مبرمج كمبيوتر بخبرة تزيد عن 10 سنوات في هذا المجال. أنا متخصص في تطوير وصيانة البرامج للهواتف الذكية وتحديثات Windows. بالإضافة إلى ذلك ، أقدم خدماتي كممثل شهري لدعم عملاء البريد الإلكتروني.



Related posts