أريد سكريبت CMD للتعرف على الكتابة اليدوية باللغة العربية، وتحويلها إلى نص text ، مع جعل مسار الصورة هو نفسه مسار السكريبت، والتعامل مع امتدادات jpg, jpeg, png
لإنشاء سكريبت CMD يقوم بالتعرف على الكتابة اليدوية باللغة العربية وتحويلها إلى نص مستخرَج من صورة، يمكنك استخدام مكتبة Python مثل Tesseract OCR. إليك خطوات إعداد المشروع وسكريبت CMD الخاص بك:
### الخطوات
1. **تثبيت Python**: تأكد من أنك قد قمت بتثبيت Python على جهاز الكمبيوتر الخاص بك. يمكنك تحميله من [الموقع الرسمي](https://www.python.org/downloads/).
2. **تثبيت مكتبة Tesseract**:
- يمكنك تحميل Tesseract OCR من [هنا](https://github.com/tesseract-ocr/tesseract) وتثبيته.
- تأكد من إضافة مسار تثبيت Tesseract إلى متغير البيئة PATH.
3. **تثبيت مكتبات Python المطلوبة**:
افتح CMD وابدأ بتثبيت المكتبات اللازمة عبر الأمر التالي:
```bash
pip install pytesseract pillow
```
4. **إنشاء ملف Python**:
قم بإنشاء ملف Python جديد باسم `ocr_handwriting.py`، وأدخل فيه الكود التالي:
```python
import pytesseract
from PIL import Image
import sys
import os
# تعيين مسار تثبيت Tesseract إذا كان غير موجود في PATH
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' # قم بتعديل هذا المسار إذا لزم الأمر
def recognize_handwriting(image_path):
try:
# فتح الصورة
image = Image.open(image_path)
# استخدام Tesseract للتعرف على النص
text = pytesseract.image_to_string(image, lang='ara')
return text
except Exception as e:
return str(e)
if __name__ == "__main__":
# الحصول على مسار السكريبت
script_dir = os.path.dirname(os.path.abspath(__file__))
# تحديد امتدادات الصور
valid_extensions = ['.jpg', '.jpeg', '.png']
# البحث عن ملفات الصور في مسار السكريبت
for file in os.listdir(script_dir):
if os.path.splitext(file)[1].lower() in valid_extensions:
image_path = os.path.join(script_dir, file)
text = recognize_handwriting(image_path)
print(f'النص المستخرج من {file}:\n{text}\n')
```
5. **إنشاء سكريبت CMD**:
قم بإنشاء ملف نصي جديد وأعد تسميته إلى `run_ocr.cmd`، ثم أضف فيه الكود التالي:
```cmd
@echo off
python ocr_handwriting.py
pause
```
### التشغيل
1. ضع كل من `ocr_handwriting.py` و `run_ocr.cmd` في نفس المجلد.
2. ضع ضمن هذا المجلد الصور التي ترغب في معالجة كتابتها اليدوية.
3. نفذ ملف `run_ocr.cmd` بالنقر المزدوج عليه.
سيقوم السكريبت بالتعرف على الكتابة اليدوية في الصور وتحويلها إلى نص وعرض النتائج في نافذة CMD.
### ملاحظات
- تأكد من أن لديك اللغة العربية مثبَّتة في Tesseract. يمكنك تثبيتها بتحميل ملفات اللغة العربية من مكتبة Tesseract.
- قد تحتاج إلى ضبط معلمات معينة في Tesseract للحصول على نتائج أفضل، حسب جودة الصورة.