أريد سكريبت بايثون للتعرف على الكتابة اليدوية باللغة العربية، وتحويلها إلى نص text ، مع جعل مسار الصورة هو نفسه مسار السكريبت، والتعامل مع امتدادات jpg, jpeg, png
يمكنك استخدام مكتبة `Pytesseract` في بايثون للتعرف على الكتابة اليدوية باللغة العربية. تحتاج أيضًا إلى تثبيت مكتبة `Pillow` للتعامل مع الصور. إليك كيفية إعداد السكريبت:
أولاً، تأكد من تثبيت المكتبات المطلوبة:
```bash
pip install pytesseract pillow
```
كما تحتاج إلى تثبيت Tesseract OCR على نظامك. يمكنك تنزيله من [هنا](https://github.com/tesseract-ocr/tesseract) وتأكد من إضافة مسار التثبيت إلى متغير البيئة `PATH`.
بعد ذلك، يمكنك استخدام السكريبت التالي:
```python
import pytesseract
from PIL import Image
import os
# اضبط مسار Tesseract OCR إذا لم يكن موجودا في PATH
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' # تأكد من ضبط المسار حسب مكان التثبيت
# دالة لتحويل الصورة إلى نص
def image_to_text(image_path):
# افتح الصورة باستخدام مكتبة PIL
image = Image.open(image_path)
# استخدام Pytesseract للتعرف على الكتابة اليدوية
text = pytesseract.image_to_string(image, lang='ara') # 'ara' تعني العربية
return text
# مسار الصورة (يفترض أن السكريبت والصورة في نفس المجلد)
image_extensions = ['.jpg', '.jpeg', '.png']
# اجلب جميع الصور في المجلد
for filename in os.listdir():
if any(filename.endswith(ext) for ext in image_extensions):
print(f'تحويل الصورة: {filename}')
extracted_text = image_to_text(filename)
print('النص المستخرج:')
print(extracted_text)
print('-' * 50)
```
### كيفية استخدام السكريبت:
1. احفظ السكريبت أعلاه في ملف `ocr_script.py`.
2. ضع الصور التي تريد تحويلها إلى نص في نفس المجلد.
3. تأكد من ضبط المسار إلى Tesseract في السكريبت حسب مكان تثبيته على جهازك.
4. قم بتشغيل السكريبت باستخدام الأمر:
```bash
python ocr_script.py
```
سيقوم السكريبت بقراءة جميع الصور من المجلد واستخراج النصوص المكتوبة بها، ثم طباعتها في وحدة التحكم.