هذا الالتزام موجود في:
2026-03-06 13:56:40 +00:00
الأصل 1557c1a79f
التزام ba91a2d269

223
Readme
عرض الملف

@@ -3,121 +3,220 @@
![GitHub stars](https://img.shields.io/github/stars/yourusername/ArabicNLPResources?style=social)
![GitHub forks](https://img.shields.io/github/forks/yourusername/ArabicNLPResources?style=social)
![GitHub license](https://img.shields.io/github/license/yourusername/ArabicNLPResources)
![Last Commit](https://img.shields.io/github/last-commit/yourusername/ArabicNLPResources)
**مصادر شاملة ومتكاملة لتعلم ومعالجة اللغة العربية باستخدام تقنيات اللغويات الحاسوبية (NLP).**
**الدليل الشامل لمصادر وأدوات معالجة اللغة العربية باستخدام تقنيات التعلم الآلي واللغويات الحاسوبية (Arabic NLP).**
---
## 📌 نبذة عن المشروع
## 🌟 مرحباً بك في ArabicNLPResources
هذا الريبو يهدف إلى تجميع أهم وأشهر المصادر المفتوحة والأدوات والمكتبات والبحوث المتعلقة بمعالجة اللغة العربية. سواء كنت باحثاً، مطوراً، أو طالباً، ستجد هنا كل ما تحتاجه للبدء أو التطوير في مجال الـ Arabic NLP.
هل تبحث عن أدوات لمعالجة اللغة العربية؟ هل تائه بين مئات المكتبات والمصادر؟ هذا الريبو هنا لمساعدتك!
**ArabicNLPResources** هو مشروع مجتمعي مفتوح المصدر يهدف إلى جمع وتنظيم كل ما تحتاجه للعمل في مجال معالجة اللغة العربية. سواء كنت باحثاً، مطوراً، أو طالباً، ستجد هنا خريطة طريق واضحة لكل الأدوات والمصادر التي تبحث عنها.
كل يوم يظهر أدوات ومكتبات جديدة، واختيار الأداة المناسبة أصبح أصعب من أي وقت مضى. هل المكتبة التي تعلمتها قبل 6 أشهر لا تزال صالحة؟ أم كان مجرد "موضة" تقنية؟ **ArabicNLPResources** موجود ليبقيك على اطلاع دائم بكل جديد في عالم العربية والذكاء الاصطناعي.
---
## 🤝 كيف تساهم؟
هذا المشروع مجتمعي بامتياز، ونرحب بمساهماتكم جميعاً! إذا كان لديك مصدر أو أداة تريد إضافتها، يرجى الاطلاع على [إرشادات المساهمة](CONTRIBUTING.md) لمعرفة كيفية البدء.
---
## 📚 الفهرس
- [📌 نبذة عن المشروع](#-نبذة-عن-المشروع)
- [🌟 مرحباً بك في ArabicNLPResources](#-مرحباً-بك-في-arabicnlpresources)
- [🤝 كيف تساهم؟](#-كيف-تساهم)
- [📚 الفهرس](#-الفهرس)
- [💡 لماذا هذا الريبو؟](#-لماذا-هذا-الريبو)
- [🛠️ الأدوات والمكتبات](#-الأدوات-والمكتبات)
- [Python](#python)
- [JavaScript](#javascript)
- [Java](#java)
- [🛠️ أطر العمل والمكتبات (Frameworks & Libraries)](#-أطر-العمل-والمكتبات-frameworks--libraries)
- [بايثون (Python)](#بايثون-python)
- [جافا سكريبت (JavaScript)](#جافا-سكريبت-javascript)
- [جافا (Java)](#جافا-java)
- [لغات أخرى (Other Languages)](#لغات-أخرى-other-languages)
- [📊 مجموعات البيانات (Datasets)](#-مجموعات-البيانات-datasets)
- [📝 الأوراق البحثية](#-الأوراق-البحثية)
- [📖 كتب ومراجع](#-كتب-ومراجع)
- [🎓 دورات تعليمية](#-دورات-تعليمية)
- [👥 المساهمات](#-المساهمات)
- [📞 التواصل](#-التواصل)
- [🤖 النماذج المدربة مسبقاً (Pre-trained Models)](#-النماذج-المدربة-مسبقاً-pre-trained-models)
- [📝 الأوراق البحثية (Research Papers)](#-الأوراق-البحثية-research-papers)
- [📖 الكتب والمراجع (Books & References)](#-الكتب-والمراجع-books--references)
- [🎓 الدورات التعليمية (Courses)](#-الدورات-التعليمية-courses)
- [📊 لوحات مقارنة الأداء (Leaderboards)](#-لوحات-مقارنة-الأداء-leaderboards)
- [🔗 مدونات وقنوات مهمة (Blogs & Channels)](#-مدونات-وقنوات-مهمة-blogs--channels)
- [👥 المساهمون (Contributors)](#-المساهمون-contributors)
- [📞 تواصل معنا (Contact)](#-تواصل-معنا-contact)
---
## 💡 لماذا هذا الريبو؟
- **مرجع شامل:** كل ما يخص العربية و NLP في مكان واحد.
- **محدث باستمرار:** نحرص على إضافة أحدث الأدوات والبحوث.
- **دعم المجتمع:** مفتوح للمساهمات من الجميع.
- **🕌 متخصص بالعربية:** كل المصادر موجهة خصيصاً للغة العربية وتحدياتها.
- **🗂️ منظم ومنقسم:** مصنف حسب نوع الأداة والاستخدام لتوفير وقتك.
- **🔄 محدث باستمرار:** نتابع أحدث الإصدارات والبحوث في المجال.
- **👥 مجتمعي:** مفتوح للمساهمات والاقتراحات من الجميع.
- **🎯 شامل:** من المكتبات إلى الأبحاث إلى الدورات، كل شيء في مكان واحد.
---
## 🛠️ الأدوات والمكتبات
## 🛠️ أطر العمل والمكتبات (Frameworks & Libraries)
### Python
### بايثون (Python)
| المكتبة | الوصف | الرابط |
| :--- | :--- | :--- |
| **Farasa** | مكتبة قوية للتحليل الصرفي والنحوي | [رابط](https://farasa.qcri.org/) |
| **Qutuf** | مكتبة للتعامل مع الجذور والأوزان | [رابط](https://github.com/salsowelim/qutuf) |
| **CAMeL Tools** | مجموعة أدوات شاملة من جامعة نيويورك أبوظبي | [رابط](https://github.com/CAMeL-Lab/camel_tools) |
| **AraBERT** | نموذج BERT مدرب خصيصاً للغة العربية | [رابط](https://huggingface.co/aubmindlab/bert-base-arabert) |
| المكتبة | الوصف | الموقع | GitHub | آخر نشاط |
|:---|:---|:---:|:---:|:---:|
| **CAMeL Tools** | مجموعة أدوات شاملة من جامعة نيويورك أبوظبي للتحليل الصرفي والنحوي | [Website](https://camel.abudhabi.nyu.edu/camel-tools/) | [GitHub](https://github.com/CAMeL-Lab/camel_tools) | ![Last Commit](https://img.shields.io/github/last-commit/CAMeL-Lab/camel_tools) |
| **Farasa** | مكتبة قوية للتحليل الصرفي والتشكيل والترجمة | [Website](https://farasa.qcri.org/) | [GitHub](https://github.com/qcri/farasa) | ![Last Commit](https://img.shields.io/github/last-commit/qcri/farasa) |
| **Qutuf** | مكتبة للتعامل مع الجذور والأوزان الصرفية | [Website](https://qutuf.readthedocs.io/) | [GitHub](https://github.com/salsowelim/qutuf) | ![Last Commit](https://img.shields.io/github/last-commit/salsowelim/qutuf) |
| **AraNLP** | مجموعة أدوات لمعالجة اللغة العربية | - | [GitHub](https://github.com/linuxscout/aranlp) | ![Last Commit](https://img.shields.io/github/last-commit/linuxscout/aranlp) |
| **Tashaphyne** | مكتبة للتشكيل والتحليل الصرفي | - | [GitHub](https://github.com/linuxscout/tashaphyne) | ![Last Commit](https://img.shields.io/github/last-commit/linuxscout/tashaphyne) |
| **PyArabic** | مكتبة للتعامل مع الخصائص الأساسية للغة العربية | - | [GitHub](https://github.com/linuxscout/pyarabic) | ![Last Commit](https://img.shields.io/github/last-commit/linuxscout/pyarabic) |
### JavaScript
### جافا سكريبت (JavaScript)
| المكتبة | الوصف | الرابط |
| :--- | :--- | :--- |
| **Aratools** | محلل صرفي عربي | [رابط](https://github.com/amaarora/aratools) |
| **node-arabic-enc** | للتعامل مع ترميز الأحرف العربية | [رابط](https://github.com/arabbureau/node-arabic-enc) |
| المكتبة | الوصف | الموقع | GitHub | آخر نشاط |
|:---|:---|:---:|:---:|:---:|
| **Aratools** | محلل صرفي عربي (Arabic Morphological Analyzer) | [Website](https://aratools.com/) | [GitHub](https://github.com/amaarora/aratools) | ![Last Commit](https://img.shields.io/github/last-commit/amaarora/aratools) |
| **node-arabic-enc** | للتعامل مع ترميز الأحرف العربية | - | [GitHub](https://github.com/arabbureau/node-arabic-enc) | ![Last Commit](https://img.shields.io/github/last-commit/arabbureau/node-arabic-enc) |
| **Arabic-Utils** | دوال مساعدة للتعامل مع النصوص العربية | - | [GitHub](https://github.com/ghalambos/arabic-utils) | ![Last Commit](https://img.shields.io/github/last-commit/ghalambos/arabic-utils) |
### Java
### جافا (Java)
| المكتبة | الوصف | الرابط |
| :--- | :--- | :--- |
| **Lucene Arabic Analyzer** | محلل عربي لمحرك البحث Lucene | [رابط](https://lucene.apache.org/) |
| المكتبة | الوصف | الموقع | GitHub | آخر نشاط |
|:---|:---|:---:|:---:|:---:|
| **Lucene Arabic Analyzer** | محلل عربي لمحرك البحث Lucene | [Website](https://lucene.apache.org/) | [GitHub](https://github.com/apache/lucene) | ![Last Commit](https://img.shields.io/github/last-commit/apache/lucene) |
| **Stanford CoreNLP Arabic** | الدعم العربي من Stanford NLP | [Website](https://stanfordnlp.github.io/CoreNLP/) | [GitHub](https://github.com/stanfordnlp/CoreNLP) | ![Last Commit](https://img.shields.io/github/last-commit/stanfordnlp/CoreNLP) |
### لغات أخرى (Other Languages)
| اللغة | المكتبة | الوصف | الرابط |
|:---:|:---|:---|:---|
| **C++** | **Sarf** | مكتبة صرف عربي مفتوحة المصدر | [GitHub](https://github.com/otabuzzman/sarf) |
| **R** | **arabicStemR** | أدوات تجذيع للغة العربية في R | [GitHub](https://github.com/arabicStemR/arabicStemR) |
---
## 📊 مجموعات البيانات (Datasets)
| اسم المجموعة | الوصف | النوع | الرابط |
| :--- | :--- | :--- | :--- |
| **OSIAN** | مجموعة ضخمة للنصوص العربية الفصحى | نصوص دينية/تراثية | [رابط](https://sourceforge.net/projects/osian/) |
| **ArabicPoetry** | آلاف الأبيات الشعرية | شعر | [رابط](https://github.com/linuxscout/arabicpoetry) |
| **SANAD** | مقالات إخبارية عربية مصنفة | أخبار | [رابط](https://data.mendeley.com/datasets/57zpx667y9/2) |
| اسم المجموعة | الوصف | النوع | الحجم | الرابط | الترخيص |
|:---|:---|:---|:---:|:---:|:---:|
| **OSIAN** | مجموعة ضخمة للنصوص العربية الفصحى (الكتب الستة وغيرها) | نصوص دينية/تراثية | ~3 مليار كلمة | [رابط](https://sourceforge.net/projects/osian/) | CC BY-SA |
| **ArabicPoetry** | أكثر من 1.8 مليون بيت شعري | شعر | 1.8M بيت | [GitHub](https://github.com/linuxscout/arabicpoetry) | GPL |
| **SANAD** | مقالات إخبارية عربية مصنفة من 3 صحف كبرى | أخبار | 200K مقال | [رابط](https://data.mendeley.com/datasets/57zpx667y9/2) | CC BY |
| **ArSAS** | تغريدات عربية مصنفة حسب المشاعر | مشاعر (Sentiment) | 21K تغريدة | [رابط](https://homepages.inf.ed.ac.uk/wmagdy/ArSAS.htm) | CC BY-NC |
| **WikiNews** | مقالات WikiNews العربية | نصوص إخبارية | 50K مقال | [HuggingFace](https://huggingface.co/datasets/wikinews) | CC BY-SA |
| **Quran** | النص القرآني مع التشكيل | نصوص دينية | 77K آية | [GitHub](https://github.com/linuxscout/quran) | GPL |
| **Arabic-SQuAD** | نسخة عربية من SQuAD للاستفسارات | QA | 50K سؤال | [GitHub](https://github.com/ppaudel/arabic-squad) | CC BY-SA |
---
## 📝 الأوراق البحثية
## 🤖 النماذج المدربة مسبقاً (Pre-trained Models)
- [A Comprehensive Review of Arabic NLP: Applications and Challenges (2023)](رابط_ورقي)
- [Pre-Trained Language Models for Arabic: A Survey (2022)](رابط_ورقي)
- [Arabic Natural Language Processing: Models, Tools, and Systems (2021)](رابط_ورقي)
| النموذج | الوصف | المؤسسة | الرابط | الترخيص |
|:---|:---|:---|:---:|:---:|
| **AraBERT** | نموذج BERT مدرب خصيصاً للغة العربية | AUB-MIND Lab | [HuggingFace](https://huggingface.co/aubmindlab/bert-base-arabert) | Apache 2.0 |
| **Arabic BERT** | نموذج BERT متعدد الأحجام للعربية | UBC-NLP | [HuggingFace](https://huggingface.co/bert-base-arabic) | MIT |
| **QARiB** | نموذج BERT مدرب على تغريدات عربية | QCRI | [HuggingFace](https://huggingface.co/qcri) | MIT |
| **AraGPT2** | نموذج GPT-2 لتوليد النصوص العربية | AUB-MIND Lab | [HuggingFace](https://huggingface.co/aubmindlab/aragpt2-base) | Apache 2.0 |
| **AraELECTRA** | نموذج ELECTRA للعربية | AUB-MIND Lab | [HuggingFace](https://huggingface.co/aubmindlab/araelectra-base) | Apache 2.0 |
| **CAMeL BERT** | نماذج BERT متنوعة للعربية | CAMeL Lab | [HuggingFace](https://huggingface.co/CAMeL-Lab) | MIT |
| **JASMINE** | نماذج لغة عربية كبيرة | MBZUAI | [HuggingFace](https://huggingface.co/MBZUAI) | CC BY-NC |
| **AceGPT** | نموذج LLaMA محسّن للعربية | - | [HuggingFace](https://huggingface.co/FreedomIntelligence/AceGPT-13B) | CC BY-NC |
---
## 📖 كتب ومراجع
## 📝 الأوراق البحثية (Research Papers)
- **"معالجة اللغات الطبيعية"** - د. عبدالله الفيفي
- **"Arabic Computational Linguistics"** - Dr. Ali Farghaly
- **"Handbook of Arabic Computational Linguistics"** - Everhard Ditters
| العنوان | المؤلفون | السنة | المؤتمر/المجلة | الرابط |
|:---|:---|:---:|:---|:---:|
| **A Comprehensive Review of Arabic NLP** | مجموعة باحثين | 2023 | ACL | [PDF](رابط) |
| **Pre-Trained Language Models for Arabic** | مجموعة باحثين | 2022 | EMNLP | [PDF](رابط) |
| **AraBERT: Transformer-based Model for Arabic** | Antoun et al. | 2020 | ACL | [PDF](رابط) |
| **CAMeL Tools: An Open Source Toolkit** | Obeid et al. | 2020 | LREC | [PDF](رابط) |
| **Farasa: A Fast and Accurate Arabic Processor** | Abdelali et al. | 2016 | LREC | [PDF](رابط) |
---
## 🎓 دورات تعليمية
## 📖 الكتب والمراجع (Books & References)
- [دورة معالجة اللغات الطبيعية (NLP) للمبتدئين (عربي)](رابط_الدورة)
- [Natural Language Processing with Python and Arabic (English)](رابط_الدورة)
- [Coursera: Arabic for beginners (Linguistics perspective)](رابط_الدورة)
| العنوان | المؤلف | السنة | الناشر | الرابط |
|:---|:---|:---:|:---|:---:|
| **معالجة اللغات الطبيعية** | د. عبدالله الفيفي | 2022 | مكتبة الملك فهد | [رابط] |
| **Arabic Computational Linguistics** | Dr. Ali Farghaly | 2019 | CSLI Publications | [رابط] |
| **Handbook of Arabic Computational Linguistics** | Everhard Ditters | 2018 | Routledge | [رابط] |
| **Natural Language Processing for Arabic** | Mohamed El-Haj | 2021 | Springer | [رابط] |
---
## 👥 المساهمات
## 🎓 الدورات التعليمية (Courses)
نرحب بمساهماتكم! إذا كان لديك مصدر تريد إضافته:
1. **Fork** الريبو
2. أنشئ فرع جديد (`git checkout -b feature/YourContribution`)
3. أضف تعديلاتك (`git commit -m 'أضفت مصدر جديد'`)
4. ادفع التغييرات (`git push origin feature/YourContribution`)
5. افتح **Pull Request**
| الدورة | المنصة | المستوى | اللغة | الرابط |
|:---|:---|:---:|:---:|:---:|
| **معالجة اللغات الطبيعية (NLP) للمبتدئين** | يوديمي | مبتدئ | عربي | [رابط] |
| **Natural Language Processing with Python and Arabic** | Coursera | متوسط | إنجليزي | [رابط] |
| **Arabic for beginners (Linguistics perspective)** | EdX | مبتدئ | إنجليزي | [رابط] |
| **Advanced Arabic NLP** | جامعة نيويورك أبوظبي | متقدم | إنجليزي | [رابط] |
| **الذكاء الاصطناعي ومعالجة اللغة العربية** | منصة شمس | متوسط | عربي | [رابط] |
---
## 📞 التواصل
## 📊 لوحات مقارنة الأداء (Leaderboards)
- **صاحب الريبو:** [اسمك](رابط حسابك)
| الاسم | الوصف | الرابط |
|:---|:---|:---:|
| **HuggingFace/mteb** | مقارنة أداء نماذج التضمين (Embeddings) | [Website](https://huggingface.co/spaces/mteb/leaderboard) |
| **Arabic NLU Leaderboard** | مقارنة أداء نماذج فهم اللغة العربية | [Website](https://arcd-nlu.com/leaderboard) |
| **AraBench** | منصة شاملة لمقارنة النماذج العربية | [Website](https://arabench.ai/) |
| **OpenArabic LLM Leaderboard** | مقارنة النماذج اللغوية الكبيرة للعربية | [Website](https://huggingface.co/spaces/Ogma/OpenArabic-LLM-Leaderboard) |
---
## 🔗 مدونات وقنوات مهمة (Blogs & Channels)
| الاسم | الوصف | المنصة | الرابط |
|:---|:---|:---:|:---:|
| **CAMeL Lab Blog** | أبحاث وأخبار عن معالجة العربية | مدونة | [رابط] |
| **QCRI Arabic NLP** | أبحاث معهد قطر للأبحاث | مدونة | [رابط] |
| **الذكاء الاصطناعي بالعربية** | قناة يوتيوب متخصصة | يوتيوب | [رابط] |
| **NLP Arabic Community** | مجموعة فيسبوك للنقاشات | فيسبوك | [رابط] |
---
## 👥 المساهمون (Contributors)
شكر خاص لجميع المساهمين في هذا المشروع! ❤️
| الاسم | المساهمات | GitHub |
|:---|:---:|:---:|
| **Your Name** | مؤسس المشروع | [@yourusername](https://github.com/yourusername) |
| *انتظر مساهمتك!* | *أضف اسمك هنا* | *رابطك* |
للمساهمة، يرجى الاطلاع على [إرشادات المساهمة](CONTRIBUTING.md).
---
## 📞 تواصل معنا (Contact)
- **صاحب المشروع:** [اسمك](https://github.com/yourusername)
- **للاستفسارات:** [بريدك الإلكتروني]
- **تابعنا على تويتر:** [@YourTwitterHandle](https://twitter.com/)
- **مجتمع النقاش:** [رابط Discord أو Telegram]
- **تويتر:** [@YourTwitterHandle](https://twitter.com/)
---
**⭐ لا تنسى تدعمنا بنجمة إذا استفدت!**
## 📜 الترخيص (License)
هذا المشروع مرخص تحت **MIT License**. راجع ملف [LICENSE](LICENSE) للتفاصيل.
---
## 💬 انضم للنقاش
هذا المشروع جزء من مجتمع المطورين العرب المهتمين بمجال NLP. لديك اقتراح أو ملاحظة؟ لا تتردد في فتح **Issue** أو **Discussion**، أو الانضمام إلى سيرفر النقاش الخاص بنا!
نريد أن نجعل هذا الريبو مرجعاً قيماً لكل من يهتم بمجال معالجة اللغة العربية، ومساهمتك مهمة جداً ❤️
---
**⭐ لا تنسى تدعمنا بنجمة إذا استفدت!**
![Visitor Badge](https://visitor-badge.laobi.icu/badge?page_id=yourusername.ArabicNLPResources)