2 ديسمبر 2025
Misraj Team
Team
مشروع لهجاوي من مسراج هو أول نموذج ترجمة بين اللهجات العربية، يسمح بتحويل النصوص بين لهجات متعددة وتحويلها إلى العربية الفصحى بدقة عالية. تعرّف على كيفية تطويره، نتائجه، واستخداماته في التطبيقات الذكي...
في مسراج، نعمل باستمرار على بناء تقنيات لغوية متقدمة تتعامل مع اللغة العربية بعمق ووعي. ومع تنوع اللهجات العربية وتباعدها الكبير من حيث المفردات، التراكيب، وطريقة التعبير، أصبحنا أمام حاجة ملحّة إلى نموذج قادر على الربط بين هذه اللهجات وفهمها وتحويلها بدقة. ومن هنا بدأ تطوير لهجاوي، أول مترجم عربي شامل بين اللهجات، والمصمم ليقدّم تجربة ترجمة أكثر ذكاءً ومرونة لمستخدمينا في مختلف أنحاء العالم العربي.
واجهنا في نماذج اللغة التقليدية صعوبة في استيعاب اللهجات العربية المختلفة، خصوصًا عند التعامل مع نصوص واقعية من المستخدمين. فاللهجات ليست مجرد تنويعات بسيطة، بل منظومات لغوية كاملة تختلف جذريًا في المفردات والبنية. معظم الأبحاث السابقة ركّزت على تحويل لهجة محددة إلى الفصحى، بينما غابت تمامًا محاولات الترجمة بين اللهجات نفسها.
قمنا ببناء نظام ترجمة يعتمد على نموذجين رئيسيين:
Lahjawi-D2D: للترجمة بين اللهجات العربية المختلفة.
Lahjawi-D2MSA: لتحويل النصوص من أي لهجة عربية إلى العربية الفصحى.
وبالاعتماد على نموذج لغوي خفيف الحجم، قمنا بضبطه بدقة باستخدام واحدة من أكبر مجموعات البيانات الخاصة باللهجات العربية:
197,042 جملة لهجة إلى الفصحى
266,871 جملة لهجة إلى لهجة أخرى
واستخدمنا إطار سؤال–جواب أثناء التدريب لمساعدة النموذج على فهم التفاصيل الدقيقة والفروق بين اللهجات.
حقق النموذج أداءً واعدًا على جميع المهام:
نتيجة 9.62 BLEU في مهمة لهجة → فصحى
نتيجة 9.88 BLEU في مهمة لهجة → لهجة
طلاقة لغوية بتقييم بشري بلغت 78%
هذه النتائج تثبت قدرة النموذج على التعامل مع اللهجات العربية المعقدة ونقل الأسلوب والمعنى بين النصوص بشكل واقعي.
نعتبر لهجاوي جزءًا من رؤيتنا لبناء منظومة ذكاء اصطناعي عربية متكاملة، لأنه:
يعالج فجوة حقيقية في عالم المعالجة اللغوية العربية.
يساعد على تحسين التواصل بين مستخدمين يتحدثون بلهجات مختلفة.
يمكّن من تطوير تطبيقات عربية ذكية أكثر فهمًا وواقعية.
يقدّم نموذجًا خفيفًا يمكن استخدامه بكفاءة في البيئات الإنتاجية.
النموذج جاهز ليكون جزءًا من منتجات وتطبيقات متعددة، منها:
ترجمة تعليقات السوشال ميديا بين اللهجات.
دعم المساعدات الذكية وروبوتات المحادثة لفهم المستخدم بلهجته.
أدوات تعليمية لشرح الفروق بين اللهجات العربية.
تحليل المحتوى الإعلامي وتوحيد صياغة النصوص.
نفتخر في مسراج بتطوير لهجاوي، لأنه يعكس التزامنا بتطوير حلول عربية تعتمد على فهم حقيقي للغة. هذا النموذج ليس مجرد مترجم، بل خطوة أساسية نحو بناء أدوات لغوية عربية أكثر ذكاءً، وشمولًا، ودقة.
رابط الورقة البحثية:
تواصل معنا لتكتشف كيف يمكن لتقنيات مسراج أن تغيّر طريقة عمل مؤسستك.
لتبدأ رحلتك لحلول أذكى