(ضمن ملف عن مشروع « المعجم التاريخي العربي » في الملحق الثقافي من العربي الجديد.)

هنا

كيف تُشيّدُ المعاجم التاريخية الحديثة؟

 حبيب سروري

يعرض المعجم التاريخي لأية لغة سيرةَ (C.V) كل كلمة فيه، منذ دخولها اللغة، ويتابعُ تطوّرات مداليلها وتحوّلاتها عبر السنين.

لا شك مثلاً أن مدلول كلمة « عقل » يختلف اليوم عن مدلولها قبل ١٤ قرن، حيث كان الناس يعتقدون أن « القلب » مصدر الإدراك، وليس الدماغ. فهي مشتّقة في لغة الضاد من « عقال »: الحبل الذي يُعقل به البعير، حيث كان مدلولها حينذاك: الرسوخ، وليس التفكير المستند على السببية (كنظيرتها اللاتينية: Raison)، كما لاحظ أحمد عابد الجابري.

كل اللغات العالمية (عدا العربية) تمتلك معاجمها التاريخية التي تضيء تاريخ اللغةِ والحياةِ معاً: عندما صمّتْ آذاني قبل أيام كلمة « مليشيا » (شديدة الاستخدام في اليمن هذه الأيام!) لجأتُ إلى المعجم الفرنسي الذي كشف عورات مداليلها وتاريخها، قائلاً:

هي من اللاتينية milita التي تعني: خدمة عسكرية، والمشتقة من miles التي تعني جندي. دخلت الكلمة القاموس الفرنسي في ١٥٧٨بمعنى صيانة السلاح، ثم تغير معناها في ١٦١١، ١٦٣٦، …، حتّى آخر تغير: تنظيم عسكري « خارج الجيش »…

يستحيل الحصول على مثل هذه المعلومات، لاسيّما التاريخية، لكلمة في المعاجم العربية: مفارقةٌ مثيرةٌ ومؤلمةٌ معاً، لأن اللغة العربية كانت أول من أسس القواميس والمعاجم اللغوية (منذ الخليل بن أحمد الفراهيدي صاحب قاموس العين، وربما الأصمعي قبل ذلك)؛ وقامت في عصرها الذهبي بِدورٍ طليعيٍّ في تأسيسِ دراسات النحو والصرف العبقرية، وتصنيفِ المفردات وترتيب جذورها واشتقاقاتها، وتأليفِ كل المعاجم (بما فيها معاجم الجنّ والشياطين!)؛ وانفتحت بشكلٍ مبكِّرٍ على لغات العالم منذ العصر العباسي وحملة ترجماته الزاخرة!

لهذه المفارقة أكثر من سبب. أحدهم ظلامي يصر على أن كلمات العربية موجودة منذ الأزل، في لوحٍ ميتافيزيقيٍّ محفوظ، وليست لها سيرات وتواريخ شأن كلمات اللغات الأخرى.

والآخر مرتبط بأحوال اللغة العربية المتردّية في العالم الرقمي. لاستيعاب ذلك يلزم أوّلاً شرح مفهوم « النص الرقمي » الذي أصبح اليوم كنزَ البشرية، وذهبَها الأسود: هو النص الموجود على الكمبيوتر (كتب، محاضرات، مقالات، براءات اختراع، مدوّنات، تقارير خبراء، حوارات ونقاشات في الشبكات الاجتماعية… أكان نصّاً مكتوباً، مسموعاً، أم مرئيّاً). لهُ خصائص مدهشة منها: هو « هوائي » التواجد، يمكن ربطه بأي نص رقمي آخر في أي مكان في العالم عبر « روابط النصوص الفائقة »، لا وزن له: يمكن وضع مليون كتاب في مفتاح U.S.B خفيف كقطعة نقدية دون أن يتغيّر وزنه!…

يستطيع الكمبيوتر أن يعالج النص الرقمي المكتوب: ينطقه، يفهرس كلماته لموتورات الأبحاث، يترجمه…

من المهمّ جدّاً هنا التمييز بين النص المطبوع على الكمبيوتر من ناحية، وصورة سكانير لِنصٍّ مطبوع أو مخطوط على ورق من ناحية ثانية: الثاني مجرد « شخاطيط » في أعين الكمبيوتر (يراه مثل قطة تشاهد صفحة من « رسالة الغفران »).

لذلك تمتلك كل لغة (عدا العربية حتّى الآن!) « متعرف ضوئي على الأحرف »، OCR، يحول صورة السكانير إلى نص رقمي من النوع الأوّل.

يجدر الملاحظة أن حجم النصوص الرقمية يقاس اليوم بالزيتابايتات (الزيتابايت يساوي ألف مليون مليون مليون حرف. أي: ١٠٠٠٠٠٠٠٠٠٠٠٠٠٠٠٠٠٠٠٠٠ حرف! أكثر من عدد حبات رمل الكرة الأرضية!).

ويتوقّع أن يصل حجم نصوص عام ٢٠٢٠ إلى خمسين زيتابايت، أي: ٧٥ عدد حبّات رمل الكرة الأرضية!

في البلدان التي دخلت العصر الرقمي (الذي لم نلجهُ بعدُ، نحن العرب!) تُحوَّلُ الكتبُ التي طُبِعت قبل ولادة عصر النص الرقمي، بأرقامٍ خياليّة، وكذلك المخطوطات اليدوية القديمة في المتاحف والمكاتب والبيوت، إلى نصوصٍ رقميةٍ مباشرة، وليس إلى صور سكانير، كما هو حالنا.

أحد الاستخدامات المهمة للنصوص الرقمية اليوم: تأسيس « مدوّنة اللغة » (بنك اللغة)، التي تنبثق منها المعاجم التاريخية الحديثة في عصرنا الرقمي. تحوي هذه البنوك عيّنةً ضخمةً (تعدُّ مجموعُ كلماتها بالمليارات) من النصوص المتنوعة التي كُتِبت في تلك اللغة في مختلف الأزمنة، والتي تُغطّي كل الاستعمالات التقليدية لها: شفهية أم كتابية، أدبية، علمية، اجتماعية…

يتم اختيار نصوص المدوّنة من عيّنات آتيةِ من قطاع متنوع عريض محايد من المصادر (الصحف والمجلات المكتوبة والمسموعة والمرئية، الكتب المتنوعة، النقاشات، التقارير، الشبكات الاجتماعية ومواقع إنترنت…) كي تعطي صورةً دقيقةً كاملةً عن اللغة في مختلف أشكالها واستعمالاتها اليومية والعلمية والعمليّة والأدبية، خلال مرحلةٍ زمنية معيّنة.

من كنوزها (التي يتمُّ رفدها رقميّاً كل يوم) تُستخلَصُ القواميس والمعاجم المتخصصة في المجالات اللغوية والعلمية والتقنية والعملية. إذ هي المختبر الذي تخرج منه: معاجم تاريخ وأصول الكلمات وعلاقتها باللغات الأخرى، والدراسات اللغوية المتنوعة حول بُنيَة اللغة وظواهرها وشتى دلالات كلماتها، وحول نواقصها واحتياجاتها المتجدّدة…

لتأسيس المعاجم التاريخية عبر استخدام برمجيات الحاسوبات اللغوية، يكفي البحث الآلي عن أقدم نصٍّ في بنك اللغة ظهرت فيه كل كلمة. يعطي ذلك غالباً موعد ولادتها التقريبي، أو محطّةً من محطّات سلسلة حيواتها.

ثم يكفي (بالاعتماد على تلك البرمجيات، وبتحليل ودراسة ميكروسكوبات علماء اللغة والتاريخ والاجتماع) متابعة سيرورة حركتها في اللغة ومختلف تحوّلاتها وتفاعلاتها، والتطوّر البيولوجي لِمداليلها واستعمالاتها، وانتقالها أحياناً من كلمة عادية إلى كلمة أدبية راقية مثلاً، أو سباتها الشتوي وموتها الإكلينيكي وانقراضها المهيب…

لعلّ مشروع تأسيس معجم تاريخي عربي (إذا ما تمّ بناؤه بأدوات العالم الرقمي الحديثة: المدوّنة، والقارئ الضوئي، ورقمنة المخطوطات؛ وليس بطريقة يدوية على غرار المعاجم التاريخية في القرن ١٧ في فرنسا) لن يكشف لنا أسرار تاريخ لغتنا العربية الحبيبة فقط، ومعالم هامّة من تاريخنا الكليّ أيضاً، بل سيكون وسيلتنا للولوج إلى العالَم الرقمي الذي نظنّ، بمجرد استخدامنا الإيميل وتصفّح المجلات، أننا أقرب له من حبل الوريد، فيما مازلنا في الحقيقة أبعد أهل المعمورة عنه تقريباً!

إذ يلزمنا أن نتذكّر دوماً، كما شرح مقالٌ سابقٌ لنا في هذا الملحق الثقافي أن من « كتبَ غلبَ، ومن رقمنَ هيمنَ ».