هل يتمكن الذكاء الصناعى بمساعدتنا فى فهم لغة القدماء المصريين ؟
تحديدًا سنة 1933 ،في ثلاثينيات القرن الماضي
اكتشفت بعثة من معهد الدراسات الشرقية بجامعة شيكاغو موقعًا أثريًّا فيما يعرف اليوم بإيران، ويعود ذلك الموقع للإمبراطورية الفارسية الأخمينية، التي ازدهرت منذ 25 قرنًا. لم يكن الموقع هو الاكتشاف الوحيد، إذ صاحبه اكتشاف عشرات الآلاف من الأعمال في صورة ألواح طينية. لأكثر من عقد حاول الباحثون فك شفرة تلك الوثائق يدويًّا، لكن كانت العملية صعبةً وبطيئة وعرضةً لأكثر من خطأ .
منذ تسعينيات القرن العشرين، وظًّف العلماء الحاسوب لمساعدتهم، لكن نجاحهم كان محدودًا، نتيجة الطبيعة ثلاثية الأبعاد للألواح، ولشدة تعقيد الحروف المسمارية. لكن طفرة تقنية في جامعة شيكاجو ربما تساعد على القراءة والنسخ الآليين لتلك الألواح، ما سيكشف النقاب عن معلومات قيمة بشأن التاريخ والمجتمع واللغة الأخمينية، ويُمكِّن الأثريين من التفرغ لمستويات أعلى من التحليل والدراسة.
كان ذلك هو الدافع وراء تقنية DeepScribe، وهي ثمرة تعاون بين الباحثين من معهد الشرقيات وقسم علوم الحاسب بجامعة شيكاجو، إذ غُذيَ البرنامج بمجموعة من الصور يبلغ عددها 6 آلاف صورة مُعنوَنة من أرشيف حصن ديبسيبوليس، لبناء نموذج يمكنه قراءة الألواح التي لم تُحلل بعد، وتُعَد أداةً محتملة تُمكن الأثريين من دراسة الكتابات القديمة وتحليلها.
قالت سوزان بولس، أستاذ علم الآشوريات: «ستتغير قواعد اللعبة إن استطعنا ابتكار أداة مرنة وقابلة لاستيعاب المزيد، يمكنها الوصول إلى فك رموز مختلفة من أزمان مختلفة. تُعَد تلك الكتابات موضوعًا جيدًا لتعلم الآلة».
بدأ التعاون عندما قابل بولست وساندرا سكولين وميلر بروسر من معهد الدراسات الشرقية، البروفيسور سانجاي كريشنان من قسم علوم الحاسب، في مؤتمر علمي أشرف فيه سكولين وبروسر على OCHRE، وهو نظام لإدارة قاعدة بيانات مدعومة من معهد الدراسات الشرقية، لتجميع بيانات البعثات الأثرية وتصنيفها.
في قاعدة البيانات تلك، طبق كريشنان الذكاء الاصطناعي والتعلم العميق لتحليل البيانات متضمنةً الفيديوهات، وكان التشابه مع مشكلة الكتابات المسمارية لافتًا للنظر.
قال كريشنان: «من وجهة نظر الرؤية بالحاسب (أي جعل الحاسب قادرًا على التمييز بين الصور المختلفة)، يُعَد هذا مثيرًا، لأنها نفس التحديات التي نواجهها، إذ تطورت الرؤية بالحاسب تطورًا بارزًا خلال 5 السنوات الأخيرة، فلم يكن من الممكن الوصول إلى تلك النتيجة منذ 10 سنوات، وهو موضوع جيد لمعالجته من طريق خوارزميات التعلم الآلي، لأن الدقة قابلة للقياس، ولدينا عينة للتدريب، إضافةً إلى أننا نفهم النص جيدًا ما يجعل المشكلة مفهومة إلى حد بعيد».
تُعد عينة التدريب ثمرة لمجهود من الدراسة المكثفة التي استمرت نحو 80 سنة، بواسطة معهد الدراسات الشرقية وباحثي جامعة شيكاجو، وطفرة تقنية حديثة لترقيم صور الألواح الطينية بدقة عالية، ما أنتج نحو 60 تيرا بايت من البيانات، وما زال الرقم في زيادة. وباستعمال تلك المجموعة من الصور، أنشأ الباحثون قاموسًا من الكتابة المسمارية يضم 100 ألف رمز.
بالاستعانة بموارد مركز بحوث الحوسبة بجامعة شيكاجو، استعمل كريشنان العينة المُعنوَنة لتدريب النموذج على التعلم بطريقة مشابهة للمتبع في مشروعات الرؤية بالحاسب، وعند اختبار ذلك النموذج على الألواح غير المُتضمَّنة في عينة التدريب، نجح النموذج في فك تشفير الرموز المسمارية بدقة تبلغ 80%. وما زال البحث جاريًا لتحسين تلك النسبة، ومعرفة سبب الإخفاق في النسبة المتبقية.
قال البروفيسور بولوس، القيِّم على مجموعة الألواح بالمعهد: «يمكن أن نعتمد على ذلك النموذج في جهود النسخ بالدقة البالغة 80%، فالكثير من تلك الألواح تصف عمليات تجارية بسيطة مشابهة لفواتير محلات التجزئة، وسنقطع شوطًا لا بأس به إن استطاع النموذج التعرف على الأشياء المتكررة بكثرة، دون التعرف على أسماء الأماكن والأفعال والأشياء التي تحتاج إلى تفسير الخبراء، وإن لم يكن النموذج حاسمًا في قراره فمن الممكن أن يرجح بعض الاحتمالات ويختار الأكثر احتمالًا منها، ثم يلتقط الخبير طرف الخيط».
يخطط الفريق بطموح أكبر لجعل DeepScribe أداةً متعددة الاستخدامات ذات هدف عام وهو فك الرموز، يمكن مشاركتها مع علماء آثار آخرين، إذ يمكن تدريب النموذج وإعادة تدريبه للتعرف على أنماط من الكتابة المسمارية بخلاف العيلامية، ويمكن تعليمه كيف يستنتج الأجزاء مفقودة من ألواح غير مكتملة، وقد يساعد على التعرف على أصل الألواح والمشغولات الأخرى مجهولة الأصل، وهي مهمة تجريها حاليًا الاختبارات الكيميائية.
تستخدم الكثير من المشاريع اليوم المشابهة فكرة تطبيق الرؤية بالحاسب في تطبيقات مختلفة، مثل دراسة التنوع البيولوجي في الصدفيات البحرية، وفصل النمط عن المحتوى في الأعمال الفنية. ويطمح التعاون أيضًا إلى عقد شراكات مستقبلية بين معهد الدراسات الشرقية وقسم علوم الحاسب بجامعة شيكاغو.