اللسانيات الحاسوبية والمعالجة الآلية للغات الطبيعية
فطوم القرييش
ملخص:
نهدف من خلال هذا المقال إلى التعريف باللسانيات الحاسوبية (تاريخها، موضوعها، منهجها، روادها)، ثم سنميز بين اللغة الطبيعية واللغة الاصطناعية ونعرف بآليات التوليد والتحليل باعتبارهما عمليتان مهمتان في المعالجة الآلية للغات الطبيعية كما سنقدم طرق معالجة مستويات الدرس اللساني بطريقة آلية، وسنشير إلى مجالات استثمار المعالجة الآلية للغات الطبيعية، مع تذييل كل مبحث بخلاصة تركيبية.
المبحث الأول: مدخل عام حول اللسانيات الحاسوبية
لقد تنوعت مناهج دراسة اللغة الطبيعية بتنوع الخلفيات
المعرفية لكل دارس من جهة، وبتنوع النظريات اللسانية من جهة أخرى؛ فقد كانت دراسة
اللغة فرعا من فروع الفلسفة في المراحل الأولى، حيث كان الغرض من دراستها
هو التقعيد لها وضبطها، وبعد اكتشاف "وليامز
جونز" التقارب الحاصل بين اللغة السنسكريتية واللغات اللاتينية، انتقل البحث
في اللغة إلى المنهج التاريخي المقارن الذي يقوم بالأساس على المقارنة بين اللغة
الأم واللغات البنات لتحديد المميزات والصفات المشتركة بين كل اللغات.
وستعرف مناهج دراسة اللغات الطبيعية طفرة نوعية مع نشر
محاضرات في علم اللغة العام ²Cours de Linguistique Générale²
للساني فيردناند دو سوسير سنة 1916، والتي قدم فيها منهجا جديدا لدراسة اللغة وهو
المنهج البنيوي الذي يقوم على فكرة أساسية وتكمن في اعتبار أن اللغة بنية مغلقة
مكتفية بذاتها، ولذلك وجب دراستها في ذاتها ولذاتها دون ربطها بمحيطها الخارجي أو
بيئتها أو تاريخها أو مقارنتها بلغة أخرى.
ثم سينتقل البحث في اللغة من اعتبارها بنية مغلقة
ومكتفية بذاتها إلى دراسة الجهاز المسؤول عن اكتسابها وإنتاجها وذلك مع المدرسة
التوليدية التحويلية لرائدها نعوم تشومسكي، هذا الأخير الذي اتخذ من اللغة موضوعا
ومن الرياضيات والمنطق منهجا ومن علم النفس أداة ووسيلة لدراسة اللغة، وقد ترجم
أبحاثه في مجموعة من البرامج والنظريات طورت لاحقها
سابقها.
إلا أنه مع تنامي وتطور الوسائل التكنولوجية وتداخل
اللسانيات مع مجموعة من العلوم(الذكاء الاصطناعي وعلم النفس والمنطق والرياضيات
والعلوم المعرفية....)، ظهر منهج جديد في دراسة اللغة وهو المنهج اللساني الحاسوبي؛
وقد جمع هذا المنهج بين نتائج اللسانيات الصلبة ونتائج تطور التقنيات المعلوماتية
في معالجة اللغات الطبيعية.
فمتى ظهرت اللسانيات الحاسوبية؟ وما هو مفهومها؟ وما هو
موضوعها ومنهج اشتغالها؟
المحور الأول: نبذة تاريخية عن اللسانيات
الحاسوبية
اكتشف المعلوماتيون أن الحاسوب يمكنه أن يقوم بالترجمة
الآلية للنصوص بجانب مهمة الحساب الآلي، وقد تحدث عن هذا المعلوماتي ورن وفر "WarrenWeaver"
سنة 1949 في مقال له بعنوان "الترجمة" حيث عالج فيه مجموعة من المشاكل
المتعلقة بالترجمة الآلية من قبيل البنية المنطقية للغات، والنحو الكلي الذي تتقيد
به كل اللغات. ورغم أن فكرة الترجمة كانت قد ظهرت في سياقات ثقافية وعلمية من قبل،
فإن مقال وفر جعل المعلوماتيين يهتمون بتقديم حلول لمعالجة الجوانب التركيبية
والدلالية للغة([1]).
إلا أن البداية
الحقيقية للسانيات الحاسوبية كانت مع ظهور الترجمة الآلية في سنة 1954، وفي سنة
1962 قدمت أول محاضرة حول الترجمة الآلية
من قبل "Y.Bar-Hillel"،
وسيعرف مجال المعالجة الآلية تقدما ملحوظا مع تطور النظريات اللسانية (هاريس 1951/
1954، وتشومسكي 1957)، أضف إلى ذلك ظهور أبحاث بخصوص الذكاء الاصطناعي سنة 1956،
حيث أنجز "Terry Winorgrad" أول برنامج قادر على التحاور باللغة الانجليزية
مع إنسان آلي، وتوالت الأبحاث وتطورت المقاربات خاصة المرتبطة بالمستوى الدلالي.)[2](
لتتطور بالموازاة مع ذلك تقنيات المعالجة الآلية للغات الطبيعية.
وقد انعقد أول مؤتمر حول اللسانيات التطبيقية ب "Nancy"
في أكتوبر 1964، ونظم العالم فكواس "Vouquois " في أكتوبر 1967 محاضرة عالمية ثانية في
اللسانيات الحاسوبية في جرونوبل "Grenoble" بعنوان:
"المحاضرة الثانية في المعالجة الآلية للغة" ([3]).
ومما تجدر الإشارة إليه، أن الباحثين الذين اهتموا بالبحث
في الترجمة الآلية وفي اللسانيات الحاسوبية في السنوات الأولى من ميلادها، كانوا
علماء متخصصين في الهندسة الرياضية التطبيقية أو فلاسفة متخصصين في دراسة اللغات
الطبيعية، أما اللسانيون فلم يولوا اهتماما كبيرا
لهذا الجانب باستثناء جهود بعض اللسانيين التوزيعيين ومنهم: اللساني هاريس "Haris"
واللساني هوكيت "Hokitt" بشراكة مع بعض الأنتربولوجيين
اللسانيين مثل: الباحث فوجل "Voegeling"
والباحث جرافين "Gravin" الذين نشروا سنة 1954 عددا خاصا حول الترجمة
الآلية في الجريدة العالمية للسانيات الأمريكية، كما اشتغل اللغوي تشومسكي"Chomsky" أيضا مع الباحث يونجف "Yngve"
سنة 1955 في مشروع للمعالجة الآلية بصحبة ثلاثة لسانيين آخرين وهم: يوزف أبلييت
"Yoseph Appleyate" وفريد
لكوف "Fred Lukoff" وبتي شفت
"Betty Shefts" ([4]).
وبهذا تكون فكرة
الترجمة الآلية هي التي شكلت اللبنة الأساسية لظهور اللسانيات الحاسوبية، وتطور
هذه الأخيرة نتج عنه تطور مواز في النظريات اللسانية وفي التقنيات التكنولوجية
المعلوماتية.
المحور الثاني: مفهوم اللسانيات الحاسوبية
يتكون مصطلح "اللسانيات الحاسوبية" من
كلمتين:"اللسانيات" و"الحاسوبية"؛ ينضوي الأول تحت العلوم
الإنسانية والثاني تحت العلوم الحقة؛ ومنه يمكن أن نستنتج أن الباحث في هذا الجانب
ينهل من حقلين معرفيين ليدرس اللغة الطبيعية بكل مستوياتها اللسانية باعتماد آليات
الحاسوب، وبمعنى آخر، دراسة اللغة بمنهج علمي حاسوبي مع ضرورة صورنة اللغة
الطبيعية لتصير مرنة في التطبيق الحاسوبي على اعتبار أن الحاسوب يشتغل باعتماد
معارف منطقية ورموز رياضية. فاللسانيات الحاسوبية -من هذا الجانب- تقوم بتقييس
المعارف اللغوية التي توجد في الدماغ البشري بكيفية اشتغال الحاسوب.
المحور الثالث: موضوع اللسانيات الحاسوبية
تعد
اللسانيات الحاسوبية "La Linguistique Calculatoire" جزءا من
الدراسات اللسانية التطبيقية(*)، فهي
مجال لبحث يجمع بين ما هو لساني لغوي وما هو معلوماتي رياضي، لأنها علم يهتم
بدراسة مختلف الخصائص والظواهر اللسانية للغات الطبيعية بطريقة حاسوبية، وذلك
بابتكار وخلق وتطوير أنظمة حاسوبية تسمح بمعالجة اللغات الطبيعية في كل مستوياتها
اللسانية (الصوت، والصرف، والمعجم، والتركيب، والدلالة).
إن
معالجة اللغة آليا تقتضي بالضرورة معالجة منطقية صورية ثم بعدها حاسوبية؛ فلا تتم
حوسبة اللغة بدون صورنتها وذلك اعتمادا على مناهج رياضية وتقنية خاصة مثل: قواعد
إعادة الكتابة ونظرية الأطوماطة، وآلية التشجير ولامدا الحساب... ومنه فإن كل
الجوانب التي تخرج عن نطاق تركيب العبارات اللغوية لا يمكن صورنتها، ونقصد بذلك المستوى
التداولى لأنه
لا يرتبط بما هو لساني كلي بقدر ما يرتبط بما هو ثقافي خاص وبالواقع الخارجي،
ولذلك يصعب صورنة التداولية. ومن خلال تعرفنا على موضوع اللسانيات
الحاسوبية توصلنا إلى أن حوسبة اللغة تمر عبر معالجة منطقية صورية تتمثل في مجموعة
من الآليات الصورية المنطقية. (والتي سنبينها في المبحث الثالت وبالضبط في المحور
الأول منه: "اللسانيات الحاسوبية والدراسات المعجمية مقاربة معرفية_").
المحور الرابع: منهج اللسانيات الحاسوبية
إن منهج اللسانيات الحاسوبية هو منهج
لساني، ورياضي معلوماتي، باعتبار أن هذا القسم من اللسانيات التطبيقية يهدف
بالدرجة الأولى إلى خلق وابتكار أنظمة حاسوبية لمعالجة اللغة الطبيعية، وذلك باتباع
خطوات إجرائية أساسية تتمثل فيما يلي:
*
تحديد المستوى/الجانب اللغوي موضوع الدراسة.
*
منطقة الجانب المحدد(اللغة) وتحويله من رموز لغوية إلى رموز رياضية(اللغة
الصورية).
*
ابتكار نظام معلوماتي/حاسوبي حسب ما تم صورنته.
خلاصة المبحث الأول
لقد حاولنا من خلال هذا المبحث أن نقدم بعضا من المعارف
التي ترتبط بمجال اللسانيات الحاسوبية؛ بحيث استخلصنا ما يلي:
-
ارتبط تاريخ
ظهور اللسانيات الحاسوبية بظهور الترجمة الآلية.
-
يتحدد موضوع
هذا العلم ببناء أنطمة آلية لمعالجة اللغات الطبيعية.
-
يتعلق منهج اشتغال اللسانيات الحاسوبية بالضرورة
بالدراسة المنطقية الصورية للغات الطبيعية.
وقد هدفنا من خلال ما سبق التعريف بمفهوم اللسانيات الحاسوبية وما يرتبط بها من أجل توضيح الإطار النظري الذي اعتمدناه في بحثنا هذا.
المبحث الثاني: المعالجة الآلية للغات الطبيعية
يتميز كل نسق لغوي بتضافر وانصهار خمس مستويات للدرس اللساني المكون لهذا النسق: الصوتي والصرفي والتركيبي والدلالي والتداولي، بحيث لا يتأتى لأي دارس لغوي أن يتعرف على مميزات هذه اللغة دون أن يلم بكل أو ببعض مستوياتها اللسانية. هذا فيما يخص الدراسات اللسانية النظرية أو ما يعرف باللسانيات الصلبة، أما فيما يخص اللسانيات التطبيقية وخاصة منها الحاسوبية، فيجب على معالج اللغة أن يكون ملما بكل الحيثيات المرتبطة باللسانيات الصلبة (النظرية) حتى يتسنى له منطقة اللغة لتكون طيعة أثناء معالجتها آليا. وبذلك سنقدم في هذا المبحث بعضا من مميزات كلا من اللغة الطبيعية واللغة الاصطناعية من جهة، وسنتحدث عن المعالجة الآلية لكل مستويات الدرس اللساني من جهة ثانية، وذلك باعتبار أن أية دراسة أو معالجة لغوية تقوم على عمليتين إجرائيتين أساسيتين هما: آليتا التحليل.
المحور الأول:-اللغة الطبيعية واللغة الاصطناعية
يدل مصطلح اللغة من جهة على اللغة الطبيعية بشكليها
المنطوق والمكتوب، ومن جهة أخرى على اللغة الاصطناعية التي تستعمل في الرياضيات
والفيزياء والكيمياء والمنطق والمعلوميات.
1-1 اللغة
الطبيعية
تتميز اللغة
الطبيعية(كالعربية والفرنسية)-من وجهة نظر لسانية حاسوبية- بمجموعة من السمات
منها:
*
عنصر اللبس:
هناك بعض الحروف في اللغة العربية مثلا لها شكل واحد في
الكتابة وأشكال عدة في النطق، كحرف الواو، والياء، والألف، فتكون حروف مد(صام،
يصوم) وحروف لين(قوْل، بيْع)، وتكون حروف علة إذا كانت متحركة (وَجد، يَبس)، وفي
اللغة الفرنسية مثلا حرف "I" الذي
يتخذ عدة صور في النطق(maison/lit/boire).
كما تعتمد اللغة العربية و اللغة الفرنسية على مبدإ
الاقتصاد في الجمع؛ فمثلا الحرف "S" في
اللغة الفرنسية يدل على الجمع في الأسماء (les portes)
والنعوت ((les belles
وعلى المفرد المخاطب في بعض الصيغ الفعلية(tu es- tu
as). أما فيما يخص الجمع في اللغة العربية فله
عدة صور(جمع المذكر السالم، جمع المؤنث السالم، جمع التكسير...).
* عنصر
التضمين:
تتسم اللغة الطبيعية بالتضمين باعتبارها ترتبط بموقف
المتكلم/المستمع،
وقصديته وبيئته، مثل:
]1[ فلان كثير الرماد (مثل عربي يدل على
الكناية)
هذه العبارة تدل
على أن فلانا كريم لكثرة رماده(بقايا النار بعد انطفائها) وذلك بسبب كثرة ضيوفه.
وكمثال في الثقافة الفرنسية:
[2]Jean a cassé sa pipe. (جون كسر غيلونه)
فهذه العبارة تدل ضمنيا بأن جون قد مات.
إن عنصر التضمين يرتبط بالمجاز اللغوي من استعارة وكناية
وغيرهما بالنسبة للغة العربية، وكذلك في اللغة الفرنسية.
* عنصر المرونة:
تتميز اللغة الطبيعية بالثراء، لأنها تمكن مستعمليها من
تحقيق التواصل كونها تسمح بالتوليد والاشتقاق والنحت، لذلك تتسم بالمرونة.
* عنصر الترادف:
تتسم اللغة الطبيعية بكثرة المفردات اللغوية؛ فمثلا في
اللغة العربية:
- الجود
يرادف السخاء والعطاء والسماحة والكرم.
- نقول: رأيت الشيء وأبصرته وعاينته وشاهدته.
- نقول: عام، سنة، حول.
وفي اللغة الفرنسية:
كلمة "le travail" لها
أكثر من عشرون مرادفا، منها:
Labeur, emploi,
fonction, métier, place, poste, profession, situation, boulot (populaire),
turbin (populaire), ouvrage, tâche, œuvre…..([5])
*
البنية الصرفية المعقدة(مسألة الشكل ومسألة إفراغ الجذر في الصيغة الصرفية)
بالنسبة للغة العربية فقط.
1-2
اللغة الاصطناعية
تستعمل اللغة الاصطناعية في العلوم الحقة مثل: الرياضيات،
والفيزياء، والمنطق...كصورة مجردة عن تحولات العالم الخارجي، وهي لغة جافة نوعا
ما.
وتقوم المعلوميات أيضا على لغة اصطناعية تسمى بلغة
البرمجة والتي تتأسس على لغة الخوارزمات، ومصطلح الخوارزم (نسبة إلى واضعه موسى
الخوارزمي) هو مصطلح رياضي ومنطقي محض، قدمت له تعريفات عدة ومن أهمها:
- "جاء العالم موسى الخوارزمي الذي قدم طريقة رياضية رائعة في
حل المسائل أطلق عليها اسم الخوارزمات (Algorithme) نسبة إلى اسمه، والتي تعتمد على مبدإ تقسيم المسألة قيد الحل إلى
عدة خطوات (Steps) مترابطة منطقيا فيما بينها، لكي يؤدي تطبيقها إلى الوصول إلى
الحل المناسب" ([6]).
- إن الخوارزم نظام من المبادئ والقوانين الصورية التي تتحكم في عمليات
الإنتاج اللغوي على مستوى التحليل (الإدخال) والتوليد (الإخراج)" ([7]).
وتتميز
الخوارزمات ببعض الخصائص من بينها:
-
الدقة (خطوات الخوارزم يجب أن تكون
معروفة وواضحة)
-
الفعالية والانتهاء (الوصول إلى حل
صحيح للمشكلة بعد عدد معين ومحدود من الخطوات)([8]).
إن لكل من اللغة الطبيعية واللغة الاصطناعية مميزاتها
الخاصة إلا أن هذا لا يعني أن كلا منهما مستغن عن الآخر، بل على العكس، فكلاهما
يتوسل بالآخر
لتفسير ظواهر العالم الخارجي ومعالجتها.
المحور الثاني:-آليتا التوليد والتحليل
ينطلق مستعمل اللغة مما هو مخزن في دماغ الإنسان أو
ذاكرة الحاسوب-من معارف لسانية- لإنتاج جملة، وهذه العملية تسمى بالتوليد؛ أي أنه
ينطلق من تصورات أو تمثلات ذهنية توجد في
دماغ الانسان أو مخزنة في ذاكرة الحاسوب لتفعيلها في الواقع عن طريق رسالة منطوقة
أو مكتوبة، وقد ينطلق مستعمل اللغة مما هو مولد (مجموع الكلمات والحروف والجمل)، لتحليل
أجزائه اللسانية ثم الوصول إلى التصور أو التمثل الذهني(عند الانسان أو الحاسوب)،
وهو ما يعرف بالتحليل. ومما تجدر الإشارة إليه أن هاتين العمليتين متكاملتين؛ حيث
ننطلق من التوليد لنصل إلى التحليل، وقد ننطلق من التحليل للوصول إلى التوليد.
ويقوم الإنسان المستمع/المتكلم بهاتين العمليتين بناء
على معارفه اللسانية الذهنية، ويمكن أن نمثل لذلك بما يلي:
تمثيل لآليتي التوليد والتحليل عند الإنسان للغة المنطوقة)[9](
قد قام المهتمون بالعلوم المعرفية بعملية تقييس المعارف
اللسانية بالحاسوب، لأن للحاسوب ذاكرة يمكن أن تخزن فيها هذه المعلومات كما يمكن
استرجاعها لتحليلها ثم الاعتماد عليها لتوليد معارف لسانية ما، ولتوليد أو تحليل
هذه المعارف اللسانية المخزنة في الحاسوب نعتمد على دخل وخرج، ومنه فهناك حالة
أولية E1(دخل)، وحالة نهائيةE2 (خرج)،
ونمثل لذلك كالآتي:
E2 E1
المحور الثالث:-المعالجة الآلية للأصوات
يهتم علم الأصوات بدراسة الأصوات الكلامية من ناحية سماتها
وصفاتها ومخارجها، ودراسة أيضا القواعد التي تتحكم في تآلفها وتجاورها...إلا أن
اللسانيات الحاسوبية اهتمت بالجانب الأكوستيكي والنطقي للصوت؛ أي بالدبدبات
الصوتية دون الاهتمام بمكوناته وخصائصه الفيزيائية؛ وذلك ببرمجة الصوت في الحاسوب
ثم محاولة التعرف على خصائصه بتحديد أجزائه ودراستها قطعة قطعة، إلا أن المعلوماتي
يواجه بعض المشاكل في هذا الجانب، وترتبط بالخصوص بطريقة نطق الصوت كالظواهر
اللسانية فوق المقطعية مثل: النبر، والتنغيم...
|
ومن المشاكل
التي قد تعترض المعلوماتي في هذا الجانب نذكر:
3-1 ظاهرة الإدغام([11]):
إلا: إن + لا
مما : من + ما
عما : عن + ما
ادتفع
ادفع
3-2 ظاهرة القلب:
- ازدهر وأصلها
ازتهر؛ بحيث قلبت التاء دالا لأن التاء أخذت سمة الجهر من الزاي فأصبحت دالا.
- اصطبر والتي أصلها اصتبر، وقلبت تائها
طاء لأن التاء أخذت صفة التفخيم من الصاد وأصبحت طاء.
-
مضطرب ¬
مضترب
- قائل
¬
قاول
-
مصطلح ¬
مصتلح
لكن ما هو الأصل الثلاثي بالنسبة ل: مضترب و مصتلح؟
3-3 ظاهرة التضعيف:
مدَّ ¬ مدد
والسؤال
المطروح هنا: هل سيقبل الحاسوب مدَّ أم مدد؟ (وهذا ما سنبينه في المبحث
الرابع من الفصل الأول والمعنون ب: الفعل في
اللغة العربية –مقاربة لسانية حاسوبية-).
المحور الرابع:-المعالجة الآلية للصرف
يهتم الصرف بدراسة البنية الصرفية للكلمة في معزل عن
البنية التركيبية وعن السياق الدلالي لجملة ما، ومن القضايا التي يدرسها الصرف
العربي: دراسة الصيغ الصرفية، والجذوع الفعلية، والاسمية، والزوائد ودلالتها،
ومظاهر الاشتقاق، والتصريف، وظواهر صرفية أخرى مثل: الإعلال والقلب والإبدال
وغيرها....، بينما ترتكز المعالجة الآلية
لعلم الصرف على دراسة وتحليل أجزاء الكلمة بتحديد نوعها، وجذرها، ولواصقها، ووزنها
الصرفي انطلاقا مما تمت برمجته في الحاسوب، ولتفصيل ذلك أكثر نورد المثال أدناه:
*في اللغة
العربية:
]3[ نجح الطالب في الامتحان
تحلل الجملة على الشكل الآتي:
الوحدة 1: نجح(فعل، ماض، مذكر، مفرد.....)
الوحدة 2: الطالب(اسم، فاعل، مذكر، مفرد...)
الوحدة 3: في(حرف، يدل على المكان والزمان....)
الوحدة 4: الامتحان(اسم، مجرور، مذكر، مفرد...)
*في
اللغة الفرنسية:
[4]Fatima a
acheté une robe
Unité1: Fatima
(Nom propre. Féminin. Singulier…)
Unité 2:
a acheté (verbe. Passé composé. 3éme
Personne du singulier…)
Unité 3: une
(article indéfini. Singulier. Féminin…)
Unité 4: robe (nom.
Singulier….)
وقد
تعترض المعلوماتي في معالجة هذا المستوى مشاكل عدة منها:
مثال:
تحليل كلمة "فهم" آليا تحتمل أوجها عديدة هي:
المحور الخامس:-المعالجة الآلية للتركيب
يقوم المستوى
التركيبي على دراسة المكونات التي تتشكل منها الجملة، كما أنه يهتم بتحديد مواقع
الكلمات داخل الجملة؛ حيث إن لكل مقولة تركيبية نحوية(الفعل، والفاعل،
والمفعول...) موقعها داخل الجملة، أما فيما يخص المعالجة الآلية للمستوى التركيبي
في الحاسوب، فتقوم على أساس القواعد والمحددات التي تمت برمجتها في المعالجة
الآلية للمستوى الصرفي، لكن إذا ما اعتمدنا فقط على هذا المنطلق (تحديد مواقع الكلمات في الجمل)، سيتم تحديد
ما اصطلح عليه في الأدبيات اللسانية التوليدية التحويلية (نوام تشومسكي)
بالمقبولية النحوية)*(
دون اعتبار المقبولية الدلالية )*٭ (فستكون
الجملة:
]5[ أكل الولد الحائط.
عبارة صحيحة ومقبولة نحويا(فعل، فاعل، مفعول
به) في الحاسوب وسيحللها كالأتي:
الوحدة
الأولى: أكل ¬
فعل
الوحدة
الثانية: الولد ¬
فاعل
الوحدة
الثالثة: الحائط ¬
مفعول به
بينما إذا ما
تأملنا هذه الجملة دلاليا فهي خاطئة، لذلك سيكون من الضروري برمجة المحددات
الدلالية لكل كلمة في اللغة المعالجة.
وقد يواجه
المعلوماتي في برمجة هذا المستوى مجموعة من المشاكل من قبيل:
5-1-
مسألة التطابق بين الفعل والفاعل عددا وجنسا)[12](
5-1-1-
التطابق العددي
هو
تناسب وتطابق من ناحية العدد بين الفعل والفاعل في الجملة الفعلية وبين اسمين
كيفما كانت نوعيتهما النحوية في الجملة الاسمية.
]6-أ[ الأولاد دخلوا.
]6-ب[ دخل
الأولاد.
ففي الجملة الثانية لا يوجد تطابق بين الفعل
والفاعل من حيث العدد، وذلك يحدث مشكلا في التوليد الآلي كون أن "دخل"
مفرد و"الأولاد" جمع، وعبارة "دخلوا الأولاد" خاطئة في اللغة
العربية صحيحة آليا، لذلك اعتبر التطابق العددي في المثال ]6-أ[ ضروريا، بينما في المثال ]6-ب[ فالتطابق العددي غير ضروري.
5-1-2 التطابق
الجنسي
هو تناسب وتطابق من ناحية
الجنس بين الفعل والفاعل في الجملة الفعلية وبين اسمين كيفما كانت نوعيتهما
النحوية في الجملة الاسمية.
]7[ ذهبت فاطمة إلى المدرسة ¬ هناك تطابق.
]8-أ[ جاءت ثلة من التلاميذ(٭)
]8-ب[ جاء ثلة من التلاميذ(**)
بالنسبة لهذين المثالين، فلا يجب أن
يتحقق التطابق بالضرورة لأن كلا المثالين صحيح، لكن ذلك يحدث مشاكل في التوليد
والتحليل الآلي، لأن الحاسوب لن يحدد الطريقة التي يجب أن يتعامل بها مع هذا النوع
من الجمل؛ باعتماد ضرورة التطابق الجنسي أم بدونه.
5-2- مسألة الضمائر
5-2-1-
الضمير المستتر
إنها مسألة لم يوجد لها تمثيل في الحاسوب بعد، مثل:
]9-أ[ خرج إلى المسجد.
]9-ب[ خرج الإمام إلى المسجد.
إن
الفاعل في الجملة الأولى ]9-أ[ ضمير مستتر تقديره "هو" ولا يظهر
كتابة إنما يقدر وجوده، لأنه مستتر في الفعل، بينما في الجملة الثانية ]9-ب[ فالفاعل اسم ظاهر(الإمام).
5-2-2-
الضمائر المتصلة
نجد في اللغة العربية مثلا كلمة واحدة تتكون من
ثلاث مقولات كبرى: فعل+ فاعل+ مفعول مثل: " أدخلونا"، فهذه
الكلمة تتكون من الفعل "أدخل" أما الواو والنون فهما ضميران متصلان؛
الأول في محل رفع فاعل والثاني في محل نصب مفعول به. فيؤدي هذا الأمر إلى مشاكل
تخص التقطيع الصرفي والتركيبي للكلمات في الحاسوب.
المحور السادس:-المعالجة الآلية للدلالة
يهتم المستوى الدلالي بدراسة معنى الكلمات والتعابير
والجمل ومدى تطابقها مع السياق ومنطق الكلام([13])،
ولذلك يتم معالجة الجملة السابقة[5] دلاليا على هذا النحو:
أكل: + فعل + حدث + يتطلب فاعلا للحدث + يتطلب مفعولا
قابلا للأكل....
الولد: +إنسان + عاقل+ مذكر+.....
الحائط: + جمد+ شيء مرتفع+ غير قابل
للأكل+....
ومن خلال هذا التحليل، يتبين أن الجملة غير مقبولة
دلاليا، لذلك وجب على الحاسوب أن يعطي إشارة بعدم مقبولية الجملة من حيث الدلالة،
ويتسنى ذلك من خلال برمجة السمات الدلالية لكل كلمة على حدة في الحاسوب.
وقد يواجه المعلوماتي في معالجته للمستوى الدلالي آليا بعض المشاكل، فمثلا نجد في اللغة العربية بعض الحروف تؤدي
معاني متعددة وتسمى بحروف المعاني؛ فالواو تارة تكون حرف عطف في:"ذهبت إلى المكتبة
واشتريت كتابا"، وقد تدل على المعية في: "ذهب علي وفاطمة إلى المكتبة"، وقد تدل أيضا على
الحال مثل:"جاء الولد وهو يبتسم"،
وهناك حروف أخرى تشغل وظائف عدة مثل: حتى(حرف جر وأداة عطف)، أو(للتخيير وللإباحة وللشك
وللإضراب وللإبهام وللعطف) لا(العطف والنفي)....وهذا يسبب عائقا أمام المعالجة
الآلية للغة العربية.([14])
المحور السابع:-المعالجة الآلية للتداول
إذا كان
المستوى الدلالي يرتبط بدراسة معنى الكلمات الملفوظة أو المكتوبة، فإن المستوى
التداولي يرتبط بمواقف المتكلم المستعمل لهذه الكلمات، ولتوضيح ذلك نورد المثال
الآتي:
]11.أ[ علي: هل ستأتي عند محمد
هذا المساء؟
[11.ب[ يوسف: أظن أن مصطفى سيكون
هناك.
فالجملة]11.ب[
تدل على أن يوسف لن يأتي، وذلك إذا علمنا أن يوسف لا يحب مصطفى، ومنه فإن هذا
التحليل ليس له علاقة بما هو دلالي بقدر ما له علاقة بموقف يوسف من مصطفى.
أضف إلى ذلك،
أن المستوى التداولي للغة يرتبط أيضا بثقافة كل عشيرة لغوية على حدة، فمثلا إذا
تأملنا هذه الجملة"إن فلانا كثير الرماد" نفهم من كلمة الرماد الوسخ،
بينما تدل هذه الجملة في الثقافة العربية بأن فلانا هذا كثير الكرم، لأنه يستعمل
النار بكثرة لطهي الأكل للضيوف مما ينتج عنه كثرة الرماد.
ومن خلال هذين المثالين نستنتج أن المستوى التداولي يرتبط ارتباطا وثيقا
بالسياق، وبمواقف المتكلم المستعمل للغة وبثقافة كل لغة أيضا، ومنه يصعب على
المعلوماتي برمجة المستوى التداولي لأنه يخرج عن نطاق البنية الصرفية
للكلمة(اللغة). ولذلك لا يوجد إلى حد الآن معالجة آلية لهذا المستوى.
المحور الثامن:- مجالات استثمار المعالجة الآلية للغات الطبيعية
يهدف
الباحثون في مجال المعالجة الآلية للغات الطبيعية -من خلال ابتكار أنظمة
معلوماتية- إلى إنجاز برامج آلية تمكن من خلق حوار إنسان-آلة، وبذلك تستغل نتائج
المعالجة الآلية لكل مستويات الدرس اللساني(الصوتي، والصرفي، والتركيبي، والدلالي) فيما يلي:
- الترجمة الآلية.
-
إنتاج وثائق تقنية وتقارير حول معطيات رقمية كحالة الطقس والميزانية.
-
المساهمة في تطوير الدراسات الخاصة بالوجائهيات حوار إنسان–آلة "Homme-Machin Interfaces " باللغات الطبيعية.
-
ترجمة الكلام المنطوق ومساعدة الأشخاص المعاقين على التواصل.
-
الكتابة الآلية للنصوص كإيراد مجموعة من المفردات المترادفة أثناء الحاجة لها،
وكذلك تصحيح الأخطاء الإملائية والدلالية أيضا.
-
الفهم الآلي للنصوص من خلال تمييز نوعية النص المكتوب وتقديم تلخيص آلي ثم استخراج
الكلمات المفاتيح التي يحتويها النص.
-
تطوير آليات البحث الآلي في الشبكة العالمية للمعلومات، وغيرها.
- البحث الآلي.
- التلخيص الأوتوماتيكي للنصوص.
-......
خلاصة المبحث الثاني
لقد حاولنا في هذا المبحث أن نقدم فكرة مقتضبة عن طريقة
معالجة مستويات الدرس اللساني للغة العربية على أساس آليتي التحليل والتوليد،
وباعتبار أن المعالجة الآلية للغات الطبيعية تقوم على لغة اصطناعية، قدمنا تمييزا
بين اللغة الطبيعية واللغة الاصطناعية، ومنه توصلنا إلى بعض الخلاصات وهي كالآتي:
-
رغم أن اللغة
الطبيعية ترتبط بالإنسان (مستعملها)، واللغة الاصطناعية (المعلوميات) ترتبط بالآلة
إلا أنهما متكاملان، فكلاهما واصف للآخر.
-
تعترض
المعالجة الآلية لمستويات الدرس اللساني مجموعة من الصعوبات ويرجع ذلك إلى البنية
المركبة والمعقدة نوعا ما للغة العربية، وكثرة مفرداتها أيضا.
- لم يتمكن بعد فريق المعالجة الآلية للغة العربية من برمجة المستوى التداولي كونه يرتبط بثقافة، وبيئة، ومحيط اللغة المستعملة، مع العلم أن المعالجة الآلية للغة تتخذ من بنية الكلمة القاعدة الأساس في المعالجة، لذلك فلا يمكن برمجة ما هو خارج عن نطاق البنية الصرفية للغة.
[1]
- - فطوم القرييش، كيفية إنشاء
قاعدة معلوماتية صرفية للفعل المشتق من الجذر الثلاثي السالم في اللغة العربية، بحث لنيل شهادة الماستر، ،
ص:13
[2].François
Yvon ,
Une petite introduction au
Traitement Automatique des LanguesNaturelles.p 1.2.3
[3]
- فطوم القرييش،
كيفية
إنشاء قاعدة معلوماتية صرفية للفعل المشتق من الجذر الثلاثي
السالم في اللغة العربية، بحث لنيل شهادة
الماستر، ص:16.
[4] - Jacqueline Léon, La constitution du TAL étude historique les
dénominations et des concepts Marcel Cori
p: 26.
*
- ومما تهتم به اللسانيات التطبيقية تطوير أنظمة
معلوماتية خاصة بالمعالجة الآلية للغة، إنها بخلاف اللسانيات النظرية التي تهتم
بدراسة اللغات الطبيعية من خلال مثلا الدراسة التاريخية التي تبحث في الأصول
التاريخية للغة ومراحل تطورها أيضا، أو من خلال الدراسة البنيوية التي تقوم على
دراسة المكونات الداخلية للغة باعتبارها بنية مغلقة مكتفية بذاتها.
[5]
-http://www.larousse.fr/dictionnaires/francais/travail_travaux/79284/synonyme.
[6]
- سالم الرامي، بلورة نسق لتوليد الصور المعجمية والكلمات في
اللغة العربية، بحث لنيل شهادة الدكتوراه،
ص،ص: 46-47.
[7]
- عمر مهديوي، توليد الأسماء من
الجذور الثلاثية المقلة مقاربة لسانية حاسوبية، رسالة لنيل دبلوم الدراسات العليا
ص:60.
[8]
- سالم الرامي، بلورة نسق لتوليد الصور المعجمية و الكلمات في
اللغة العربية، ص: 49.
[9]- Guy Perrier,Initiation au traitement automatique des langues ( http://www.loria.fr)
[10]- Aené Boite, Hervé Bourlard, thierry
Dutoit, joël Hancq ,et Henri Leich ,Traitement de la parole, nouvelle
édition, ISBN 2-88074-388-5 , 2000 presses polytechnique université
romands, p : 6.
[11]
-Youssef Tahir,
Modélisation A Objets d'une Base de Données Morpho-Syntaxiques pour
* المقصود بذلك بأن
الجملة المنتجة تتقيد بالقواعد الإعرابية والنحوية التي يقوم عليها تكوين تركيب
معين لجملة ما.
**المقصود بذلك بأن
الجملة تتقيد بالسمات الدلالية المقترنة بكل كلمة على حدة في التركيب النحوي
المنتج.
[12]
-
Youssef Tahir, Modélisation A Objets
d'une Base de Données Morpho-Syntaxiques pour
٭- في هذه العبارة تحقق التطابق الجنسي باعتبار أن لفظة ثلة
مؤنث.
**_
لم يتحقق التطابق الجنسي بين الفعل(جاء)والفاعل(ثلة)،
لكن تحقق هذا التطابق بين الفعل(جاء) والاسم المجرور(التلاميذ).
[13] -
انظر ,Traitement automatique de la langue(texte et parole) PP 32 33,
Dr,yousfi
abdellah
[14] - فطوم القرييش، كيفية إنشاء قاعدة
معلوماتية صرفية للفعل المشتق من الجذر الثلاثي السالم في اللغة العربية، بحث لنيل شهادة الماستر، ص:
66.
تعليق