logo

logo

logo

logo

logo

الانتولوجيا

انتولوجيا

Ontology (information technology) - Ontologie (technologie de l'information)

الأنتولوجيا

غيداء ربداوي

مكوّنات الأنتولوجيا

لغات توصيف الأُنتولوجيا

هندسة الأُنتولوجيا

تطبيقات الأُنتولوجيا

 

يعود أصل الكلمة أُنتولوجيا ontology إلى الميتافيزيقا، وهي أحد فروع الفلسفة، وتهتم بطبيعة الوجود. يدرس هذا العلم الكائنات (الأشياء) الموجودة في الطبيعة، والعلاقة بين الكائنات والكلمات التي تدل عليها.

ولعل «مثلث المعنى» من أهم ما قُدّم في هذا المجال؛ إذ تُعرَّف العلاقة بين الأشياء والكلمات باستخدام عنصر ثالث هو المفهوم (الشكل 1).

الشكل(1): مثلث المعنى

استُخدمت كلمة أُنتولوجيا حديثاً في مجال علوم الحاسوب للدلالة على تمثيل المعرفة في مجال من المجالات. وللأُنتولوجيا تعاريف كثيرة تشترك جميعاً في أنها تشير إلى نموذج لوصف العالم، يتألف من مجموعة من الأنماط ومن الخصائص التي تتميز بها والعلاقات بينها. تُعرِّف الأُنتولوجيا إذاً لغةً مشتركةً للباحثين الذين يحتاجون إلى مشاركة معلوماتهم مع الآخرين في مجال معيّن؛ فضلاً عن استخدامها في التعبير عن ذلك النموذج بلغة يسهل على الآلة فهمها.

مكوّنات الأنتولوجيا

تشترك جميع الأنتولوجيات التي تمثّل المعرفة في المجالات المختلفة باحتوائها على المكوّنات ذاتها، فمعظم الأنتولوجيات تتناول المفاهيم concepts المتصلة بمجال ما والعلاقات relations بينها، كما تحدِّد خصائص attributes هذه المفاهيم والمنتسخات instances المحدّدة التي تنتمي إليها، إضافة إلى بعض المعارف والبديهيات التي تحققها هذه المفاهيم. وهذه المكوّنات هي:

* الصفوف classes: تشمل الأصناف التي تعبر عن المفاهيم، وهي عادةً مجموعات من العناصر تدل على النوع الذي تنتمي إليه جميع عناصر المجموعة، فمثلاً مفهوم السيارة يعبّر عن عربة ذات أربع عجلات يمكنها السير على الأرض وتُستخدم للنقل؛ ومن ثمّ فإن مفهوم السيارة السابق يشمل جميع أنواع السيارات سواءً أكانت شاحنات أم باصات أم سيارات للأجرة.

* العناصر: تسمى أيضاً بالأغراض، وهي تعبّر عن تجسيد واقعي للصف في أمثلة مخصّصة من المفهوم الذي يدل عليه الصف؛ فمثلاً سيارة الأجرة هي غرض من الصف «سيارة».

* الخصائص: يُقصد بها الصفات والمميزات والسمات التي تمتلكها الأغراض مثل الاسم والأجزاء المكوّنة للأغراض، وفي مثال السيارة يكون رقم اللوحة واللون من الخصائص.

* العلاقات: تصف الطرائق التي ترتبط بها الصفوف والأغراض فيما بينها، مثل علاقة التعميم والتخصيص أو علاقة جزء من كل أو غيرها.

* البديهيات والمسلّمات: هي معارف تتعلق بالمفاهيم ويُعبّر عنها بعلاقات منطقية يمكن التحقّق منها.

* التوابع functions : وهي تربط عناصر مفهوم ما، وتُعدّ علاقات ذات ناتج وحيد.

لغات توصيف الأُنتولوجيا

هناك العديد من اللغات لتوصيف الأُنتولوجيا والتعامل معها، وفي العديد من المجالات. بعض هذه اللغات مبني على منطق الدرجة الأولى First order logic مثل: KIF, Common Logic, CycL، وبعضها الآخر يعتمد على اللغات التأشيرية XML وهي الأكثر رواجاً لأنها تُستخدم في الوِب الدلالي Semantic Web. وفيما يلي بعض اللغات التأشيرية:

* لغة توصيف الموارد RDF:

نشأت لغة توصيف الموارد (RDF) Resource Description Framework  بهدف توصيف الوثائق المنشورة على الوِب قبل اعتماد الأُنتولوجيا في الوِب الدلالي، ثم استُخدِمت لبناء الأُنتولوجيا. يوضح الشكل (2) أُنتولوجيا تعبّر عن بنية صفحة وِب. إن المفهوم هنا هو صفحة وِب، ولهذه الصفحة خصائص: هي المؤلف وتاريخ الإنشاء وتاريخ التعديل.

يمكن توصيف الأنتولوجيا السابقة باستخدام اللغة RDF كما في الشكل (3):

الشكل(2): أنتولوجيا بنية صفحة ويب

الشكل(3)

لا تملك RDF القدرة التعبيرية الكاملة لتمثيل الأُنتولوجيا، فمثلاً لا يمكن تعريف علاقة هرمية بين الصفوف، ولا يمكن تحديد القيود على القيم، ولا ترتبط هذه اللغة بأي لغة منطقية بهدف البحث.

* لغة مخطط توصيف الموارد RDFS

جرى توسيع اللغة RDF إلى لغة مخطط توصيف الموارد (RDFS) RDF schema  لزيادة قدرتها التعبيرية بإجراء الإضافات التالية:

- يُعدّ الصف rdfs:resource صفاً يمثل أي مورد.

- جرى تعريف علاقة الهرمية بين الصفوف؛ إذ تُعدّ الصفوف نسخاً من الصف rdfs:class، وتعرّف الهرمية بين الصفوف باستخدام rdfs:subClassOf. ومثال ذلك الأُنتولوجيا الخاصة بمرض السرطان. يمكن التعبير عن الهرمية بين مفهومي مرض السرطان والمرض كما يلي:

يُعرّف الصف أو المفهوم «مرض»، ثم يُعرّف الصف «مرض السرطان» وهو صف فرعيsubclass من «مرض»، وبهذا يجري إنشاء علاقة تخصيص من «مرض» باتجاه «مرض السرطان» على النحو المبين في الشكل (4).

الشكل(4)

− جرت إضافة خصائص للصفوف للتعبير عن العلاقات مع صفوف أخرى:

تُستخدم الكلمة property للتعبير عن أي خاصية في الصف، ويمكن للخاصية أن تملك أكثر من صف كمجال (domain) ويكون لها طيف قيم وحيد (range).

يمكن إذاً التعبير عن علاقة المرض مع العلاج كما هو مبين في الشكل (5).

الشكل(5)

وعلى الرغم من الإضافات التي أُدخلت على اللغة RDFS؛ فإنها لا تحتوي على ربط مع أي لغة منطقية للبحث ضمن الأُنتولوجيا.

* لغة الأنتولوجيا للوب (OWL) Ontology Web Language :

قام الائتلاف W3C ببناء لغة الأُنتولوجيا للوِب (OWL) عام 2004 كإصدار جديد من لغة سابقة هي DAML+OIL. وقد بُنيت توسعة للغات السابقة XML, RDF, RDFS. إضافة إلى ذلك فقد بُنيت اللغة OWL اعتماداً على مبادئ وأساسيات المنطق الوصفي description logic، وأصبحت قادرة على استخدام طرائق وخوارزميات البحث التي تعتمد على هذا المنطق، فالأُنتولوجيا في لغة OWL هي مجموعة من الفرضيات أو الحقائق التي تصف الصفوف وخصائصها، إضافة إلى مجموعة من الحقائق عن الأغراض.

يوضح المثال المبين في الشكل (6) بعض هذه الخصائص.

الشكل(6)

تجدر الإشارة إلى تعريف مرض سرطان الكبد تعريفاً كاملاً في مكان واحد وعلى نحو واضح، وتعريف مجال القيم التي يأخذها علاج مرض سرطان الكبد بالعبارة allValuesFrom. ومن ثمّ يمكن تحديد مجال القيم بتعريف مجموعة collection، وهي اجتماع جميع الصفوف التي يمكن أن تأخذ العلاقة منها قيمها.

يبيّن المثال المبين في الشكل (7) طريقة تعريف علاقة العلاج بالمرض باستخدام اللغة OWL إضافة إلى تعريف مجال هذه العلاقة. ويُلاحظ أنه جرى تعريف العلاقة على أنها علاقة انعكاسية لعلاقة المرض بالعلاج بوساطة العبارة inverseOf.

الشكل(7)

هندسة الأُنتولوجيا

تُعدّ هندسة الأُنتولوجيا أحد فروع هندسة المعرفة الذي يدرس المنهجيات والطرائق المستخدمة في بناء الأُنتولوجيا. تشمل هندسة الأُنتولوجيا المواضيع المتعلقة بإجرائية تطوير الأُنتولوجيا، ودورة حياتها، ومنهجيات تطويرها، والأدوات واللغات التي تدعم هذه الإجرائية والمنهجيات.

تهدف هندسة الأُنتولوجيا إلى إظهار المعرفة الضمنية الكائنة داخل التطبيقات البرمجية؛ سواء أكانت هذه المعرفة تتعلق بمجال محدّد أم بإجرائيات العمل في الشركات، وهي بذلك تسمح بإتاحة تشاركية المعرفة، وهذا ما يسهّل التفاعل ويقلّل المعوقات الناتجة من الفهم الخاطئ أو الملتبِس. تتضمن منهجية بناء الأُنتولوجيا عموماً المراحل التالية:

1 - تحديد مجال الأنتولوجيا ومداها

قبل البدء ببناء الأُنتولوجيا لا بدّ من تحديد المجال المطلوب بناء الأُنتولوجيا له، يجري خلال هذه المرحلة وضع تصور أولي عن المعلومات التي يجب أن تحويها الأُنتولوجيا؛ وتحديد التساؤلات التي يجب أن تكون الأُنتولوجيا قادرة على الإجابة عنها.

2 - تحديد التعابير

تتضمن تحديد جميع التعابير والمصطلحات التي تخص المجال؛ لأن الكلمات والتعابير والمصطلحات هي التي تعبّر عن المفاهيم.

3 - تحديد المفاهيم

يمكن الاستفادة من التعابير في تحديد الصفوف. بدايةً يُفترض أن كل تعبير يقابل صفًّا ولكن مع زيادة الخبرة في المجال يتقلص عدد الصفوف.

4 - تحديد الخصائص

بعد تحديد المفاهيم يجري البحث عن الخصائص المميّزة لكل مفهوم.

5 - تحديد الهرمية بين الصفوف

تُعرّف التراتبية أو الهرمية بين الصفوف بأنها علاقة تربط الصفوف الأعم بالصفوف الأخص. ولبناء هذه الهرمية ثمة خياران: إيجاد الصفوف الأخص ثم التعميم، أو إيجاد الصفوف الأعم ثم التخصيص.

6 - تحديد العلاقات غير الهرمية بين الصفوف

قد تربط بين الصفوف علاقات تختلف عن علاقات التخصيص والتعميم. تسمى هذه العلاقات بالعلاقات غير الهرمية، وهي تعبّر عن خصائص هذا الصف وعلاقته بالصفوف الأخرى.

في بعض الحالات يستفاد من أُنتولوجيات سابقة إن وجدت.

تطبيقات الأُنتولوجيا

ظهرت الأُنتولوجيا في بداية الألفية الثانية حلاً لمشكلة الحجم المتزايد للوثائق والمعلومات؛ وقد جمعت في خصائصها بين قواعد المعطيات وقواعد المعرفة؛ إذ يمكن أن تُستخدم لتخزين المعلومات في بنى أكثر ديناميكية، كما يمكن استخدامها أيضاً للبحث واستنتاج معلومات جديدة من المعلومات المخزّنة بالاعتماد على طرائق المحاكمة المنطقية. وتُستخدم الأُنتولوجيا أيضاً بوصفها شكلاً لتمثيل المعرفة عن العالم أو عن جزءٍ منه، وتكون أحياناً بسيطةً مثل مكنزٍ ذي تعريفات، أو أكثر تعقيداً بحيث تتضمن تصنيفاً هرمياً للمفاهيم والفئات، وقد تكون حلاً تقنيًّا للمشكلات القائمة على الدلالة للمشاركة في المعلومات.

وفي المدة الأخيرة أصبحت الأُنتولوجيا تُستخدم في العديد من المجالات والأعمال التجارية والمجتمعات العلمية وسيلةً لإعادة الاستخدام وتقاسم المعرفة، وباتت محور كثير من التطبيقات؛ مثل: بوابة المعرفة العلمية، وإدارة نظم المعلومات، والتطبيقات الطبية والوراثية، والذكاء الصُّنْعي، وهندسة النظم، وعلم المكتبات، والحكومة الإلكترونية، والتجارة الإلكترونية، ونظم المعلومات الجغرافية، ومعالجة اللغات الطبيعية، وخدمات الوِب الدلالي.

ويعدّ الوِب الدلالي المجال الأوسع انتشاراً الذي أسهمت الأُنتولوجيا في بنائه بهدف رفع كفاءة عمليات استخراج المعلومات وتقنيات البحث في الوِب. تدعم الأُنتولوجيا الوِب الدلالي عن طريق استخدامها في التطبيقات التالية:

• وسم الوثائق بالأنتولوجيا: يهدف هذا التطبيق إلى ربط المعلومات الموجودة داخل الوثائق بالمعلومات الموجودة داخل أُنتولوجيا محدّدة. يفيد هذا الربط في تحديد المعاني التي تحويها الوثيقة، إضافةً إلى تحديد العلاقات بين هذه المعاني. تُعدّ هذه العملية النواة الأساسية لمعظم التطبيقات التي تعتمد على الأُنتولوجيا.

• بناء الوِب الدلالي: تُعدّ الأُنتولوجيا المكوّن الرئيس الذي يجعل الآلة قادرةً على فهم الوِب الدلالي؛ إذ توفر الربطَ الدلالي بين محتويات الوِب عن طريق استخدام مجموعة العلاقات الموجودة داخلها. توفّر الأُنتولوجيا إذاً - بحسب بنيتها- تصنيفاً للوِب معتمداً على الدلالة، وهذا ما يتيح إمكان التجوّل السهل ضمن هذا الوِب الضخم. وتسمح آليات البحث التي تدعمها الأُنتولوجيا بتوفير بحثٍ دلاليٍّ أدق في الوِب.

• استرجاع المعلومات: يعني هذا المصطلح عموماً جلب نتائج مطابقة دلالياً أو حرفياً لاستعلام يطلبه المستخدم. تعتمد تقنيات استرجاع المعلومات إذاً على التطابق الحرفي أو التطابق الدلالي. تُعدّ الأُنتولوجيا أهم الحلول المستخدمة لتحقيق التطابق الدلالي؛ إذ تعطي الأُنتولوجيا المعاني المختلفة لكلمات الاستعلام ليجري العمل على مطابقتها مع معاني الوثائق التي يُبحث في داخلها. في بعض الحالات تُستخدم الأُنتولوجيا مباشرةً واجهةً للمستخدم يتجوّل بوساطتها داخل الوثائق للوصول إلى الوثائق التي يحتاج إليها.

• استخراج المعلومات: يقوم على تلخيص المعلومات النصية وإعادة تشكيل بنيتها. تُستخدم الأُنتولوجيا لتحديد البنية التي سيُعاد تشكيل المعلومات ضمنها؛ إذ يُوسَم النص بهذه الأُنتولوجيا لمعرفة المفاهيم والعلاقات التي يحتويها، وبهذا يمكن استخراج بنية النص التي تمثل المفاهيم والعلاقات الموجودة فيه.

• عنقدة النصوص clustering: هي العملية المسؤولة عن فرز النصوص وتجميعها ضمن مجموعات. تَعتمد الخوارزميات عادةً على تكرار الكلمات في النصوص لتحقيق هذا التجميع، غير أنَّ هذه الطريقة لا تأخذ بالحسبان المحتوى الدلالي للنصوص. يسمح استخدام الأُنتولوجيا لوسم هذه النصوص واستخراج المفاهيم والعلاقات الموجودة فيها؛ بتجميعها باستخدام مفهوم ما ومجموعة مرادفاته، وهذا ما يؤدي إلى تقليص عدد مجموعات التجميع.

أمثلة عن الأُنتولوجيا

يتوافر العديد من الأُنتولوجيات المنشورة في مجالات مختلفة؛ والمكتوبة بلغات الأُنتولوجيا المختلفة، منها

- أنتولوجيا  Dublin Core: تتضمن المعارف المتعلقة بمجال التوثيق والنشر

- أنتولوجيا Disease Ontology: تتضمن تعريف الأمراض وترميزها.

- أنتولوجيا WordNet: تتضمن المفاهيم المتعلقة بالمفردات العامة في اللغة.

- نُفّذت مشاريع عديدة لبناء أُنتولوجيا للمفردات العامة في اللغة العربية في مشرق الوطن العربي ومغربه، منها مشروع «استخراج الأُنتولوجيا من المعجم التفاعلي» في المعهد العالي للعلوم التطبيقية والتكنولوجيا بدمشق.

يتوفر بعض هذه الأُنتولوجيات في الإنترنت لأغراض التعلّم والبحث والتطوير.

       : مراجع للاستزادة 

-S. Kendal & M. Creen, An Introduction to Knowledge Engineering, Springer, 2006.

_F.Natalya,OntologyEngineeringf ortheSemantic Web and Beyond, McGuinness, 2001                                                                                                         .

- W. Yu, Software Engineering and Knowledge Engineering, Springer, 2012.                                                                                                                     


التصنيف : الهندسة المعلوماتية
النوع : الهندسة المعلوماتية
المجلد: المجلد الثالث
رقم الصفحة ضمن المجلد : 0
مشاركة :

اترك تعليقك



آخر أخبار الهيئة :

البحوث الأكثر قراءة

هل تعلم ؟؟

عدد الزوار حاليا : 549
الكل : 29574118
اليوم : 29034