1. Abstraction of NLP - تجريدُ معالجةِ اللغاتِ الطبيعية
- published
- reading time
- 1 minute
- Written by
- Mayar Osama
- Translated by
- AbdulRahman Ateyya
We as humans, by nature, understand text “natural language”; machines, by nature, understand numbers (in one way or another numerical representation).
If we want to visualize any NLP task, it could be viewed as:
- Taking text as input.
- Preprocessing it and getting the numerical representation of this text.
- Passing it to a model to “understand” the input to extract the needed features and perform the given task.
- Taking the output from the model, which would be represented as some numerical representation as well, and post-processing it to convert this output into some text (if needed).
تجريدُ معالجةِ اللغاتِ الطبيعية: نحن -البشرَ- بطبيعتِنا نفهمُ النصوصَ (اللغةَ الطبيعيةَ)، أما الآلاتُ فطبيعتُها أنها تفهمُ الأرقامَ (تمثيلاتٍ رقميةً بصورةٍ أو بأخرى). إذا أرَدْنا أن نستعرضَ إحدى مهماتِ معالجةِ اللغاتِ، فسنجدُها كالآتي:
- تحصيلُ النصِّ المُدْخََل.
- تحضيرُه للمعالجة (وهو ما يسمى بالمعالجةِ المسبقة).
- تحويلُ النصِّ إلى صيغةٍ رقميةٍ.
- إدخالُ الصيغةِ الرقميةِ إلى النموذجِ لفهمِ النصِّ.
- استخلاصُ السماتِ اللازمةِ للمعالجةِ.
- إجراءُ المهمةِ/العمليةِ المطلوبةِ.
- الآنَ حصلنا على مُخْرَجَاتِ النموذج.
- أخيرًا، معالجةُ هذه المُخْرَجاتِ لتحويلِها إلى صورةٍ مفهومةٍ (نصيّةٍ) بحسبِ ما تقتضيه المهمة.