لأكثر من 50 عاماً، كان الذكاء الاصطناعي "ضحلاً". كان يستطيع لعب الشطرنج، لكنه يعجز عن تمييز القطة من الكلب. في عام 2012، تغير كل شيء. ظهر "التعلم العميق"، وفجأة أصبحت السيارات تقود نفسها، والهواتف تتحدث معنا، والأطباء الآليون يشخصون السرطان بدقة تفوق البشر.

لماذا سمي بـ "العميق"؟

ببساطة، لأنه يستخدم شبكات عصبية ذات طبقات متعددة (Deep Neural Networks). الشبكات القديمة كانت تملك طبقة واحدة أو اثنتين. اليوم، شبكات مثل ResNet تملك مئات الطبقات (152 طبقة!). هذا العمق يسمح للآلة بتعلم مفاهيم مجردة ومعقدة للغاية لا يستطيع العقل البشري حتى تخيلها.

أشهر معماريتين في العالم (Architectures)

هنا يكمن سر نجاح Deep Learning:

  • CNN (Convolusional Neural Networks): عيون الذكاء الاصطناعي. مستوحاة من القشرة البصرية في دماغ القطط! تقوم بمسح الصورة بـ "مرشحات" (Filters) صغيرة لتكتشف الحواف، والزوايا، والأنسجة. هي الأساس في التعرف على الوجوه، والسيارات ذاتية القيادة، وتشخيص الأشعة الطبية.
  • RNN / Transformers: ذاكرة الذكاء الاصطناعي. هي تفهم "التسلسل". الكلمات في الجملة لها معنى فقط في سياق ما قبلها وما بعدها. هذه الشبكات تتذكر الماضي لتتوقع المستقبل. هي الأساس في الترجمة الآلية، Chatbots (مثل ChatGPT)، وتحليل الصوت.

السر وراء الانفجار: البيانات + القوة الحاسوبية

لماذا نجح التعلم العميق الآن وليس في الثمانينات؟

  1. البيانات الضخمة (Big Data): الإنترنت وفر تريليونات الصور والنصوص لتدريب هذه الوحوش الجائعة.
  2. وحدات المعالجة الرسومية (GPUs): اكتشفنا بالصدفة أن كروت الشاشة التي نستخدمها لألعاب الفيديو (NVIDIA) ممتازة جداً في إجراء العمليات الحسابية المتوازية المطلوبة للشبكات العصبية.

هل وصلنا للنهاية؟

بالعكس، نحن في البداية فقط. الآن، العلماء يحاولون دمج القوة البصرية (Vision) مع القوة اللغوية (Language) في نماذج "متعددة الوسائط" (Multimodal). تخيل نموذجاً يستطيع مشاهدة فيلم كامل، وفهمه، ونقده، واقتراح نهاية بديلة له! هذا هو الجيل القادم (GPT-5 وما بعده).