مؤخرًا رأيت مقابلة لمؤسس DeepMind Hassabis على YC، وكانت بعض وجهات نظره صادمة جدًا. قال إنه إذا بدأت مشروع تكنولوجيا عميقة يمتد لعشر سنوات، يجب أن تضع في خطتك ظهور الذكاء الاصطناعي العام في منتصف الطريق. هذا ليس كلامًا مبالغًا فيه، فهو يعتقد أن الجدول الزمني الشخصي له هو حوالي عام 2030.



عندما استمع إلى تفاصيله التقنية، أدركت لماذا لا يزال هناك قطعة أو اثنتان مفقودتان من اللغز الخاص بالذكاء الاصطناعي العام. التقنيات مثل التدريب المسبق على نطاق واسع، RLHF، وسلاسل التفكير قد تم إثبات فعاليتها، وهو متأكد من أنها ستصبح جزءًا من الهيكل النهائي للذكاء الاصطناعي العام. لكن التعلم المستمر، الاستنتاج على المدى الطويل، وبعض جوانب الذاكرة لم تُحل بعد بشكل كامل. الأسلوب الحالي هو بشكل أساسي حشو كل شيء في نافذة السياق، وهو أمر قاسي جدًا. على سبيل المثال، قال إن نافذة السياق التي تتسع لمليون توكن تبدو كبيرة، لكن إذا كان عليك معالجة تدفق فيديو مباشر، فهي تكفي فقط لـ20 دقيقة من البيانات. لإيصال فهم النظام لحياتك لمدة شهر أو شهرين، هذا غير كافٍ على الإطلاق.

أما بالنسبة لمشكلة الاستنتاج فهي أكثر إثارة للاهتمام. هو غالبًا يستخدم لعبة الشطرنج Gemini كمثال، ويلاحظ أنه أحيانًا يدرك أن خطوة معينة سيئة، لكنه لا يجد خيارًا أفضل، فيضطر إلى اتخاذ تلك الخطوة السيئة. نظام الاستنتاج الدقيق لا ينبغي أن يكون هكذا. لهذا السبب نرى ما يُسمى بـ"الذكاء المتموج" — القدرة على حل مسائل من مستوى ميداليات أولمبياد الرياضيات، لكنه يُحبط أحيانًا من قبل مسائل رياضيات ابتدائية.

أما فيما يخص الوكيل (Agent)، فهو يعترف بأننا بدأنا للتو. لتحقيق الذكاء الاصطناعي العام، نحتاج إلى نظام قادر على حل المشكلات بشكل نشط نيابة عنك، وهذا هو طريق الوكيل. لكننا لا زلنا في مرحلة التجربة، ومعظم السيناريوهات لا تزال تكميلية. ذكر أنه لم يرَ بعد أحدًا يستخدم أدوات الذكاء الاصطناعي لإنشاء ألعاب AAA تتصدر قوائم التطبيقات، على الرغم من أن القدرة على ذلك من الناحية النظرية ممكنة باستخدام القوة الحاسوبية والأدوات الحالية، لكن لم يحدث بعد. هذا يدل على أن هناك نقصًا في العمليات أو الأدوات. يتوقع أن يرى نتائج كهذه خلال 6 إلى 12 شهرًا القادمة.

المثير للاهتمام هو أن النماذج الصغيرة تغير قواعد اللعبة تمامًا. نموذج Flash الخاص بهم يمكن أن يصل إلى 95% من أداء النماذج الرائدة، ولكن بتكلفة تقدر بعشرها فقط. عملية التقطير (Distillation) هذه كانت من اختراعات DeepMind، وما زالت تعتبر من بين الأفضل عالميًا. ولديهم دافع كبير لتحسينها — حيث أن Google تدمج Gemini في كل منتجاتها، وتخدم مئات الملايين من المستخدمين. هذا يعني أن السرعة والكفاءة والتكلفة يجب أن تكون عالية جدًا. لا يعتقد أنهم وصلوا بعد إلى الحد الأقصى لنظرية المعلومات، فبعد إصدار نموذج رائد، يمكن خلال ستة أشهر إلى سنة ضغط قدراته ليعمل على نماذج على الأجهزة الطرفية.

بالنسبة للتطبيقات العلمية، تقدم شركة Isomorphic Labs بشكل جيد، وAlphaFold هو مجرد جزء من عملية اكتشاف الأدوية. هدفهم النهائي هو إنشاء خلية افتراضية كاملة، محاكٍ كامل الوظائف يمكنه التفاعل مع التغيرات. يقدرون أن الوصول إلى خلية افتراضية كاملة لا يزال يتطلب حوالي عشر سنوات، ويبدأون الآن من نواة الخلية الافتراضية.

أما النصيحة الأكثر فائدة لرواد الأعمال فهي أن المشكلة الصعبة والبسيطة ليستا مختلفتين من حيث الصعوبة، بل تختلفان في الطريقة. الحياة محدودة، لذلك من الأفضل أن تركز طاقتك على الأمور التي لن يفعلها أحد غيرك إذا لم تفعلها أنت. بالإضافة إلى ذلك، في السنوات القادمة، ستصبح التداخلات بين التخصصات أكثر شيوعًا، وسيسهل الذكاء الاصطناعي عملية التداخل بين المجالات. لكن الأهم هو أن تأخذ جدول زمني للذكاء الاصطناعي العام على محمل الجد، وتتصور كيف سيكون العالم حينها، ثم تبني شيئًا يظل مفيدًا عندما يأتي ذلك العالم.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت