شارك المراقبون على الذكاء الاصطناعي “xiaohu” في 10 مايو مثالاً على سير عمل يجمع بين GPT وGemini 3.1 Pro: يبدأ باستخدام GPT لتوليد الصور، ثم يستخدم Gemini 3.1 Pro لتحويل الصور إلى محتوى تفاعلي ثلاثي الأبعاد، ويمكن من خلاله تحويل أي موضوع معرفي إلى تطبيقات علمية قابلة للدوران وقابلة للتشغيل. وتعرض تغريدة xiaohu مثالاً يشمل عروض كواكب ثلاثية الأبعاد ونماذج علمية تفاعلية وغيرها، وهو تطبيق عملي محدد لما يُسمّى “سير عمل متعدد النماذج” (multi-model workflow).
بنية سير العمل: GPT لإنشاء الصور → تحويلها إلى 3D باستخدام Gemini 3.1 Pro
التصميم على مرحلتين لسير العمل بأكمله:
المرحلة الأولى: استخدام GPT (GPT-image-1 أو توليد الصور المدمج داخل ChatGPT) لإخراج صورة مرتبطة بالموضوع وتوفير أساس بصري
المرحلة الثانية: إدخال الصورة إلى Gemini 3.1 Pro، حيث يقوم Gemini بتحويل صورة ثنائية الأبعاد إلى محتوى تفاعلي ثلاثي الأبعاد
شكل الإخراج: كائنات ثلاثية الأبعاد قابلة للدوران والتكبير والتفاعل داخل المتصفح
حالات الاستخدام: التعليم العلمي، عرض المنتجات، محتوى تفاعلي قائم على المعرفة
يُعدّ “سير العمل متعدد النماذج” أحد أبرز الاتجاهات الرئيسية في طبقة تطبيقات الذكاء الاصطناعي لعام 2026 — فلم يعد نموذج واحد هو الأداة الشاملة، بل يقوم المطورون بربط أفضل ما لدى نماذج مختلفة، لإنجاز تطبيقات لا يستطيع نموذج واحد تنفيذها.
عرضٌ محدد: كواكب ثلاثية الأبعاد، محتوى علمي تفاعلي، مواقع ويب لبيع السلع بواسطة الروبوتات
المحاورات المتعددة التي نشرها xiaohu في الوقت نفسه:
عرض الكواكب ثلاثية الأبعاد: نظام شمسي قابل للدوران أو نموذج لكوكب واحد
محتوى علمي تفاعلي: تحويل المعرفة المجردة إلى تصور ثلاثي الأبعاد، مناسب للأغراض التعليمية
الموقع المستقبلي لبيع السلع بواسطة آلات البيع الروبوتية: استخدام توليد الصور من GPT مع منصة Tripo 3D لإخراج صفحة ويب للعرض
السمات المشتركة لهذه الأمثلة هي “التوليد البصري + التحويل إلى تفاعل” — إذ يتولّى GPT المسؤولية عن التصورات البصرية الإبداعية، بينما تتولى Gemini أو أدوات ثلاثية الأبعاد أخرى تحويل الصور الثابتة إلى أشكال تفاعلية قابلة للتشغيل. كل جزء على حدة ليس جديداً، لكن التجربة النهائية بعد ربطها معاً تكون أقوى من أي أداة منفردة.
المعنى: يصبح سير العمل متعدد النماذج تدريجياً نمط التطوير السائد
الدروس العملية للمطورين:
اختيار الأدوات أهم من اختيار أقوى نموذج — إذ يتميز GPT بالجانب البصري، وGemini بفهم متعدد الوسائط، وClaude بقدرات سياق طويلة، ولكل طرف “نقطة قوة” خاصة به
انخفاض تكلفة دمج واجهات برمجة تطبيقات النماذج، ما يجعل ربط عدة نماذج على مستوى التنفيذ أمراً قابلاً للتحقق
قد تكون التطبيقات الجديدة على الأرجح عبارة عن “خط أنابيب متعدد النماذج” لا مجرد امتداد لـ “أفضل نموذج واحد”
قيمة هذا الطرح لا تكمن في اختراق تقني، بل في توفير نموذج لتصميم سير العمل
أحداث محددة يمكن متابعتها لاحقاً: ما إذا كانت قدرة Gemini 3.1 Pro على توليد 3D سيتم الإعلان عنها رسمياً كميزة منتج من قِبل Google في نشاط لاحق، وما إذا كان سير العمل متعدد النماذج سيحصل على دعم قوالب افتراضية ضمن أطر مثل LangChain/LlamaIndex، إضافة إلى أمثلة تطبيقية محددة لحالات الاستخدام التجارية (مثل التعليم والتجارة الإلكترونية والتسويق).
ظهرت هذه المقالة التي يعرض فيها xiaohu سير العمل متعدد النماذج لأول مرة في ABMedia ضمن سلسلة أخبار السلسلة.
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
تطلق Alibaba Cloud اليوم خطة رموز الفريق مع أكثر من 10 نماذج
بحسب Beating، أطلقت Alibaba Cloud اليوم خطة Team Token الخاصة بها، مقدمة اشتراكات لأكثر من 10 نماذج لغوية كبيرة، بما في ذلك Qwen 3.6 وKimi-K2.6 وGLM-5.1 وWan 2.7. يمكن للمستخدمين التبديل بمرونة بين النماذج لتوليد الأكواد وتوليد الصور وغيرها من المهام. تختلف نسخة الفريق عن الخطط الشخصية عبر ميزات إدارة موجهة للشركات. يستطيع المسؤولون إدارة توزيع المقاعد وتتبع الاستخدام وتعيين ضوابط الميزانية عبر ثلاث فئات: Standard وPremium وElite. تتضمن المنصة عزل تعدد المستأجرين وحماية خصوصية بيانات على مستوى ا
GateNewsمنذ 1 س
تشحن دونغقوان نصف نظارات الذكاء الاصطناعي في العالم في 2025
شحنَت شركات مقرها دونغقوان أكثر من 4 ملايين زوج من نظارات الواقع المعزز/الذكاء الاصطناعي في 2025، ما يُمثّل قرابة نصف إجمالي 8.7 مليون زوج عالميًا، وفقًا لشركة الأبحاث Omdia. احتلّت مدينة قوانغدونغ المرتبة الأولى عالميًا من حيث حجم الشحن، بينما ارتفعت شحنات نظارات الواقع المعزز/الذكاء الاصطناعي عالميًا بنسبة 322% مقارنةً بالسنة السابقة. المكانة السوقية لدونغقوان والدعم الحكومي تعكس هيمنة المدينة في تصنيع نظارات الذكاء الاصطناعي كلاً من البنية التحتية الحالية للإلكترونيات والمبادرات السياسية الأخ
CryptoFrontierمنذ 3 س
تُدمج UXLINK بنية الحوسبة الاصطناعية من Origins Network لتمكين التوسع في Web3
بحسب الإعلان الرسمي لـ UXLINK في 11 مايو، أعلنت بروتوكول اجتماعي موجّه للويب3 عن تعاون استراتيجي مع Origins Network لدمج بنية تحتية لا مركزية لحوسبة الذكاء الاصطناعي ضمن نظامها البيئي. يهدف الشراكة إلى تعزيز منصة UXLINK من خلال دمج البنية المعيارية لـ Origins Network على سلسلة الكتل، وتحسين قدرات الحوسبة للتطبيقات اللامركزية المدفوعة بالذكاء الاصطناعي. ستستفيد عملية التكامل من آلية Proof-of-Computation لدى Origins Network والحوسبة اللامركزية بوحدات GPU لتحسين تدريب نماذج الذكاء الاصطناعي ومعالجة
GateNewsمنذ 8 س
تعمل Tencent Cloud على تشغيل خدمة Ryt Bank المصرفية بالذكاء الاصطناعي لـ50,000 مستخدم في يوم الإطلاق
وفقاً لـTencent Cloud، في 11 مايو، عقدت الشركة شراكة مع بنك رقمي Ryt Bank ومقره ماليزيا لدعم خدمة مصرفية محادثية مدعومة بالذكاء الاصطناعي باستخدام Tencent Cloud Chat للرسائل الفورية في الوقت الحقيقي. تعامل النظام مع 50,000 مستخدم نشط في يوم الإطلاق دون انقطاع، ما مكّن العملاء من تقديم تعليمات الدفع بلغة واضحة بدلًا من التنقل عبر قوائم التطبيق. وبلغ عدد مستخدمي Ryt Bank 1.2 مليون خلال أكثر من سبعة أشهر.
GateNewsمنذ 9 س
أطلقت Reactor عرضًا توضيحيًا لنموذج عالمي يعمل في الزمن الحقيقي، محققًا 7.8 مليون مشاهدة
وبحسب Beating، أطلقت Reactor اليوم عرضاً تجريبياً لنموذجها العالمي للزمن الحقيقي، ما يتيح للمستخدمين توليد مشاهد ثلاثية الأبعاد تفاعلية عبر معالجة بالذكاء الاصطناعي مستندة إلى السحابة. يعمل النموذج على البنية التحتية السحابية العالمية منخفضة التأخير لدى الشركة، ما يلغي الحاجة إلى أجهزة محلية. وفي فيديو توضيحي يتضمن سيارة رياضية حمراء تجوب مشهداً صحراوياً فضائياً، عرضت تقنية الذكاء الاصطناعي في الوقت الحقيقي فيزياء تضاريس المشهد والأجسام الكوكبية البعيدة، مع تتبّع عناصر تحكم اللاعب، لتجذب أكثر من
GateNewsمنذ 10 س
تطلق Minara اليوم أول مساعد ذكاء اصطناعي (Copilot) لسوق تنبؤات Hyperliquid HIP-4
وفقاً لـ BlockBeats، أطلقت Minara AI اليوم (11 مايو) مساعد التنبؤات المعتمد على الذكاء الاصطناعي AI Prediction Copilot، لتصبح أول أداة في سوق التنبؤات مدعومة بالذكاء الاصطناعي ومتكاملة مع سوق HIP-4 لدى Hyperliquid. يقوم النظام بتحليل اتجاهات BTC قصيرة الأجل ومستويات الدعم والمقاومة، إضافةً إلى فجوات تسعير السوق لتقديم توصيات تداول بنعم/لا YES/NO. يُخرج المساعد احتمالية الذكاء الاصطناعي، والاحتمالية الضمنية في السوق، وقيمة الميزة، والعوائد المتوقعة في الوقت الفعلي.
GateNewsمنذ 10 س