علوم وتكنولوجيا

تكنولوجيا: نموذج DeepSeek.. كل ما تريد معرفته عن الأداة الصينية المنافسة لـChatGPT

تكنولوجيا: نموذج DeepSeek.. كل ما تريد معرفته عن الأداة الصينية المنافسة لـChatGPT

شكرا لقرائتكم خبر عن تكنولوجيا: نموذج DeepSeek.. كل ما تريد معرفته عن الأداة الصينية المنافسة لـChatGPT والان مع تفاصيل الخبر

القاهرة - سامية سيد - كتبت أميرة شحاتة

السبت، 25 يناير 2025 11:16 ص

أصدر مختبر الذكاء الاصطناعي الصيني DeepSeek عائلة نماذج R1 الجديدة بموجب ترخيص مفتوح من معهد ماساتشوستس للتكنولوجيا، حيث تحتوي أكبر نسخة منها على 671 مليار معلمة، وتزعم الشركة أن النموذج يعمل بمستويات مماثلة لنموذج محاكاة المنطق (SR) الخاص بـOpenAI o1، النموذج وراء روبوت الدردشة ChatGPT، في العديد من معايير الرياضيات والترميز.

كما أنه إلى جانب إصدار النماذج الرئيسية DeepSeek-R1-Zero وDeepSeek-R1، نشر DeepSeek ستة إصدارات أصغر من "DeepSeek-R1-Distill" تتراوح من 1.5 مليار إلى 70 مليار معلمة.

تستند هذه النماذج إلى بنيات مفتوحة المصدر موجودة مثل Qwen وLlama، مدربة باستخدام البيانات الناتجة عن نموذج R1 الكامل.

يمكن تشغيل أصغر إصدار على جهاز كمبيوتر محمول، بينما يتطلب النموذج الكامل موارد حوسبة أكبر بكثير.

قال الباحث المستقل في مجال الذكاء الاصطناعي سيمون ويليسون لآرس في رسالة نصية: "إن تشغيلها ممتع للغاية، ومشاهدتها تفكر أمر مضحك".

اختبر ويليسون أحد النماذج الأصغر ووصف تجربته في منشور على مدونته: "تبدأ كل استجابة بعلامة تحتوي على سلسلة من الأفكار المستخدمة للمساعدة في توليد الاستجابة"، مشيرًا إلى أنه حتى بالنسبة للمطالبات البسيطة، ينتج النموذج تفكيرًا داخليًا مكثفًا قبل الإخراج.

الاستدلال المحاكى فى العمل

يعمل نموذج R1 بشكل مختلف عن نماذج اللغة الكبيرة النموذجية (LLMs) من خلال دمج ما يسميه الناس في الصناعة نهج الاستدلال.

يحاولون محاكاة سلسلة من الأفكار تشبه الإنسان بينما يعمل النموذج من خلال حل للاستعلام.

ظهرت هذه الفئة من ما قد نطلق عليه "نماذج الاستدلال المحاكى"، أو نماذج SR باختصار، عندما أطلقت OpenAI عائلة نماذج o1 في سبتمبر 2024.

وقد أعلنت OpenAI عن ترقية رئيسية تسمى "o3" في ديسمبر، وعلى عكس نماذج LLM التقليدية، تستغرق نماذج SR هذه وقتًا إضافيًا لإنتاج الاستجابات، وغالبًا ما يزيد هذا الوقت الإضافي من الأداء في المهام التي تتضمن الرياضيات والفيزياء والعلوم.

ويثير أحدث نموذج مفتوح الاهتمام بسبب اللحاق السريع بـ OpenAI، فعلى سبيل المثال، أفادت DeepSeek أن R1 تفوقت على o1 من OpenAI في العديد من المعايير والاختبارات، بما في ذلك AIME (اختبار الاستدلال الرياضي)، وMATH-500 (مجموعة من المشكلات اللفظية)، وSWE-bench Verified (أداة تقييم البرمجة).

يجب التعامل مع معايير الذكاء الاصطناعي بحذر، ولم يتم التحقق من هذه النتائج بشكل مستقل بعد.

وتشير تقارير موقع echCrunch إلى أن ثلاثة مختبرات صينية، DeepSeek و Alibaba و Moonshot AI's Kimi ، أصدرت الآن نماذج تقول إنها تتطابق مع قدرات o1، حيث قامت DeepSeek بمعاينة R1 لأول مرة في نوفمبر.

لكن نموذج DeepSeek الجديد يأتي مع مشكلة إذا تم تشغيله في الإصدار المستضاف على السحابة، نظرًا لكونه صيني الأصل، فلن يولد R1 ردودًا حول مواضيع معينة مثل استقلال تايوان، لأنه يجب أن "يجسد القيم الاشتراكية الأساسية"، وفقًا للوائح الإنترنت الصينية.

تأتي هذه التصفية من طبقة تعديل إضافية لا تشكل مشكلة إذا تم تشغيل النموذج محليًا خارج الصين، وحتى مع الرقابة المحتملة، كتب دين بول، باحث الذكاء الاصطناعي في جامعة جورج ماسون، على X، "إن الأداء المذهل لنماذج DeepSeek (الإصدارات الأصغر من r1) يعني أن المفكرين الآلين سيستمرون في الانتشار على نطاق واسع ويمكن تشغيلهم على الأجهزة المحلية، بعيدًا عن أعين أي نظام تحكم من أعلى إلى أسفل".

 

يمكنكم متابعة أخبار مصر و العالم من موقعنا عبر

Advertisements