في السابق، كانت النماذج العامة للذكاء الاصطناعي التوليدي هي الخيار الرئيسي، وربما لا تزال كذلك. ومع ذلك، مع انضمام مزودي خدمات السحابة، سواء الكبار أو الصغار، إلى ساحة الذكاء الاصطناعي التوليدي، نشهد جيلًا جديدًا من النماذج المركزة على الشركات ذات القدرة المالية الكبيرة.
على سبيل المثال، أعلنت شركة Snowflake اليوم عن إطلاق نموذج Arctic LLM، والذي يصف بأنه “من الدرجة الأولى للشركات”. يتوفر Arctic LLM بترخيص Apache 2.0، وتم تحسينه لـ “أعباء العمل في الشركات”، بما في ذلك إنشاء رموز قواعد البيانات، وتؤكد Snowflake أنه متاح للاستخدام البحثي والتجاري مجانًا.
صرح الرئيس التنفيذي سريدار راماسوامي في مؤتمر صحفي: “أعتقد أن هذا سيكون الأساس الذي سيتيح لنا – لـ Snowflake – ولعملائنا بناء منتجات متخصصة للشركات وبدء استخدام الذكاء الاصطناعي بشكل أفضل. يجب عليك أن تفكر في هذا المفهوم بجدية عندما يتعلق الأمر بالخطوة الأولى، ولكن بالطبع، هذه ليست الخطوة الأخيرة في رحلتنا نحو الذكاء الاصطناعي التوليدي، فالكثير من التطورات قادمة.”
نموذج للشركات
في مقالة حديثة كتبها زميلي ديفين كولدوي، تم التطرق إلى كيفية استمرار هجوم النماذج التوليدية للذكاء الاصطناعي دون وجود نهاية واضحة. أنصحك بقراءة المقال للمزيد من التفاصيل، ولكن الفكرة الرئيسية هي أن النماذج تعتبر وسيلة سهلة للشركات لإثارة الحماس حول أبحاثها، وأيضًا توجهها نحو نظام منتجاتها، بما في ذلك استضافة النماذج وتحسينها.
من بين هذه النماذج، يأتي Arctic LLM كجزء من سلسلة النماذج التوليدية لشركة Snowflake المسماة Arctic. استغرق تدريب Arctic LLM حوالي ثلاثة أشهر، وشمل استخدام 1000 وحدة معالجة رسومية وتكلفة تقدر بمليوني دولار. يأتي هذا بعد إطلاق نموذج DBRX من شركة Databricks، الذي يُعلن أيضًا عن تحسينه للاستخدام في المؤسسات.
تقارن Snowflake بشكل مباشر بين Arctic LLM و DBRX، وتؤكد أن Arctic LLM يتفوق على DBRX في مهام توليد الشفرة وإنشاء SQL. كما تزعم Snowflake أن Arctic LLM يفوق نماذج أخرى مثل Llama 2 70B من Meta و Mixtral-8x7B من Mistral.
تقدم Snowflake أيضًا أن Arctic LLM يحقق “أداءً رائدًا” في مؤشر فهم اللغة العامة الشهير، MMLU. ومع ذلك، يجب أخذ ذلك بحذر، حيث يتضمن MMLU اختبارات قد تحتاج إلى حفظ الحقائق لحلها.
في مقابلة مع TechCrunch، أوضح باريس غولتكين، رئيس الذكاء الاصطناعي في Snowflake، أن Arctic LLM يركز على حلول موجهة للشركات مثل مساعدي SQL وروبوتات المحادثة عالية الجودة.
يعتمد Arctic LLM، مثل DBRX و Gemini 1.5 Pro من Google، على بنية خليط الخبراء (MoE)، حيث تقسم المهام إلى مهام فرعية وتُخصص لنماذج خبراء متخصصة. وتزعم Snowflake أن هذا التصميم الفعال سمح لها بتدريب Arctic LLM على مجموعات بيانات الويب العامة بتكلفة أقل بنسبة تقريبية 1/8 من التكلفة العادية.
تعمل في كل مكان
تقوم Snowflake بتوفير موارد مثل قوالب الشفرة وقائمة مصادر التدريب بجانب Arctic LLM لمساعدة المستخدمين في تشغيل النموذج وضبطه لحالات الاستخدام المحددة. ومع ذلك، نظرًا لأن ذلك قد يكون مهمة مكلفة ومعقدة بالنسبة لمعظم المطورين (حيث يتطلب ضبط أو تشغيل Arctic LLM حوالي ثمانية وحدات معالجة رسومية)، فإن Snowflake تعتزم أيضًا توفير Arctic LLM عبر مجموعة متنوعة من المضيفين، بما في ذلك Hugging Face وMicrosoft Azure وخدمة استضافة النماذج التوليدية لـ Together AI ومنصة الذكاء الاصطناعي التوليدية للشركات Lamini.
ومع ذلك، ستكون Arctic LLM متاحة أولاً على Cortex، منصة Snowflake لبناء التطبيقات والخدمات التي تعتمد على الذكاء الاصطناعي وتعلم الآلة. وتسعى الشركة بشكل متوقع لترويجها كالطريقة المفضلة لتشغيل Arctic LLM بـ “الأمان” و “الحوكمة” و “التوسع”.
“حلمنا هنا هو، في غضون عام واحد، أن نكون لدينا واجهة برمجة تطبيقات يمكن لعملائنا استخدامها بحيث يتمكن مستخدمو الأعمال من التفاعل مباشرة مع البيانات”، قال راماسوامي. “لقد كان من السهل بالنسبة لنا أن نقول: ‘أوه، سننتظر فقط نموذجًا مفتوح المصدر وسنستخدمه. بدلاً من ذلك، نحن نقوم بالاستثمار الأساسي لأننا نعتقد أنه سيفتح المزيد من القيمة لعملائنا”.
لذلك، أنا متسائل: من هو Arctic LLM حقًا بالإضافة إلى عملاء Snowflake؟
في ساحة مليئة بالنماذج التوليدية “المفتوحة” التي يمكن ضبطها لأي هدف تقريبًا، لا يبرز Arctic LLM بأي طريقة واضحة. قد توفر بنيته بعض الفوائد من الكفاءة على بعض الخيارات الأخرى المتاحة. ومع ذلك، لست مقتنعًا بأن هذا سيكون كافيًا لجذب الشركات بعيدًا عن النماذج التوليدية المعروفة والمدعومة بشكل جيد للأعمال (مثل GPT-4).
هناك أيضًا نقطة سلبية فيما يتعلق بـ Arctic LLM: حجم سياقه النسبي الصغير.
في الذكاء الاصطناعي التوليدي، يُشار إلى النافذة السياقية باعتبارها البيانات المدخلة (مثل النص) التي يأخذها النموذج بعين الاعتبار قبل إنتاج الإخراج (مثل النص الإضافي). تكون ال
نماذج ذات النوافذ السياقية الصغيرة عرضة لنسيان محتوى المحادثات الحديثة حتى، بينما تتجنب النماذج ذات السياقات الأكبر هذا الخطأ بشكل عام.
سياق Arctic LLM يتراوح بين ~8,000 و ~24,000 كلمة، وهو يعتمد على طريقة الضبط التفصيلي – وهو رقم أقل بكثير من نماذج مثل Claude 3 Opus من Anthropic و Gemini 1.5 Pro من Google.
لم تذكر Snowflake هذا في التسويق، ولكن من المحتمل أن يعاني Arctic LLM من نفس القيود والنقائص المتوقعة في النماذج التوليدية الأخرى – وهي الهلوسات (أي الردود الخاطئة بثقة) على الأرجح. هذا لأن Arctic LLM، مثل كل نموذج توليدي اصطناعي موجود، هو آلة احتمالية إحصائية – تخمن بناءً على كميات هائلة من الأمثلة أي البيانات التي تُعطي أكثر “معقولية” في مكان معين (مثل كلمة “ذهب” قبل “السوق” في الجملة “ذهبت إلى السوق”). فمن المؤكد أنه سيخطئ في التخمين – وهذا ما يُعرف بـ “الهلوسات”.
كما يكتب ديفين في مقاله، حتى الانتقال الفني الرئيسي التالي، الاختلافات التدريجية هي كل ما لدينا لنتطلع إليه في مجال الذكاء الاصطناعي التوليدي. ولكن ذلك لن يمنع الموردين مثل Snowflake من تسويقها كإنجازات كبيرة، وتسويقها بكل ما تستطيع.
الخلاصة
في هذا المقال، يتم استعراض إعلان Snowflake عن نموذج جديد للذكاء الاصطناعي يُدعى Arctic LLM، الذي يستهدف الشركات. بالمقابل، كانت النماذج العامة سائدة في الماضي، لكن مع انضمام مزودي خدمات السحابة إلى المجال، ظهرت نماذج مخصصة مثل Arctic LLM التي تركز على الشركات. يُقدم Arctic LLM تحسينات مثل إنشاء رموز قواعد البيانات، ومع ذلك، يُعاني من قضايا مثل حجم السياق الصغير واحتمالية الهلوسات. يُظهر المقال أيضًا المنافسة مع نماذج أخرى ويشير إلى التحديات المحتملة في جذب الشركات. بشكل عام، يمثل Arctic LLM جزءًا من جهود Snowflake لتقديم حلول متخصصة للشركات وتحسينات مستقبلية.
مصدر الخبر
موقع : techcrunch
أخيرا
نتمنى لك قراءة رائعة، لا تنسى قراءة هذه الصفحات المهمة، إخلاء المسؤولية ، سياسة الخصوصية و أيضاً تسجيل رأيك
حول “إطلاق Snowflake نموذجًا للذكاء الاصطناعي التوليدي الخاص بها” شاركنا رأيك عبر صفحاتنا على مواقع التواصل الأجتماعي و أيضاً لا تنسى متابعتنا : (فيسبوك ، انستغرام ،تويتر)
شاهد أيضاً :
أطباء يستخدمون نظارات “فيجن برو” من شركة آبل لتدريبهم في مجال الجراحة
الثغرة الامنية في إضافة Forminator تؤثر على أكثر من 300 ألف موقع ووردبريس.
أمازون تسعى لاستضافة نماذج الذكاء الاصطناعي المخصصة للشركات.