منصة جيميني من جوجل ! تسعى Google إلى إثارة الانتباه مع جيميني، وهي مجموعة رئيسية من نماذج الذكاء الاصطناعي التوليدي، التطبيقات والخدمات. وعلى الرغم من أن جيميني يبدو واعدًا في بعض الجوانب، إلا أنه يفتقر في بعض الجوانب الأخرى – كما كشف استعراضنا غير الرسمي.
إذاً، ما هو جيميني؟ وكيف يمكنك استخدامه؟ وكيف يتفوق على منافسيه؟
لتسهيل متابعة أحدث تطورات جيمين، قمنا بإعداد هذا الدليل المفيد، والذي سنحافظ على تحديثه مع إصدار نماذج وميزات جيمين الجديدة، وأخبار خطط جوجل لجيميني….
ماهو جيميني؟
يُعتبر جيميني مجموعة واسعة من التقنيات والتطبيقات في مجال الذكاء الاصطناعي المصممة لتوليد المحتوى عبر مختلف المجالات. تتضمن هذه القدرة على إنشاء النصوص، وتوليد الصور، وإنشاء الصوت، والمزيد. يُعتبر جانبًا رئيسيًا في جيميني هو قدرته على إنتاج محتوى جديد وإبداعي بدلاً من تكرار البيانات الحالية.
تشمل المهام التي يمكن تنفيذها داخل جيميني إنشاء المقالات، وتوليد الحوارات، وتأليف الشعر. كما يُمكن استخدام قدرات توليد الصور لإنشاء صور واقعية للأشياء والمشاهد، بالإضافة إلى الأشخاص الذين لا وجود لهم في الواقع. من ناحية أخرى، يمكن لإنشاء الصوت أن يتضمن إنشاء الموسيقى أو الكلام أو تأثيرات صوتية أخرى.
كما تهدف مبادرة جيميني من جوجل إلى استغلال إمكانيات الذكاء الاصطناعي التوليدي لتعزيز الابتكار والإبداع عبر مختلف الصناعات. بفضل استخدام التقنيات المتقدمة في التعلم الآلي، تتمتع جيميني بالقدرة على تحويل عمليات إنشاء المحتوى والتصميم والترفيه وغيرها من المجالات.
علاوةً على ذلك، من المرجح أن تكون جيميني متكاملة مع مجموعة جوجل الحالية من الأدوات والمنصات الذكاء الاصطناعي، مما يتيح للمطورين والشركات الوصول إلى إمكانياتها من خلال واجهات برمجة التطبيقات (APIs) وخدمات الحوسبة السحابية. يمكن أن يُيسر هذا التكامل تطوير التطبيقات المخصصة والحلول المصممة خصيصًا لحالات الاستخدام المحددة.
ومع استمرار جوجل في الاستثمار في جيميني وتحسينه، من المتوقع أن تصبح أداة أكثر فعالية لإنتاج المحتوى، وحل المشكلات المعقدة، وتعزيز التقدم في البحوث والتطوير في مجال الذكاء الاصطناعي.
ما هي الاختلافات بين تطبيقات جيميني ونماذجها؟
بالتأكيد! دعونا نلقي نظرة أعمق على الاختلافات بين تطبيقات جيميني ونماذجها:
تطبيقات جيميني:
- تفاعل مع المستخدم: يُصمم تطبيقات جيميني للتواصل المباشر مع المستخدمين، مما يوفر لهم واجهات سهلة الاستخدام للاستفادة من قدرات الذكاء الاصطناعي التوليدي.
- متنوعة الوظائف: تقدم تطبيقات جيميني مجموعة واسعة من الوظائف التي تلبي احتياجات المستخدمين المتنوعة. يمكن أن تشمل هذه الوظائف إنشاء النصوص، وتحرير الصور، والإبداع الفني، والسرد، وحتى المساعد الافتراضي.
- تخصيص ودمج: يمكن للمطورين تخصيص تطبيقات جيميني لتلبية احتياجات المستخدمين الفردية أو دمجها في منصات وسير عمل موجودة بالفعل. تتيح هذه المرونة تطبيقات متعددة عبر مجموعة متنوعة من الصناعات.
نماذج جيميني:
- خوارزميات مدعومة بالذكاء الاصطناعي: تُعتبر نماذج جيميني الخوارزميات الأساسية التي تدفع قدرات الذكاء الاصطناعي التوليدي للمنصة. يتم تدريب نماذج جيميني على مجموعات بيانات ضخمة باستخدام تقنيات التعلم الآلي المتقدمة.
- وظائف محددة للمهام: يتم تدريب كل نموذج جيميني على مهمة محددة، مثل معالجة اللغة الطبيعية لإنشاء النصوص، أو تخليق الصور لإنشاء الرسومات، أو إنتاج الصوت لإنشاء الأصوات.
- تحسين مستمر: تقوم جوجل بتحسين وتحديث نماذج جيميني باستمرار لتحسين أدائها ودقتها وتنوعها. يضمن هذا العمل التطويري أن النماذج يمكن أن تتكيف مع احتياجات المستخدم المتغيرة والتحديات.
- قابلية التوسع والكفاءة: تم تصميم نماذج جيميني لتكون قابلة للتوسع وكفؤة، حيث يمكنها التعامل مع كميات كبيرة من البيانات وإنتاج نتائج عالية الجودة بشكل سريع وموثوق به.
بشكل عام، يتيح لنا تطبيقات جيميني التفاعل مع قدرات الذكاء الاصطناعي التوليدي بواسطة واجهاتها، ومع ذلك، تعتبر نماذج جيميني العنصر الأساسي الذي يعمل خلف الكواليس ويدير عمليات هذه التطبيقات باستخدام الخوارزميات المتقدمة والوظائف. من خلال تركيبها معًا، يمكن لهذان العنصران تمكين تشكيل مجموعة واسعة من التطبيقات الإبداعية والعملية في مختلف المجالات.
ماذا يمكن لمنصة جيميني فعله؟
نظرًا لأن نماذج جيمين هي متعددة الوسائط، فإنها في النظرية تمتلك القدرة على أداء مجموعة متنوعة من المهام التي تشمل أوضاع إدخال متعددة، مثل نقل الكلام إلى نص، وتوضيح الصور ومقاطع الفيديو، وإنشاء الأعمال الفنية. بينما لم تتحقق بعض هذه القدرات بشكل كامل في شكل المنتج بعد (المزيد من التفاصيل فيما بعد)، إلا أن جوجل أشارت إلى نيتها تقديم كل هذه القدرات – وربما المزيد – في المستقبل القريب.
ومع ذلك، فمن المفهوم أن يكون هناك بعض الشكوك بشأن هذه الادعاءات.
واجهت جوجل انتقادات لعدم تلبية التوقعات مع إطلاق Bard الأصلي. وعلاوة على ذلك، أثارت حادثة حديثة تتعلق بفيديو يظهر بشكل مزعوم قدرات جيميني جدلاً عندما تبين أن الفيديو قد تم تحريره بشكل كبير وكان أكثر تمثيلًا للطموحات من أنه تصوير دقيق لحالة التكنولوجيا في الوقت الحالي.
العرض التقديمي الأفضل لـ جيميني من جوجل كان غير حقيقي.
بالرغم من ذلك، وافترضنا أن جوجل تقدم تقريبًا الحقيقة مع مطالبها، إليك ما ستكون قادرة عليه مستويات جيميني المختلفة عندما يصلوا إلى إمكانياتهم الكاملة:
جيميني الفائق
تقول جوجل إن Gemini Ultra – بفضل تعددها المتعدد – يمكن استخدامها للمساعدة في أمور مثل واجبات الفيزياء، وحل المشاكل خطوة بخطوة في ورقة العمل، وإشارة إلى الأخطاء المحتملة في الإجابات المملوءة بالفعل.
بالإضافة إلى ذلك، يمكن تطبيق Gemini Ultra على مهام مثل تحديد الأوراق العلمية ذات الصلة بمشكلة معينة، واستخراج المعلومات من تلك الأوراق و “تحديث” رسم بياني من خلال توليد الصيغ الضرورية لإعادة إنشاء الرسم البياني باستخدام بيانات أحدث.
تدعم Gemini Ultra تقنياً أيضاً إنتاج الصور، كما ألمحنا سابقاً. لكن هذه القدرة لم تجعل طريقها إلى النسخة المنتجة للنموذج بعد – ربما لأن الآلية أكثر تعقيداً من كيفية توليد التطبيقات مثل ChatGPT للصور. بدلاً من تغذية البيانات إلى مولد الصور
(مثل DALL-E 3، في حالة ChatGPT)، تقوم Gemini بإخراج الصور “بشكل طبيعي”، دون خطوة وسيطة.
Gemini Ultra متوفرة كواجهة برمجة التطبيقات (API) من خلال Vertex AI، منصة جوجل الذكية القائمة بالكامل للمطورين، وAI Studio، أداة جوجل على الويب لمطوري التطبيقات والمنصات. كما تعمل أيضاً على تشغيل تطبيقات Gemini – ولكن بتكلفة. يتطلب الوصول إلى Gemini Ultra من خلال ما تسميه جوجل Gemini Advanced الاشتراك في خطة Google One AI Premium، بسعر 20 دولاراً شهرياً.
تربط خطة AI Premium أيضاً Gemini بحساب Google Workspace الخاص بك – فكر في الرسائل الإلكترونية في Gmail، والمستندات في Docs، والعروض التقديمية في Sheets وتسجيلات Google Meet. هذا مفيد لمثل، ملخص الرسائل الإلكترونية أو الملاحظات مثل تلك التي تجمعها جيميني أثناء مكالمة فيديو.
جيميني برو
يشير تصريح جوجل إلى أن جيميني برو يُعَد تطويرًا على نموذج لامدا في قدراته على التفكير والتخطيط والفهم.
وجدت دراسة مستقلة أُجريت بواسطة باحثين من جامعة كارنيجي ميلون وشركة بيري آي أن جيميني برو هو فعلاً أفضل من جي بي تي 3.5 التابعة لشركة أوبن إيه آي في التعامل مع سلاسل التفكير الطويلة والمعقدة بشكل أكبر. ولكن أظهرت الدراسة أيضاً أن جيميني برو، مثل جميع النماذج اللغوية الكبيرة، يعاني بشكل خاص من مشاكل في الرياضيات التي تشمل عدة أرقام، وعثر المستخدمون على العديد من الأمثلة على التفكير السيء والأخطاء.
أولى الانطباعات حول جيميني من جوجل ليست جيدة بالمرة.
ومع ذلك، جاءت التحسينات المقدمة من Google في شكل Gemini 1.5 Pro.
تم تصميم Gemini 1.5 Pro (المتاحة حاليًا في مرحلة تجريبية) لتكون بديلًا يمكن إدراجه بسهولة، حيث تم تحسينها في عدة جوانب مقارنةً بالإصدار السابق، وربما الأكثر أهمية هو زيادة كبيرة في كمية البيانات التي يمكنها معالجتها. يمكن لـ Gemini 1.5 Pro (المتاحة حاليًا في مراجعة خاصة محدودة) استيعاب حوالي 700،000 كلمة،
أو حوالي 30،000 سطر من الشفرة – 35 مرة أكثر مما يمكن لـ Gemini 1.0 Pro التعامل معه. ونظرًا لكون النموذج متعدد الوسائط، فهو لا يقتصر على النصوص فقط.
يمكن لـ Gemini 1.5 Pro تحليل ما يصل إلى 11 ساعة من التسجيلات الصوتية أو ساعة من الفيديو بلغات مختلفة، على الرغم من أن العملية تأخذ وقتًا طويلاً (على سبيل المثال، يستغرق البحث عن مشهد في فيديو لمدة ساعة من 30 ثانية إلى دقيقة من المعالجة).
كما يتوفر Gemini Pro أيضًا كواجهة برمجة تطبيقات (API) في Vertex AI لقبول النصوص كمدخلات وتوليد النصوص كمخرجات. بالإضافة إلى ذلك، تتوفر نقطة نهاية إضافية باسم Gemini Pro Vision، التي يمكنها معالجة النصوص والصور، بما في ذلك الصور ومقاطع الفيديو، وتوليد نص بناءً على نموذج OpenAI’s GPT-4 مع الرؤية.
في Vertex AI، يمكن للمطورين تخصيص Gemini Pro لتناسب سياقات وحالات استخدام محددة من خلال عملية التحسين
أو “التأصيل”.
بالإضافة إلى ذلك، يمكن ربط Gemini Pro بواجهات برمجة التطبيقات الخارجية من الطرف الثالث لتنفيذ إجراءات معينة.
تقدم جوجل Gemini Pro إلى Vertex AI
في AI Studio، يتوفر سير عمل لإنشاء محادثات منظمة بشكل منسَّق باستخدام Gemini Pro. يحصل المطورون على وصول إلى كل من نقاط نهاية Gemini Pro و Gemini Pro Vision، ويمكنهم ضبط درجة حرارة النموذج للتحكم في نطاق الإخراج الإبداعي وتقديم أمثلة لتوجيهات الأسلوب والنغمة – بالإضافة إلى ضبط إعدادات السلامة.
جيميني نانو
جيميني نانو هي نسخة مصغرة بكثير من نماذج جيميني برو وألترا، وهي كفءة بما يكفي لتشغيلها مباشرة على بعض الهواتف بدلاً من إرسال المهمة إلى خادم في مكان ما. حتى الآن، تُستخدم ميزتان على هاتف Pixel 8 Pro: “تلخيص” في تطبيق المسجل و “الرد الذكي” في لوحة المفاتيح Gboard.
يتضمن تطبيق المسجل، الذي يتيح للمستخدمين النقر على زر لتسجيل الصوت وتحويله إلى نص، تلخيصًا يعتمد على جيميني لمحادثاتك المسجلة، والمقابلات، والعروض التقديمية، ومقاطع الفيديو القصيرة الأخرى. يحصل المستخدمون على هذه التلخيصات حتى إذا كانت لديهم إشارة ضعيفة أو اتصال Wi-Fi غير متوفر – وتكون خلال هذه العملية، لا تغادر البيانات هاتفهم للمحافظة على الخصوصية.
وتوجد جيميني نانو أيضًا في لوحة المفاتيح Gboard، تطبيق لوحة المفاتيح من Google، كنسخة معاينة للمطورين. هناك، تُشغِّل ميزة تسمى “الرد الذكي”، التي تقدم اقتراحات للجمل التالية التي قد ترغب في قولها أثناء المحادثات في تطبيق المراسلة. في البداية، تعمل هذه الميزة فقط مع تطبيق WhatsApp، ومن المقرر أن تصبح متوفرة في المزيد من التطبيقات في عام 2024، وفقًا لما أعلنته Google.
هل جيميني أفضل من GPT-4 لدى شركة OpenAI؟
تركزت جهود جوجل في الترويج لتفوق جيميني على مؤشرات الأداء، حيث زعمت أن Gemini Ultra يتجاوز النتائج الحالية لأفضل النماذج المستخدمة في مجال البحث والتطوير في مجال النماذج اللغوية الكبيرة،
وذلك وفقًا لـ”30 من 32 المؤشرات الأكاديمية الشائعة المستخدمة في بحوث وتطوير النماذج اللغوية الكبيرة”.
وبالنسبة لـ Gemini Pro، فهو، بحسب الشركة، يظهر قدرات أكبر في مهام مثل تلخيص المحتوى
والتفكير المثبت والكتابة بالمقارنة مع GPT-3.5.
وعلى الرغم من التأكيدات التي تقدمها جوجل، يبدو أن الفارق بين النتائج التي تعلن عنها الشركة وبين نماذج OpenAI المقابلة يكون طفيفًا فقط. وكما ذكرت سابقًا،
فإن بعض التقييمات الأولية لم تكن إيجابية، حيث أشار المستخدمون والأكاديميون إلى أن Gemini Pro يبدي انحيازًا
نحو الخطأ في الحقائق الأساسية، ويعاني في الترجمات، ويقدم اقتراحات ضعيفة للبرمجة.
كم ستكلف منصة جيميني؟
Gemini Pro متاح مجانًا للاستخدام في تطبيقات Gemini وفي الوقت الحالي في AI Studio و Vertex AI.
عندما يتم إطلاق Gemini Pro من مرحلة المعاينة في Vertex، سيتم فرض تكلفة تبلغ 0.0025 دولار لكل حرف للنموذج، بينما ستكلف النتائج 0.00005 دولار لكل حرف. يدفع عملاء Vertex لكل 1000 حرف (وهو ما يعادل حوالي 140 إلى 250 كلمة)، وفي حالة النماذج مثل Gemini Pro Vision، يتم دفع تكلفة لكل صورة (0.0025 دولار).
فلنفترض أن مقالة تتألف من 500 كلمة، وهو ما يعادل 2000 حرف. ستكلف عملية تلخيص هذه المقالة باستخدام Gemini Pro مبلغ 5 دولارات. أما توليد مقالة بنفس الطول سيكلف 0.1 دولار.
كان ان لم يتم الإعلان عن تكلفة Ultra بعد.
أين يمكنك تجربة منصة جيميني؟
جيميني برو
يمكنك تجربة Gemini بسهولة من خلال تطبيقات Gemini. يقوم Gemini Pro و Ultra بالرد على الاستفسارات بمجموعة متنوعة من اللغات.
بالإضافة إلى ذلك، يمكن الوصول إلى Gemini Pro و Ultra في مرحلة المعاينة في Vertex AI عبر واجهة برمجة التطبيقات (API). الاستخدام المجاني للواجهة البرمجية متاح “ضمن الحدود” في الوقت الحالي، وتدعم بعض المناطق مثل أوروبا، بالإضافة إلى ميزات مثل وظيفة الدردشة والتصفية.
مع AI Studio، تطلق Google أداة سهلة الاستخدام لتطوير التطبيقات والروبوتات الدردشة استنادًا إلى نموذج Gemini الخاص بها.
في مواقع أخرى، يُمكن العثور على Gemini Pro و Ultra في AI Studio. باستخدام هذه الخدمة، يستطيع المطورون تطوير البرامج والروبوتات الدردشة المستندة إلى نموذج Gemini، ثم الحصول على مفاتيح API لاستخدامها في تطبيقاتهم – أو تصدير الشفرة إلى بيئة تطوير أكثر ميزاتٍ شمولية.
تمتلك Google حاليًا حزمة Duet AI for Developers، وهي مجموعة من أدوات المساعدة القائمة على الذكاء الاصطناعي لاستكمال الشفرات وتوليدها، تستخدم الآن نماذج Gemini. وقد قدمت Google نماذج Gemini أيضًا إلى أدوات التطوير الخاصة بها لمتصفح Chrome ومنصة Firebase لتطوير التطبيقات المحمولة.
جيميني نانو
تُقدم جيميني نانو على هاتف Pixel 8 Pro، ومن المتوقع أن تتوفر على أجهزة أخرى في المستقبل. يُشارك المطورون الذين يرغبون في دمج النموذج في تطبيقاتهم على نظام التشغيل أندرويد يمكنهم التسجيل للحصول على نظرة سريعة.
هل سيتم إطلاق منصة جيميني على هواتف ايفون؟
قد يحدث ذلك! آبل و غوغل في مفاوضات لتفعيل ميزة جيميني على هواتف ايفون في وقت لاحق هذا العام. لا شيء محدد بعد، حيث يتردد أيضًا أن أبل في محادثات مع OpenAI، وقد كانت تعمل على تطوير قدرات GenAI الخاصة بها.
الملخص
المقال يقدم نظرة شاملة عن منصة جيميني من جوجل، التي تشمل عدة نماذج مثل Gemini Pro وGemini Ultra
وGemini Nano. يستعرض المقال قدرات هذه النماذج في مجالات مختلفة مثل تحليل البيانات وحل المشاكل وتوليد النصوص والصور. بالإضافة إلى ذلك، يسلط المقال الضوء على التكامل بين جيميني ومنصات جوجل الأخرى مثل Vertex AI وAI Studio. كما يتطرق المقال إلى الأسعار المتوقعة لاستخدام Gemini وكيفية توفرها في التطبيقات والأجهزة.
أخيراً :
نتمنى لك قراءة رائعة، لا تنسى قراءة هذه الصفحات المهمة، إخلاء المسوؤلية ، سياسة الخصوصية
و أيضاً تسجيل رأيك حول “مفاوضات جوجل و ابل لتفعيل ميزة جيميني على هواتف ايفون”
شاركنا رأيك عبر صفحاتنا على مواقع التواصل الأجتماعي و أيضاً لا تنسى متابعتنا : (فيسبوك ، انستغرام ،تويتر)
شاهد أيضاً :
آبل و غوغل في مفاوضات لتفعيل ميزة جيميني على هواتف ايفون
إيلون ماسك يعد بشيء استثنائي: برنامج Grok الجديد من أيلون ماسك | المنافس البارز لـ ChatGPT