شات جي بي تي يتلقى دفعة كبيرة لإنشاء صور الذكاء الاصطناعي حصري على لحظات

تعرف علي

أعلنت شركة OpenAI الرائدة في تطوير تقنيات الذكاء الاصطناعي التوليدي المتقدمة، ومطور بوت الدردشة الأشهر، شات جي بي تي، عن إطلاق ميزة جديدة في ChatGPT تُتيح للمستخدمين إنشاء الصور داخل التطبيق نفسه باستخدام نموذج أحدث للذكاء الاصطناعي.

وقالت الشركة في بيان، إن انشاء الصورة عبر الذكاء الاصطناعي أصبح الآن تحت مسمى “صور شات جي بي تي” على بوت الدردشة نفسه، واعتبارًا من اليوم سيعتمد على نموذج اللغة المتقدم GPT-4o داخل البرنامج بدلًا من النموذج السابق الأولي.

يُشار هنا إلى أن إمكانية انشاء الصور في شات جي بي تي سابقًا كان يتم من خلال نافذة الدردشة نفسها، عبر توجيه أمر الإنشاء يحتوي على الوصف المطلوب، كما أن البرنامج كان يقوم بتنفيذها اعتمادًا على نموذج اللغة GPT-3.5 القديم نسبيًا، وهو ما تم تغييره وفقًا لإعلان الشركة.

انشاء صور شات جي بي تي

وتأتي هذه الميزة كخطوة كبيرة نحو توسيع قدرات شات جي بي تي لتشمل جميع أنواع البيانات، بما في ذلك النص والصورة والصوت والفيديو.

تركز الإصدارة الأولية على إنشاء الصور فقط، وستكون متاحة لجميع المستخدمين سواء كانوا مشتركين في أي من الباقات المدفوعة من ChatGPT Plus وPro وTeam أو حتى للمستخدمين للخدمة بشكل مجاني (خطة محدودة).

وعلى الرغم من أن حد الاستخدام في المستوى المجاني مماثل لتلك الخاصة بـ DALL-E، فقد أشارت OpenAI إلى إمكانية تغييره مع تزايد الطلب.

انشاء صور شات جي بي تي

من بين التحسينات التي أُدخلت على النظام، تبرز ميزة “الربط” (binding) التي تُحسن من قدرة المولد على الحفاظ على العلاقات الصحيحة بين السمات والكائنات، حيث يُمكن للنظام الآن توليد صور تحتوي على ما يصل إلى 15 إلى 20 كائنًا دون حدوث ارتباك في الألوان والأشكال بفضل النموذج المتقدم GPT-4o.

كما شهد النظام تحسينًا ملحوظًا في عرض النصوص داخل الصور، مما يُقلل من الأخطاء المطبعية ويُعزز من قابلية استخدام الصور في التطبيقات العملية مثل المخططات العلمية والكوميك والملصقات المعلوماتية.

انشاء صور شات جي بي تي

وبحسب الشركة، يعتمد النظام الجديد على نهج “التوليد التلقائي” الذي يُولد الصورة بشكل تسلسلي من اليسار إلى اليمين ومن الأعلى إلى الأسفل، وهو ما يُعتبر مختلفًا عن التقنية المستخدمة في معظم مولدات الصور الأخرى.

وقد يكون هذا الاختلاف التقني هو السبب وراء التفوق في جودة عرض النص والربط بين السمات.

وفي عرض توضيحي، استعرض فريق OpenAI عدة أمثلة تُظهر قدرات النظام، بما في ذلك إنشاء مخططات علمية دقيقة، وكوميك متعدد الألواح مع نصوص متسقة، وتطبيقات عملية لإنشاء صور بخلفيات شفافة لقوائم الطعام والشعارات.

/js/adsbygoogle.js?client=ca-pub-1891757579641055" crossorigin="anonymous">

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

client=ca-pub-1891757579641055" crossorigin="anonymous">
زر الذهاب إلى الأعلى b-1891757579641055" crossorigin="anonymous">