شات جي بي تي على وشك الحصول على ترقية كبيرة حيث سيتمكن المستخدمون الدافعون قريبًا من الوصول إلى المحادثات الصوتية ثنائية الاتجاه باستخدام الأداة.
كما أعلنت شركة OpenAI أيضًا أن برنامج الدردشة الآلي الذي يعمل بالذكاء الاصطناعي (AI)، والذي تم طرحه في نوفمبر من العام الماضي، أنه سيكون قادرًا على النظر إلى الصور وفهم ما يحدث فيها.
وستكون ميزة الصوت متاحة على تطبيقات iOS وAndroid، حيث سيتمكن المستخدمون من الاختيار من بين خمسة أصوات مختلفة.
وهو مبني على نموذج جديد لتحويل النص إلى كلام طورته الشركة، وسيتضمن أيضًا أداة Whisper AI، وهو نظام للتعرف على الكلام يمكنه تحويل الكلمات المنطوقة إلى نص.
الأصوات الخمسة، وهي مزيج من الذكور والإناث بلهجات أمريكية، تسمى Juniper وSky وCove وEmber وBreeze. ويقترح OpenAI أن الأصوات يمكن استخدامها في كل شيء، بدءًا من قراءة قصة ما قبل النوم لأطفالك، وحتى تسوية النقاش على مائدة العشاء.
وتحدث سام ألتمان، الرئيس التنفيذي لشركة OpenAI، عن الحاجة إلى تنظيم الذكاء الاصطناعي بسبب المخاطر التي يحتمل أن يشكلها على البشرية، ولكن يبدو أن شركته تمضي قدمًا في التطورات على الرغم من بعض الدعوات للتوقف مؤقتًا.
وهناك تطور آخر أعلنت عنه الشركة في منشور بالمدونة وهو أن المستخدمين سيتمكنون من عرض صور ChatGPT، والتي يمكن للذكاء الاصطناعي عرضها وتحليلها. وتدعي الشركة أنها اختبرت النموذج في “مجالات مثل التطرف والكفاءة العلمية” لمساعدتهم على نشره بشكل مسؤول.
سبوتيفاي يستغل تقنية OpenAI
يتم استخدام أدوات OpenAI أيضًا من قبل شركة تكنولوجية عملاقة أخرى – سبوتيفاي – والتي أعلنت يوم الاثنين عن ميزة جديدة لترجمة ملفات البودكاست.
وقالت الشركة – أيضًا في منشور على مدونتها – إن الأداة التي طورتها سبوتيفاي تستخدم “أحدث الابتكارات”، بما في ذلك تقنية توليد الصوت الخاصة بـ OpenAI، لترجمة صوت المتحدث مع الحفاظ على أسلوبه ونبرة صوته.
لقد بدأ الأمر بإصدار تجريبي لعدد من الحلقات من مقدمي البودكاست مثل داكس شيبارد ولكس فريدمان ومونيكا بادمان، مع ترجمة الذكاء الاصطناعي لحلقاتهم إلى لغات تشمل الإسبانية والفرنسية والألمانية.