أقسام الوصول السريع ( مربع البحث )

إقرأ أيضا

أطلقت OpenAI و ضع الصوت المتقدم لChatGPT الذي يتميز بتجربة صوتية واقعية و ابتكارات جديدة

مع تطور التكنولوجيا، أصبح الذكاء الاصطناعي يلعب دوراً متزايد الأهمية في حياتنا اليومية. من بين هذه التقنيات المتقدمة، يأتي GPT-4o من OpenAI بوظائفه المتعددة وقدرته على تقديم تجربة صوتية متكاملة وواقعية. في هذه المقالة، سنستعرض إطلاق OpenAI لوضع الصوت المتقدم في ChatGPT، وكيف يختلف هذا التحديث عن الإصدارات السابقة، بالإضافة إلى الإجراءات التي تتخذها الشركة لتجنب التزييف العميق وحماية حقوق الملكية الفكرية.

بدأت مؤخرا شركة اوبن أي OpenAI في إطلاق وضع الصوت المتقدم لChatGPT، مما سيتيح للمستخدمين لأول مرة الوصول إلى الردود الصوتية بواقعية فائقة hyperrealistic audio responses لـشات جي بي تي  GPT-4o. و ستكون النسخة الأولية متاحة حاليا فقط لمجموعة صغيرة من مستخدمي شات جي بي تي بلس ChatGPT Plus، وتقول اوبن أي OpenAI إن هذه الميزة سَتَنْتَشِر تدريجياً لتشمل جميع مستخدمي ChatGPT Plus في خريف عام 2024.

و عندما عرضت اوبن اي OpenAI لأول مرة صوت GPT-4o في مايو الماضي، أدهشت هذه الميزة الجمهور بردودها السريعة وتشابهها الكبير مع صوت الإنسان الحقيقي وخصوصاً الصوت الذي أُطلق عليه Sky، و يشبه هذا الصوت صوت الممثلة سكارليت جوهانسون Scarlett Johansson، التي لعبت دور المساعد الافتراضي في فيلم "هي Her". و بعد فترة وجيزة من عرض اوبن أي OpenAI، قالت جوهانسون Johansson إنها رفضت عدة طلبات من المدير التنفيذي سام ألتمان Sam Altman لاستخدام صوتها، و لكن بعد مشاهدتها  لعرض GPT-4o، استأجرت محامياً للدفاع عن صورتها. وفي المقابل نفت OpenAI استخدام صوت جوهانسون Johansson، لكنها أزالت الصوت الذي عُرض في عرض تجريبي demo لاحقاً. و في يونيو 2024، قالت OpenAI إنها ستؤجل إصدار وضع الصوت المتقدم لتحسين تدابير السلامة الخاصة به.

وبعد شهر من ذلك، انتهى الانتظار جزئياً، و تقول OpenAI إن قدرات الفيديو ومشاركة الشاشة التي عُرضت خلال تحديث الربيع الماضي لن تكون جزءًا من هذا الإصدار الأولي الذي سيتم إطلاقه في "تاريخ لاحق". ففي الوقت الحالي، فإن العرض التجريبي demo الذي أدهش الجميع لا يزال مجرد عرض تجريبي فقط، و لكن بعض المستخدمين المميزين سيكون لديهم الآن إمكانية الوصول إلى ميزة الصوت في ChatGPT التي تم عرضها في العرض التجريبي demo.

يمكن لChatGPT الآن التحدث والاستماع. 

ربما تكون قد جربت وضع الصوت المتاح حالياً في ChatGPT، لكن OpenAI تشير إلى أن وضع الصوت المتقدم يختلف تماماً. ففي السابق، كان ChatGPT يعتمد على ثلاثة نماذج منفصلة: كان يتم استخدام النموذج الأول لتحويل الصوت إلى نص، ثم استخدام GPT-4 لمعالجة هذا النص و أخيرا يستعمل النموذج الثالث لتحويل نص ChatGPT إلى صوت. أما GPT-4o، فهو متعدد الأنماط ويجمع هذه الوظائف في نظام واحد مما يجعله قادرا على معالجة هذه المهام بدون الحاجة إلى نماذج مساعدة، مما يقلل من زمن الاستجابة بشكل كبير. بالإضافة إلى ذلك، و تقول  OpenAI  أن GPT-4o يمكنه أيضاً استشعار التغيرات العاطفية في صوتك، مثل الحزن و الفرح أو الغناء.

و في هذه التجربة الأولية، سيتمكن مستخدمو ChatGPT Plus من رؤية مدى واقعية و ضع الصوت المتقدم لـ OpenAI. لم يتمكن موقع elhachmi.com من اختبار الميزة قبل نشر هذا المقال، لكنها ستقوم بمراجعتها عندما نتمكن من ذلك.

كما تقول OpenAI انها ستطلق الصوت الجديد لـ ChatGPT بشكل تدريجي لمراقبة استخدامه عن كثب. سيحصل الأشخاص في المجموعة الأولية على تنبيه في تطبيق ChatGPT، يتبعه بريد إلكتروني يحتوي على تعليمات حول كيفية استخدامه.


و في الأشهر التي تلت عرض OpenAI، تقول الشركة إنها اختبرت قدرات صوت GPT-4o مع أكثر من 100 فريق اختبار خارجي يتحدثون 45 لغة مختلفة. وتقول OpenAI إن تقريراً حول هذه الجهود الأمنية سيصدر في أوائل غشت/أغسطس من العام الحالي.


وأضافت الشركة بأن وضع الصوت المتقدم سيقتصر على أربعة أصوات محددة مسبقاً في ChatGPT وهي Juniper و Breeze و Cove و Ember، التي تم إنشاؤها بالتعاون مع ممثلين صوتيين مدفوعي الأجر. أما الصوت Sky الذي تم عرضه في العرض التجريبي demo في  مايو الماضي فإنه لم يعد متاحاً في ChatGPT. و قالت ليندسي مكالوم lindsay McCallum المتحدثة باسم شركة OpenAI، إن "ChatGPT لا يمكنه تقليد أصوات الآخرين، سواء كانوا أفراداً أو شخصيات عامة، وسيقوم بحظر المخرجات التي تختلف عن أحد هذه الأصوات المحددة مسبقاً."

كما تسعى OpenAI لتجنب الجدل المتعلق بالتزييف العميق Deepfake. ففي يناير الماضي، استخدمت تقنية استنساخ الصوت من شركة ElevenLabs الناشئة في مجال الذكاء الاصطناعي AI لتقليد صوت الرئيس جو بايدن Joe Biden، مما أدى إلى خداع الناخبين الرئيسيين  Primary voters في الانتخابات الأولية في ولاية نيو هامبشاير New Hampshire.

كما أعلنت OpenAI إنها أدخلت فلاتر جديدة لحظر بعض الطلبات لإنشاء الموسيقى أو غيرها من الصوتيات المحمية بحقوق الطبع والنشر. في العام الماضي، وقعت شركات الذكاء الاصطناعي AI في مشكلات قانونية بسبب انتهاك حقوق الطبع والنشر، و تعتبر النماذج الصوتية مثل GPT-4o تهديدًا جديدًا قد يثير شكاوى و خصوصا من شركات التسجيلات التي لها تاريخ طويل في رفع الدعاوى القضائية التي لديها تاريخ في رفع الدعاوى القضائية، و قد قامت   شركات التسجيلات بالفعل بمقاضاة مولدي الأغاني AI Suno و Udio.

و باختصار، يقدم تحديث OpenAI الجديد في وضع الصوت المتقدم لChatGPT إمكانيات مذهلة تعزز تجربة التفاعل مع الذكاء الاصطناعي. من خلال دمج تقنيات متطورة وتطبيق معايير صارمة للسلامة والأخلاقيات، تفتح OpenAI آفاقاً جديدة لتحسين كيفية تواصلنا مع التكنولوجيا. ستظل مراقبة تأثير هذه التطورات على المجالات المختلفة جزءاً أساسياً لفهم مستقبل الذكاء الاصطناعي وتطبيقاته.

تعليقات

Translate




حجم الخط
+
16
-
تباعد السطور
+
2
-