مفاجأة.. الذكاء الاصطناعي يحيي أصوات الموتى لتسجيل كتب مسموعة.. وصحيفة "غارديان" تسرد أدق التفاصيل

متن نيوز

هل الذكاء الاصطناعي يحيي أصوات الموتى لتسجيل كتب مسموعة؟.. سؤال تصدر تريند جوجل خلال الساعات الماضية.

 

جاء ذلك بعد عنوان  عنوان اختارته صحيفة "غارديان" لأحد مقالاتها في بداية 2023، بعنوان "موت الراوي"،  متحدثة فيه عن نهاية قريبة تتهدد الراويين البشر للكتب المسموعة، هذه السوق المربحة والآخذة في النمو، وذلك بعد إعلان شركة "أبل" إطلاق مجموعة من الكتب الصوتية يتولى قراءتها نموذج من الذكاء الاصطناعي. اليوم، تتحدث مقالات كثيرة عن "إحياء" الراوي بعدما أطلقت شركة متخصصة بالكتب الصوتية تسمى "ديب زين" DeepZen في لندن مشروعًا جديدًا لها في هذه الصناعة.

اختارت الشركة إدوارد هيرمان، صاحب أكثر الأصوات شهرة في هوليوود بعدما حصلت على حق الوصول إلى تسجيلاته السابقة بإذن من عائلته. اشتهر الممثل الأميركي بأدواره في أفلام مثل "آني" Annie و"ريدز" Reds و"ذا بيربل روز أوف كايرو" The Purple Rose of Cairo، وفي مسلسلات تلفزيونية عدة من بينها، "ذا براكتس" The Practice و"غيلمور غيرلز "Gilmore Girls. ولكن الأهم أنه كان أيضًا قارئ كتب مسموعة غزير الإنتاج. ومن المتوقع إصدار كتاب بصوته لاحقًا خلال العام الحالي هو "الحرب مع المكسيك" The War with Mexico بقلم جوستين أتش سميث الفائز بجائزة "بوليتزر" عن فئة التاريخ عام 1920. ولكن كيف يكون ذلك وقد فارق هيرمان الحياة منذ 10 سنوات تقريبًا؟

 

لقد أعيد إنشاء صوت هيرمان عبر نموذج من الذكاء الاصطناعي يستفيد من مقاطع صوتية سابقة له، ويستخدمها في رواية كتب صوتية جديدة، على ما ذكرت "وول ستريت جورنال" في تقرير نشرته في هذا الشأن.


كما نقلت الصحيفة عن روري هيرمان، ابن هيرمان وصاحب مطعم في لوس أنجليس، قوله إن العائلة ارتأت أن "هذه الطريقة خطوة رائعة للحفاظ على إرث [هيرمان]"، متحدثًا عن دهشة اعترته عندما استمع للمرة الأولى إلى كتاب مسموع يظهر فيه صوت والده الذي ولّده ذكاء اصطناعي.

 

على الموقع الإلكتروني لشركة "ديب زين" تجد قائمة بأصوات عدد من رواة الكتب المسموعة للاختيار من بينها. هناك، تجد هيرمان مدرجًا ببساطة باسم "إدوارد"، مع عينة من صوته تقول، "أعجوبة التكنولوجيا اليوم تعني أن في مقدورنا إنشاء أصوات شبيهة بالبشر باستخدام الذكاء الاصطناعي. على رغم أنني، إدوارد، شخص حقيقي، غير أن الكلمات التي أقولها قد ولدها جهاز كمبيوتر".

 

إنه الذكاء الاصطناعي التوليديGenerative AI، من منا لم يسمع أو يقرأ عن هذا الشكل من التكنولوجيا القادرة على إنشاء أنواع مختلفة من المحتوى، بما في ذلك نصوص وصور وأصوات، لا سيما بعد إطلاق روبوت الدردشة المؤتمت "شات جي بي تي" Chat GPT من شركة "أوبن أي آي" Open AI  في أواخر العام الماضي. بين عشية وضحاها، أصبح برنامج الدردشة الآلي، الذي يجيب ببلاغة عن أي سؤال، وعلى نحو خاطئ جدًا أحيانًا- ظاهرة عالمية، ما أثار توقعات بأن الذكاء الاصطناعي عمومًا قد يقلب مهنًا كثيرة رأسًا على عقب.

 

واحدة من تلك المهن السرد المسموع، وليس وصول الذكاء الاصطناعي إلى هذا القطاع مجرد كلام. فشركات مثل "غوغل" و"أبل" تستخدمه فعلًا لرواية الكتب الصوتية، ولكن الاعتماد على أصوات رواة وافتهم المنية يبقى حتى الآن ظاهرة جديدة.

 

وقد ذكرت "أبل" و"جوجل" أنهما تسمحان للمستخدمين بإنشاء كتب صوتية مجانًا تستخدم أصواتًا بشرية مستنسخة رقميًا. مصدر الأصوات المعروضة في كتب صوتية أنشأتها الشركتان أشخاص حقيقيون، وساعدت أصواتهم في تدريب محركات السرد الآلي.

 

وقال تشارلز واتكينسون، مدير "مطبعة جامعة ميشيغان"، إن الأخيرة قد أنتجت نحو 100 كتاب صوتي باستخدام النظام الأساسي المجاني للكتب الصوتية المروية تلقائيًا من "غوغل" منذ أوائل العام الماضي. فالتكنولوجيا الجديدة جعلت توفير تلك العناوين ممكنًا لأنها ألغت التكاليف المرتبطة باستخدام استوديو الإنتاج وموظفي الدعم والرواة البشريين.