أعلنت شركة ميتا مؤخراً عن إطلاق مشروع جديد يحمل اسم “NotebookLlama”، وهو نسخة مفتوحة المصدر لنظام إنشاء الحلقات الصوتية التفاعلية “البودكاست” المستند على تقنيات الذكاء الاصطناعي، في خطوة تهدف إلى المنافسة مع المنصة المماثلة من جوجل التي حققت شهرة واسعة في الآونة الأخيرة.

يعتمد مشروع NotebookLlama على نماذج الذكاء الاصطناعي المعروفة باسم “Llama”، والتي تمتلكها شركة ميتا، لتولي جزء كبير من عمليات المعالجة اللازمة لإنشاء المحتوى الصوتي.

على غرار أداة NotebookLM، تُتيح NotebookLlama إمكانية توليد ملخصات صوتية بأسلوب حواري مماثل لتنسيق البودكاست، وذلك استنادًا إلى النصوص التي يُتم رفعها إلى النظام.

تبدأ الأداة بتحويل النصوص إلى ملفات صوتية، مثل المقالات الإخبارية أو المنشورات، ثم تضيف “لمسات درامية” وعناصر تفاعلية لإضافة طابع حيوي على النصوص الجاهزة، قبل إرسالها إلى نماذج متخصصة لتحويل النص إلى كلام.

ومع ذلك، تشير النتائج الحالية إلى أن جودة الصوت المُنتج عبر NotebookLlama لا تضاهي تلك الناتجة عن أداة NotebookLM من جوجل، حيث يُلاحظ أن الأصوات المُنتجة تبدو غير طبيعية وتفتقر إلى السلاسة، مما يؤدي في بعض الأحيان إلى تداخل غير متناسق في الحديث.

إلا أن الباحثين في ميتا يُعربون عن تفاؤلهم بخصوص إمكانية تحسين الجودة من خلال استخدام نماذج أقوى، مؤكدين أن “نموذج تحويل النص إلى كلام هو المحور الأساسي في تحديد مدى طبيعية الصوت”. كما أوضحوا أنهم يدرسون أيضاً إمكانية استخدام نهج يعتمد على وجود وكيلين من الذكاء الاصطناعي لإجراء مناقشة حول الموضوع وتنظيم هيكل الحوار، بدلاً من الاعتماد على نموذج واحد فقط لإنشاء المخطط.

تجدر الإشارة إلى أن NotebookLlama ليست المحاولة الأولى لاستنساخ ميزة البودكاست من أداة جوجل NotebookLM، حيث ظهرت عدة مشاريع في هذا المجال بمستويات متباينة من النجاح. إلا أنه لم يتمكن أي منها حتى الآن من التغلب على مشكلة “الهلوسة” الشائعة في تطبيقات الذكاء الاصطناعي، بما في ذلك أداة NotebookLM نفسها، حيث قد تتولد معلومات غير دقيقة أو مختلقة في البودكاست.