مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

49 خبر
  • نبض الملاعب
  • إسرائيل تواصل غاراتها على لبنان
  • عيد النصر على النازية
  • نبض الملاعب

    نبض الملاعب

  • إسرائيل تواصل غاراتها على لبنان

    إسرائيل تواصل غاراتها على لبنان

  • عيد النصر على النازية

    عيد النصر على النازية

  • فيديوهات

    فيديوهات

  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

روسيا.. ابتكار أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي

طوّر باحثو جامعة نوفوسيبيرسك التقنية الروسية أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي.

روسيا.. ابتكار أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي
صورة إرشيفية / abc-av.ru

أفاد بذلك  المشرف على المشروع يغور أنتونيانتس في حديث أدلى به لوكالة "تاس" الروسية.

يهدف هذا التطوير إلى المهام التي تتطلب إنتاجا مستقلا للمقطوعات الموسيقية والأجزاء الغنائية والمؤثرات الصوتية بناء على أوصاف نصية دون الارتباط بخدمات سحابية. ووفقا للمطورين، يوفر النظام دورة كاملة لإنتاج المحتوى الصوتي،  بدءا من الطلب النصي ووصولا للتصدير إلى المنصات واسعة الاستخدام WAV و MP3 و FLAC، ويعمل النظام  في نفس الوقت على أجهزة استهلاكية بحجم ذاكرة فيديو أقل من 6 غيغابايت.

وأشار أنتونيانتس إلى أن  "الميزة الرئيسية لتطويرنا هي الاستقلالية الكاملة عن المنصات الأجنبية وإمكانية العمل في بيئة مغلقة. لقد قمنا بضبط النموذج الأساسي باستخدام محولات LoRA المتخصصة لثلاثة أنواع من المحتوى، وهي الموسيقى الآلية، والأغاني المصحوبة بصوت بشري، والمؤثرات الصوتية، مما يتجنب تأثير اختلاط الخصائص ويحقق تطابقا أدق مع الطلب".

وعلى عكس الحلول الأساسية الموجهة للمستخدمين الناطقين بالإنجليزية، فإن الأداة الجديدة مهيأة للعمل مع الاستعلامات الناطقة بالروسية وتُظهر نتائج تنافسية. فقد بلغ متوسط معيار التقييم الذاتي MOS 4.1 من أصل 5 نقاط، وهو ما يُقارن بمعدلات المنصات التجارية الرائدة.

وأوضح مطور المشروع أرتور خوساينوف قائلا: " من ناحية تقنية تتم المعالجة على عدة مراحل: يقوم نموذج لغوي أولا بتشكيل هيكل دلالي للمقطوعة باستخدام سلسلة من التفكير، ثم يقوم المحول الانتشاري (diffusion transformer) بالتركيب الصوتي في الفضاء الكامن، أما وحدة التصدير فتقوم بتحويل المحتوى إلى الصيغ المستهدفة. وتسمح الواجهة الرسومية المدمجة بإدارة المشاريع، وحفظ وتحميل إعدادات التوليد المسبقة، والمعاينة قبل الاستماع، وتصدير المسارات دون الحاجة إلى محررات خارجية".

وأكد مبتكرو البرنامج أنهم يخططون مستقبلا لتوسيع النظام، بما في ذلك إضافة دعم الصوت المكاني لتطبيقات الواقع الافتراضي، وتنفيذ التكامل مع وحدات تحكم MIDI للتفاعل الحي، وتكييف البرنامج للسيناريوهات الصناعية،  بدءا من إنشاء مقاطع صوتية لألعاب الفيديو ووصولا إلى الدبلجة الآلية للأفلام والبث المباشر والبودكاست والإعلانات التجارية.

المصدر: تاس

التعليقات

مسؤول أمريكي: مدمرات أمريكية تتعرض لهجوم إيراني واسع وخطير خلال عبورها مضيق هرمز

وكالة فارس: اشتباكات بين القوات الإيرانية والأمريكية في مضيق هرمز

عرض عسكري في الساحة الحمراء في ذكرى النصر الـ81 بحضور الرئيس بوتين (صور)

صور الأقمار الاصطناعية تكشف حجم الدمار في قاعدة "عريفجان" الأمريكية بالكويت (فيديو)

لبنان لحظة بلحظة.. يوم دام في الجنوب وعون يطالب بضغط أوروبي لوقف النار ونشر الجيش على الحدود

السعودية توضح حقيقة فتح دول خليجية مجالها الجوي أمام القوات الأمريكية ضد إيران

ترامب: السفن بدأت تغيير مسارها من هرمز إلى الموانئ الأمريكية ونتفاوض مع إيران

سي أن أن نقلا عن الاستخبارات الأمريكية: مجتبى خامنئي في قلب المعركة ويقود الحرب والمفاوضات

ترامب يستعرض "سلاح الليزر" ضد الطيران الإيراني وبحرية طهران ترد بصواريخ كروز ومسيرات

زاخاروفا: العالم يجب أن يسمع تحذير روسيا لزيلينسكي ويدرك خطورة اللحظة

تاكر كارلسون يسخر من موقف ميرتس بشأن البرنامج النووي الإيراني

بيان الخارجية الأمريكية عن مفاوضات لبنان وإسرائيل

سابقة في التاريخ الأمريكي.. واشنطن تكشف الستار عن ملفات الظواهر الغامضة

الحرس الثوري ينشر مشاهد ردّه على 3 مدمرات أمريكية (فيديوهات)

عراقجي يصحح معلومات واشنطن عن مخزون طهران الصاروخي

"طوفان الأقصى" يهز إسرائيل مجددا.. تفجر معركة تحميل مسؤولية "7 أكتوبر" بين المحكمة العليا ونتنياهو

مستشار خامنئي يعلن نهاية "الصبر الاستراتيجي" ويرسم ملامح المرحلة الجديدة لمضيق هرمز

الإمارات تكشف حصيلة الضربات الإيرانية منذ بداية الحرب

خبير عسكري إسرائيلي يحذر مما يدور خلف الكواليس على الحدود المصرية