Google Translatotron هي تقنية ترجمة الكلام المتزامنة التي تحاكي صوت المستخدم

قدم المطورون من Google مشروعًا جديدًا ، تم من خلاله إنشاء تقنية يمكنها ترجمة الجمل الشفوية من لغة إلى أخرى. الفرق الرئيسي بين المترجم الجديد المسمى Translatotron ونظائره هو أنه يعمل حصريًا مع الصوت ، دون استخدام نص وسيط. سمح لنا هذا النهج بتسريع عمل المترجم بشكل كبير. نقطة أخرى جديرة بالملاحظة هي أن النظام يحاكي بدقة تردد المتحدث ونبرة الصوت.

كان من الممكن إنشاء Translatotron بفضل العمل المستمر الذي استغرق عدة سنوات. لطالما نظر الباحثون في Google في إمكانية التحويل المباشر للكلام ، ولكن حتى وقت قريب لم يكن من الممكن تحقيق خططهم.

Google Translatotron هي تقنية ترجمة الكلام المتزامنة التي تحاكي صوت المستخدم

غالبًا ما تعمل أنظمة الترجمة الفورية المستخدمة اليوم وفقًا لخوارزمية واحدة. في المرحلة الأولى ، يتحول الخطاب الأصلي إلى نص. ثم يتم تحويل النص في إحدى اللغات إلى نص بلغة أخرى. بعد ذلك ، يتم تحويل النص الناتج إلى كلام باللغة المطلوبة. تعمل هذه الطريقة بشكل جيد ، لكنها لا تخلو من العيوب. في كل مرحلة ، يمكن أن تحدث أخطاء تتداخل مع بعضها البعض وتؤدي إلى انخفاض جودة الترجمة.

لتحقيق النتيجة المرجوة ، درس الباحثون مخططات الصوت. حاولوا تحويل مخطط طيفي بلغة ما إلى مخطط طيفي بلغة أخرى ، متخطين خطوات تحويل الصوت إلى نص.


Google Translatotron هي تقنية ترجمة الكلام المتزامنة التي تحاكي صوت المستخدم

تجدر الإشارة إلى أنه على الرغم من تعقيد مثل هذا التحول ، تتم معالجة الكلام في خطوة واحدة ، وليس في ثلاثة ، كما كانت من قبل. مع وجود قدر كافٍ من قوة الحوسبة تحت تصرفه ، ستؤدي Translatotron الترجمة الفورية بشكل أسرع. نقطة أخرى مهمة هي أن هذا الأسلوب يسمح لك بالحفاظ على ميزات ونغمة الصوت الأصلي.

في هذه المرحلة ، لا يمكن أن تفتخر Translatotron بنفس دقة الترجمة العالية مثل الأنظمة القياسية. على الرغم من ذلك ، يقول الباحثون إن معظم الترجمات التي تمت بجودة كافية. في المستقبل ، سيستمر العمل على Translatotron ، حيث يعتزم الباحثون تحسين جودة ترجمة الكلام المتزامنة.



المصدر: 3dnews.ru

إضافة تعليق