قدم المطورون من Google مشروعًا جديدًا ، تم من خلاله إنشاء تقنية يمكنها ترجمة الجمل الشفوية من لغة إلى أخرى. الفرق الرئيسي بين المترجم الجديد المسمى Translatotron ونظائره هو أنه يعمل حصريًا مع الصوت ، دون استخدام نص وسيط. سمح لنا هذا النهج بتسريع عمل المترجم بشكل كبير. نقطة أخرى جديرة بالملاحظة هي أن النظام يحاكي بدقة تردد المتحدث ونبرة الصوت.
كان من الممكن إنشاء Translatotron بفضل العمل المستمر الذي استغرق عدة سنوات. لطالما نظر الباحثون في Google في إمكانية التحويل المباشر للكلام ، ولكن حتى وقت قريب لم يكن من الممكن تحقيق خططهم.
غالبًا ما تعمل أنظمة الترجمة الفورية المستخدمة اليوم وفقًا لخوارزمية واحدة. في المرحلة الأولى ، يتحول الخطاب الأصلي إلى نص. ثم يتم تحويل النص في إحدى اللغات إلى نص بلغة أخرى. بعد ذلك ، يتم تحويل النص الناتج إلى كلام باللغة المطلوبة. تعمل هذه الطريقة بشكل جيد ، لكنها لا تخلو من العيوب. في كل مرحلة ، يمكن أن تحدث أخطاء تتداخل مع بعضها البعض وتؤدي إلى انخفاض جودة الترجمة.
لتحقيق النتيجة المرجوة ، درس الباحثون مخططات الصوت. حاولوا تحويل مخطط طيفي بلغة ما إلى مخطط طيفي بلغة أخرى ، متخطين خطوات تحويل الصوت إلى نص.
تجدر الإشارة إلى أنه على الرغم من تعقيد مثل هذا التحول ، تتم معالجة الكلام في خطوة واحدة ، وليس في ثلاثة ، كما كانت من قبل. مع وجود قدر كافٍ من قوة الحوسبة تحت تصرفه ، ستؤدي Translatotron الترجمة الفورية بشكل أسرع. نقطة أخرى مهمة هي أن هذا الأسلوب يسمح لك بالحفاظ على ميزات ونغمة الصوت الأصلي.
في هذه المرحلة ، لا يمكن أن تفتخر Translatotron بنفس دقة الترجمة العالية مثل الأنظمة القياسية. على الرغم من ذلك ، يقول الباحثون إن معظم الترجمات التي تمت بجودة كافية. في المستقبل ، سيستمر العمل على Translatotron ، حيث يعتزم الباحثون تحسين جودة ترجمة الكلام المتزامنة.
المصدر: 3dnews.ru