
أعلنت جوجل إطلاق نموذج Gemini 3.5 Live Translate الجديد للترجمة الصوتية الفورية، بهدف تقليل حواجز اللغة، وإتاحة المحادثات المباشرة بين المستخدمين بلغات مختلفة بصورة أكثر طبيعية وسلاسة.
وقالت الشركة إن النموذج الجديد قادر على تعرّف أكثر من 70 لغة تلقائيًا، مع تقديم ترجمة صوتية تحافظ على نبرة المتحدث وإيقاع حديثه وطبقته الصوتية، ويتميز النموذج بقدرته على توليد الترجمة بنحو مستمر في أثناء الكلام، بدلًا من الاعتماد على أسلوب الترجمة التقليدي الذي ينتظر انتهاء المتحدث من الجملة قبل بدء الترجمة.
واستعرضت جوجل قدرات النموذج عبر أمثلة عملية شملت دبلجة مقاطع الفيديو في الوقت الفعلي، بالإضافة إلى ترجمة المحاضرات والعروض التقديمية المتعددة اللغات، مع الحفاظ على انسيابية الحديث بين المشاركين.
وفي إطار توسيع استخدام التقنية، أكدت الشركة أن Gemini 3.5 Live Translate سيصل إلى خدمة المكالمات والاجتماعات Google Meet خلال وقت لاحق من العام الجاري. وسترتفع اللغات المدعومة في الترجمة الفورية من خمس لغات فقط حاليًا إلى أكثر من 70 لغة، مع إمكانية دعم أكثر من 2000 تركيبة لغوية مختلفة داخل الاجتماع الواحد.
ومن المقرر أن تتجاوز الخدمة الاعتماد السابق على اللغة الإنجليزية كلغة وسيطة للترجمة، في حين تعتزم جوجل تحديث واجهة Google Meet لتسهيل الوصول إلى ميزة الترجمة الصوتية بسرعة أكبر.
وستبدأ النسخة المحسّنة من الترجمة الصوتية في Google Meet الوصول أولًا إلى مجموعة محددة من الشركات المشتركة في خدمة Google Workspace ضمن معاينة خاصة خلال وقت لاحق من الشهر الجاري، على أن تتوسع إلى شريحة أوسع من المستخدمين لاحقًا هذا العام.
وفي الوقت نفسه، بدأت جوجل طرح Gemini 3.5 Live Translate عالميًا داخل تطبيق Google Translate عبر نظامي أندرويد و iOS. ويتضمن التحديث وضعًا جديدًا باسم “وضع الاستماع” في أندرويد، يتيح للمستخدمين الاستماع إلى الترجمات المباشرة عبر سماعات الرأس أو مباشرةً عبر سماعة الهاتف.
وأكدت الشركة أن كافة المقاطع الصوتية التي يولدها النموذج ستتضمن علامة مائية رقمية غير مرئية باستخدام تقنية SynthID، وهي تقنية طورتها جوجل للمساعدة في التحقق من المحتوى المُنشأ بالذكاء الاصطناعي والحد من إساءة استخدامه في نشر المعلومات المضللة.



