Google оголосив про запуск Gemini 3.5 Live Translate — аудіомоделі для перекладу мовлення в реальному часі. Функція з’явиться у продуктах Google, зокрема в Google Translate на Android та iOS, а також у Google Meet для корпоративних користувачів.
Про це інформує Delo.ua з посиланням на повідомлення компанії.
Модель автоматично розпізнає понад 70 мов і генерує
перекладене мовлення з природним звучанням. За даними Google, технологія
зберігає інтонацію, темп і висоту голосу мовця.
На відміну від систем, які чекають завершення фрази перед
перекладом, Gemini 3.5 Live Translate працює безперервно. Модель перекладає
мовлення під час розмови, залишаючись лише на кілька секунд позаду мовця та
зменшуючи паузи у спілкуванні.
Функцію Live
Translate розгортають у кількох напрямах:
для розробників — у публічній
підготовчій версії через Gemini Live API та Google AI Studio;
для бізнесу — приватна
підготовча версія в Google Meet стартує цього місяця;
для користувачів — через Google
Translate на Android та iOS.
Gemini 3.5 Live Translate обробляє мовлення під час
потокової передачі та підтримує багатомовний вхід без ручного налаштування
параметрів. Модель також розрахована на роботу в шумному середовищі.
Для розробників Google пропонує використовувати Gemini Live API
для створення сервісів голосового перекладу, зокрема для дзвінків, зустрічей,
уроків, трансляцій та інших форматів живого спілкування.
Платформи Agora, Fishjam, LiveKit, Pipecat та Vision Agents
інтегрують Gemini Live API, щоб розробники могли створювати програми для
перекладу голосу без самостійної побудови складної інфраструктури потокового
аудіо.
Серед партнерів, які тестують модель, Google називає Grab.
Компанія перевіряє Live Translate для багатомовного спілкування між водіями та
пасажирами під час посадки. За даними Google, користувачі Grab здійснюють понад
10 млн голосових дзвінків на місяць через платформу.
Для бізнесу запуск Gemini 3.5 Live Translate означає
розширення інструментів для міжнародних дзвінків, зустрічей і клієнтської
підтримки. Для користувачів Google Translate це має спростити живе спілкування
різними мовами без окремих перекладачів або пауз між репліками.
Нагадаємо, Google розпочала впровадження штучного інтелекту Gemini у свої сервіси перекладу, зокрема в застосунок Google Translate і пошук. Оновлення спрямоване на підвищення точності та природності перекладів, особливо у випадках із багатозначними фразами, ідіомами та сленгом.
Документ: PDF-доказ оригінальної версії новини "Google додав голосовий переклад в Google Meet у реальному часі". Фіксує зміст публікації на момент першого сканування, дату збереження та джерело: Delo.ua.