Чем удивит Google

Чим здивує Google

Переводчик, воссоздающий оригинальный голос, автоматические субтитры к абсолютно всем видео на телефоне и новая жизнь в Google Glass.

Переводчик, сохраняющий голос и тон оригинала

MIT Technology Review рассказывает о переводчик Google научился переводить текст, что было проговорено на одном языке, на другой язык, сохраняя при этом голос из оригинальной записи. Это стало возможным благодаря тому, что один звук превращается в другой без промежуточных этапов. Так, традиционные системы перевода сначала преобразуют аудио в текст, потом переводят текст на другом языке, и уже напоследок, превращают новый текст на аудио. Таким образом, при традиционном подходе к переводу теряются все характеристики голоса из оригинальной записи.

Новая система от Google, которая получила название Translatotron, состоит из трех компонентов, каждый из которых опирается на визуальный снимок частот, использованных при воспроизведении звука, или проще говоря – спектрограму. Первый компонент использует нейронную сеть, которая научилась превращать спектрограму аудиозаписи одним языком на спектрограму аудиозаписи уже на другом языке. Второй компонент превращает спектрограму на звуковую волну, которую можно воспроизвести. И наконец, третий компонент возвращает голосовые характеристики с записи начального до конечного записи.

Этот подход способствует лучшему пониманию переведенного текста не только благодаря сохранению многих невербальных сигналов, но и через улучшение самого перевода. Ведь при таком способе перевода, текст проходит меньше переходных этапов, что снижает вероятность искажения первоначального смысла.

Сейчас Translatotron от Google находится на этапе концептуального продукта, то есть работающая версия переводчика с испанского на английский, но она пока довольно сырая и не готова к коммерческому запуску. Менее с тем, примеры перевода, что демонстрирует данная система является очень многообещающими.

Субтитры ко всем видео, которые воспроизводятся на телефоне

The Verge сообщает о новой функции в только что запущенной операционной системе Android Q, которая позволяет пользователям добавлять субтитры, созданные в режиме реального времени, в абсолютно всех видео, которые воспроизводятся на телефоне.

Функция Live Caption накладывается на любую программу, используемую на телефоне, то Youtube, Instagram, Skype. Субтитры в режиме онлайн можно так же увидеть видео или аудио, которые вы записали самостоятельно. Более того, по желанию, можно увидеть транскрипцию вашей текущей разговора по телефону.

Google заявляет, что функция Live Caption создана, в первую очередь, для людей с недостатками слуха, чтобы обеспечить им лучший доступ к цифровым медиа. Однако, бесспорно такой функционал может быть очень полезным и для других пользователей, например для тех, кто просматривает видео в публичных местах и не имеет возможности включить звук.

Субтитры создаются благодаря алгоритмам машинного обучения, встроенным в сам телефон, то есть данные с телефона никуда не передаются. Транскрипция отображается в черном прямоугольнике, который можно свободно перемещать по экрану. Функционирование Live Caption не зависит от того, включен звук – субтитры можно просматривать в любом случае. Однако, сохранить транскрипции для более позднего просмотра невозможно – они демонстрируются только тогда, когда воспроизводится соответствующий аудиоряд.

Обратите внимание, что по умолчанию функция Live Caption не активирована в Android Q, а потому для пользования субтитрами, созданными в режиме онлайн, необходимо сначала изменить настройки. После этого, включить отображение субтитров можно с помощью одной из кнопок громкости на телефоне – соответствующая иконка будет отображаться в интерфейсе пользователя по управлению звуком.

Перезапуск Google Glass – на этот раз для бизнеса

Когда Google Glass был запущен в 2013 году, продукт получил очень много критики. С тех пор он не попадал в фокус внимания общественности, но спокойно закрепился в некоторых отраслях, в том числе на производстве и в сфере логистики, где с помощью Google Glass люди смогли получать доступ к необходимой информации, не занимая рук.

Поэтому, со своим последним вариантом умных очков Google продолжает сосредоточивать внимание на компаниях, а не индивидуальных клиентах. Так, появляется Glass Enterprise Edition 2, который имеет более мощный процессор, новый движок искусственного интеллекта, лучшую камеру, более быструю зарядку и длительное время автономной работы, а также построен на Android. Стоимость нового гарнитура составляет $999.

Кроме того, на недавней события Google I/O 2019 было объявлено и о ряде других новинок от Google, в том числе телефоны Pixel 3A и Pixel 3A XL по весьма доступной цене от $399, дисплей с камерой для управления системой умного дома, режим «инкогнито» для Google Maps и еще умнее Google Assistant. К тому же полноценно запускается новая операционная система Android Q, которая предлагает темную тему для всех стандартных приложений. При этом, в этой теме цвета будут действительно черными, а не темно-серыми, что позволит существенно экономить заряд батареи.

Поэтому, ждем, когда всеми этими новинками можно будет пользоваться на наших телефонах.

Share