Перекладач, що зберігає голос і тон оригіналу
MIT Technology Review розповідає про перекладач Google, який навчився перекладати текст, що був проговорений однією мовою, на іншу мову, зберігаючи при цьому голос з оригінального запису. Це стало можливим завдяки тому, що один аудіозапис перетворюється у інший без проміжних етапів. Так, традиційні системи перекладу спочатку перетворюють аудіо у текст, потім перекладають текст іншою мовою, і вже наостанок, перетворюють новий текст на аудіо. Таким чином, при традиційному підході до перекладу втрачаються усі характеристики голосу з оригінального запису.
Нова система від Google, що отримала назву Translatotron, складається з трьох компонентів, кожен з яких спирається на візуальний знімок частот, використаних при відтворенні звуку, або простіше кажучи – спектрограму. Перший компонент використовує нейронну мережу, яка навчилася перетворювати спектрограму аудіозапису однією мовою на спектрограму аудіозапису вже іншою мовою. Другий компонент перетворює спектрограму на звукову хвилю, яку можна відтворити. І нарешті, третій компонент повертає голосові характеристики з початкового запису до кінцевого запису.
Читайте також: Співбесіда з роботом
Цей підхід сприяє кращому розумінню перекладеного тексту не лише завдяки збереженню багатьох невербальних сигналів, а й через покращення самого перекладу. Адже при такому способі перекладу, текст проходить менше перехідних етапів, що знижує ймовірність викривлення початкового змісту.
Наразі Translatotron від Google знаходиться на етапі концептуального продукту, тобто є працююча версія перекладача з іспанської на англійську, але вона поки досить сира і неготова до комерційного запуску. Менш з тим, приклади перекладу, що демонструє дана система є дуже багатообіцяючими.
Субтитри до усіх відео, що відтворюються на телефоні
The Verge повідомляє про нову функцію в щойно запущеній операційній системі Android Q, яка дозволяє користувачам додавати субтитри, створені у режимі реального часу, до абсолютно усіх відео, що відтворюються на телефоні.
Функція Live Caption накладається на будь-яку програму, що використовується на телефоні, чи то Youtube, чи Instagram, чи Skype. Субтитри в режимі онлайн можна так само побачити для відео чи аудіо, які ви записали самостійно. Більше того, за бажанням, можна побачити транскрипцію вашої поточної розмови по телефону.
Читайте також: Магазин на колесах, роботи-офіціанти та розумне взуття
Google заявляє, що функція Live Caption створена, в першу чергу, для людей з вадами слуху, аби забезпечити їм кращий доступ до цифрових медіа. Однак, безперечно такий функціонал може бути дуже корисним і для інших користувачів, наприклад для тих, хто переглядає відео у публічних місцях і не має можливості ввімкнути звук.
Субтитри створюються завдяки алгоритмам машинного навчання, вбудованим у сам телефон, тобто дані з телефона нікуди не передаються. Транскрипція з’являється у чорному прямокутнику, який можна вільно переміщати по екрану. Функціонування Live Caption не залежить від того, чи ввімкнутий звук – субтитри можна продивлятися в будь-якому випадку. Однак, зберегти транскрипції для більш пізнього перегляду неможливо – вони демонструються лише тоді, коли відтворюється відповідний аудіоряд.
Зверніть увагу, що за замовчуванням функція Live Caption не активована в Android Q, а тому для користування субтитрами, створеними в режимі онлайн, необхідно спочатку змінити налаштування. Після цього, ввімкнути відображення субтитрів можна за допомогою однієї з кнопок гучності на телефоні – відповідна іконка відображатиметься у інтерфейсі користувача по управлінню звуком.
Перезапуск Google Glass – цього разу для бізнесу
Коли Google Glass був запущений у 2013 році, продукт отримав дуже багато критики. З тих пір він не потрапляв у фокус уваги громадськості, але спокійно закріпився в деяких галузях, в тому числі на виробництві та у сфері логістики, де за допомогою Google Glass люди змогли отримувати доступ до необхідної інформації, не займаючи рук.
Читайте також: CES 2019: інноваційна зубна щітка, друкований макіяж та крокуючий автомобіль
Тож, зі своїм останнім варіантом розумних окулярів Google продовжує зосереджувати увагу на компаніях, а не індивідуальних клієнтах. Так, з’являється Glass Enterprise Edition 2, який має більш потужний процесор, новий двигун штучного інтелекту, кращу камеру, швидшу зарядку та довший час автономної роботи, а також побудований на Android. Вартість нового гарнітуру складає $999.
Крім того, на нещодавній події Google I/O 2019 було оголошено і про низку інших новинок від Google, в тому числі телефони Pixel 3A та Pixel 3A XL за досить доступною ціною від $399, дисплей з камерою для управління системою розумного будинку, режим інкогніто для Google Maps та ще розумніший Google Assistant. До того ж повноцінно запускається нова операційна система Android Q, яка пропонує темну тему для усіх стандартних додатків. При цьому, в цій темі кольори будуть дійсно чорними, а не темно-сірими, що дозволить суттєво економити заряд батареї.
Тож, чекаємо, коли усіма цими новинками можна буде користуватися на наших телефонах.