Disney Research сделала технологию идентификации субъекта с выбором свойственного голосового ряда
Эксперты корпорации Disney Research, чьим стараниям не раз отдавались элементы на 3DNews, продемонстрировали метод для идентификации издаваемого субъектом звука. Спроектированная система дает возможность в случае присутствия одной только визуализации объекта автоматом выбрать нужный аудиоряд.
Показанная система, не вдаваясь в пространные рассуждения, считается некоторой интерпретацией одной из образующих «компьютерного зрения», как говорят сами творцы проекта. Если имеющиеся сегодня компьютерные комплексы готовы различить вид/тип/группу субъекта, угодившего в кадр, то проект Disney Research готов специально обеспечить видео голосовой дорожкой.
Нужную аудиоассоциацию, которая служит прототипом оцениваемой технологии, гарантирует символический «синтетический разум», который эксперты Disney Research учили по дополнительной методике. Для данной задачи хватался большой архив видеозаписей с главным субъектом, доступным распознаванию. При этом на записи находился чужой тон, который мог сколотить метод с толку.
Но в реальности же творение Disney Research пока не может похвастать повышенной правильностью: система может перепутать трамвай с авто, назначив одному из них соответствующий звук.
Несмотря на то что система, изначально, не представляется настолько уж нужной, творцы проекта убеждены, что их компьютерный комплекс значительно облегчит процесс изготовления видео-контента, и поможет людям с ужасным зрением. Однако для перевоплощения бриллианта в алмаз — улучшения системы для её безупречного функционирования — Disney Research ещё чересчур далеки.