Ученые разработали точную систему чтения по губам
Исследователи из университета Англии создали технологию, которая с очень высокой точностью распознает речь по движению губ и мимике человека, который говорит.
Группа ученых из отдельного подразделения Университета Восточной Англии под названием Школа Университета, которое возглавляет Профессор Ричард Харви, почти полностью закончила создание технологии, позволяющей считывать информацию по губам и мимике. В основе такой системы лежит искусственный интеллект со способностью быстрого обучения. В результате успешного окончания исследований такой метод поможет полицейским в расследованиях преступлений, а также сможет улучшить систему общения с людьми, которые плохо слышат или имеют проблемы с речевым аппаратом.
По словам исследователей, их система поможет в тех случаях, когда невозможно получить записи со звуковой дорожкой и в результате получить аудиозаписи с высоким качеством. Такой способ получения речевого сигнала будет полезен не только в правоохранительных органах, но также позволит общаться людям в условиях сильного шума, например, в шахтах, кабинах самолетов или машин. Другими словами, это станет системой передачи звуковой информации, не зависящей от оптимальной среды распространения звуковых волн.
Такая система уже не первая, которая претендует на замещение речевого сигнала. Однако все предшествующие аналоги данной технологии обладали главным недостатком – они не могли распознать звуки p, b, m, которые при произношении имеют одинаковые мышечные комбинации речевого аппарата. Для устранения этого эффекта ученые разработали систему обучения программного обеспечения, которая позволяет ему легко разделять похожие по произношению звуки.
Подход этой группы исследователей отличается от ученых, которые занимаются визуализацией речи, тем, что они основательно занялись изучением мышечных процессов, осуществляемых речевым аппаратом человека во время говорения. Все результаты исследований переносятся в программу, в которой создается математический алгоритм распознавания движения губ. Также использование в программе искусственного интеллекта позволяет исследователям обучить ее реагировать даже на малейшие изменения в мимике человека. По словам ученых, самое интересное заключается в том, что система распознает движения, учитывая различные формы губ человека.
По словам исследователей, их система поможет в тех случаях, когда невозможно получить записи со звуковой дорожкой и в результате получить аудиозаписи с высоким качеством. Такой способ получения речевого сигнала будет полезен не только в правоохранительных органах, но также позволит общаться людям в условиях сильного шума, например, в шахтах, кабинах самолетов или машин. Другими словами, это станет системой передачи звуковой информации, не зависящей от оптимальной среды распространения звуковых волн.
Такая система уже не первая, которая претендует на замещение речевого сигнала. Однако все предшествующие аналоги данной технологии обладали главным недостатком – они не могли распознать звуки p, b, m, которые при произношении имеют одинаковые мышечные комбинации речевого аппарата. Для устранения этого эффекта ученые разработали систему обучения программного обеспечения, которая позволяет ему легко разделять похожие по произношению звуки.
Подход этой группы исследователей отличается от ученых, которые занимаются визуализацией речи, тем, что они основательно занялись изучением мышечных процессов, осуществляемых речевым аппаратом человека во время говорения. Все результаты исследований переносятся в программу, в которой создается математический алгоритм распознавания движения губ. Также использование в программе искусственного интеллекта позволяет исследователям обучить ее реагировать даже на малейшие изменения в мимике человека. По словам ученых, самое интересное заключается в том, что система распознает движения, учитывая различные формы губ человека.