Программы для распознавания речи являются почти идеальным.

В последние несколько лет незаметно проникло во все сферы нашей жизни. Их используют в телефонных линиях поддержки и системах бронирования рейсов. Встроенные в Microsoft Windows. С их помощью мы можем по желанию введите текст на телефонах с сенсорными экранами, таких как iPhone, фотоаппараты с Android. Да, действительно, большинство людей не любит, однако их использовать.

Потому что это вообще не выбор, а необходимость – когда нельзя писать на клавиатуре или поговорить с другим человеком. Корпорации используют их в системах телефонных, потому что это дешевле, чем нанимать людей. Многие люди, которые диктуют тексты своим компьютерам, не имеет другого выхода, из-за, например, инвалидности. А в сенсорных телефонах применяется распознавание речи, потому что на экранной клавиатуре, пишет медленно и неудобно.

Что в таком случае нужно сделать, чтобы распознавание речи перестало быть erzacem? Как далеко нам до говорящими, niepopełniających ремонт компьютеров в Стар Треке?
Так вот, мы все ближе и ближе. Оказывается, что после десятилетия поглощений, слияний и коррупционных скандалов на поле боя осталась только одна крупная компания, занимающаяся распознаванием речи – Nuance Communications – и продает она единственное коммерческое программное обеспечение адаптированы к нет windows, Macintosh и iPhone. Ее технология используется в автомобилях марки Audi и BMW, в fordach и mercedesach и телефонах Motorola, Nokia, Samsung, Verizon и T-Mobile. Благодаря ей работают тоже, реагирующие на голос, игрушки, приемники GPS и банкоматы, и она позволяет получать через компьютер телефонов в ATandT, Bank of America или CVS.

Каждый год Nuance представляет новую версию программ для индивидуальных пользователей, например, Dragon NaturallySpeaking. Как правило, в них нет многих новых функций, Nuance сосредоточены они в основном на одном – увеличении точности.
Когда-то, чтобы программа научилась распознавать ваш голос, нужно было прочитать его в микрофон текст. В начале тренировки должны длиться 45 минут, по мере совершенствования технологии это время претерпела сокращения – до 20, в 10, в итоге 5 минут. Сегодня урок уже не нужна. Просто начинает диктовать, а программа записывает слова (по моим подсчетам) с точностью до 99,9%. Еще раз на несколько страниц ошибается какое-то слово, но делает это впечатление.

Разработчики программного обеспечения захватывают различные способы, чтобы оно было более точным. В первых версиях надо было делать после каждого слова паузу, а программа не мог различить слов, таких как „может” и „море”*. Со временем, однако, все более быстрые процессоры позволили анализ плавной речи. Сегодня, наоборот, желательно более длинные фразы, чтобы было больше материала для анализа.

Еще одна уловка: в прошлом году Nuance предложил пользователям iPhone бесплатное приложение Dragon Dictation: ваши слова передаются на серверы компании и изучив, превращается в текст в течение нескольких секунд отображаются на экране телефона.

Никто, однако, не знал, что компания собирает эти миллионы образцов, создавая огромную базу голосов людей разного возраста, говорящие с разным акцентом, предназначенной для тестирования алгоритмов распознавания речи.

А так техника развивается. Но на частый вопрос читателей: „Если программы для диктовки уже так хорошо, то могу ли я их использовать для записи телефонных переговоров и интервью?”, ответ, по-прежнему „Нет”. Программы работают правильно, но следует говорить прямо в микрофон, желательно без акцента, а в фоне должен господствовать wzlędna тишина. И еще нужно им диктовать знаки препинания („точка”). А один Бог знает, сколько мы сами, у нас проблем с взаимным пониманием, трудно ожидать, что он справится с этим компьютер. Неудивительно, что современные приложения все еще путают „usmażoną” с „восьмая жена”, „рот лентяйку” с „договоренностями”, или „водки” с „powódką”.

Клавиатуры не исчезают, так что при нашей жизни. От общения компьютеров из Star Trek делят нас еще десятилетия. Конечно, технология распознавания речи с 99,9-процентной точностью правда поражает – но, пока не достигнет 100%, не будет вариантом выбора.

* Статья касается программ для распознавания английского языка. Примеры на английском языке иллюстрируют только то, в чем заключаются ошибки (прим. перев.).