это понятно, continuous speaker-independent open grammar dictation. Тут нужны две модели: первая — марковская модель высказывания, какие слова с какой вероятностью ходят друг за другом. Вторая — фонетическая, которая отображает цепочку услышанных звуковых единиц (бывают разные подходы, в них разные единицы) на словарное слово. С несловарными все гораздо хуже. Если робот Вася знает слово бурбулин, то он его распознает, а вот если его в словаре нет — тогда не знаю даже, как.
no subject