Нижегородский государственный университет им.Н.И.Лобачевского.

ЛАБОРАТОРИЯ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

Факультет вычислительной математики и кибернетики

Лаборатория ITLabИсследованияПроекты 2003-2009 гг.Учебно-исследовательские проектыСинтез речи Switch to English version  
Новости
О Лаборатории
Обучение
Исследования
Проекты 2011 г.
Проекты 2010 г.
Проекты 2003-2009 гг.
Образовательные комплексы
Семинар Лаборатории
Мероприятия
Вакансии Интел
Сотрудничество
Разработчики сайта
О нас пишут
Летняя школа 2011
Видео лекции
Клуб У.М.Н.И.К.
Имя:
Пароль:
запомнить:
Забыли пароль? Регистрация

Text-to-Speech Synthesis

Краткое описание

В рамках данного проекта планируется разработать программу для карманных компьютеров, которая бы могла произносить английский перевод текста, введенного пользователем на русском языке.

Цели проекта

1. Создание модуля, отвечающего за перевод текста с русского языка на английский.

2. Создание модуля, отвечающего за произношение английского текста. 

3. Оптимизация приложения под КПК.

Коллектив

Кураторы:

1. Золотых Николай Юрьевич (ННГУ, куратор проекта).

** Петров Андрей Юрьевич (Intel, куратор проекта).

Исследователи:

1. Камаев Андрей (ITLab, стажер).

2. Николаев Никита (ITLab, стажер).

3. Кручинина Мария (ITLab, стажер)

4. Ткаченко Роман (ITLab, стажер)

5. Миронов Артём (студент)

*6. Субботина Екатерина (ITLab, стажер).

Текущие исследования (октябрь 2006)

Принято решение разработать собственный синтезатор речи.

В качестве реализуемой модели выбран формантный синтез.

Начальный Этап (апрель-июнь 2006)

В данный момент ведутся исследования по произнесению английского текста.

1. Перенесена существующая программа eSpeak из-под операционной системы Linux под ОС Windows и WindowsCE.

Для генерации речи eSpeak использует синусоидальную модель. Для произнесения гласных звуков складываются гармоники с различными амплитудами. Такие согласные, как [s] и [t], просто воспроизводятся из wav-файлов. Для произнесения таких согласных, как [z], используются оба подхода.

Пример работы программы

2. Разработан пользовательский интерфейс для WindowsCE, позволяющий:

  1. произносить текст, введенный пользователем в поле ввода, или текст из существующего файла
  2. записывать произнесенный текст в wav-файл
  3. выбирать мужской или женский голос
  4. выбирать диалекты произношения
  5. регулировать громкость и темп речи

Скачать последнюю версию программы для Windows CE:

ScreenShort1                    ScreenShort2

Программное обеспечение

1. Microsoft Visual Studio 6.0

2.eMbedded Visual C++ 4.0

Новости

14.11.2015
16.10.2015
16.10.2015
14.10.2015
20.09.2015

© ITLab, Нижний Новгород,  2009