ПРИНЦИПЫ АКУСТИКО-ФОНЕТИЧЕСКОЙ ТРАНСКРИПЦИИ
ЗВУЧАЩИХ ТЕКСТОВ

Одной из первостепенных задач функционального моделирования процессов восприятия речи человеком является выработка алгоритмов преобразования непрерывного речевого акустического сигнала в линейную последовательность лексических единиц. Для этого, прежде всего, надо хорошо представлять себе, с каким именно сигналом имеет дело каждый носитель языка, что именно поступает на вход системы восприятия речи. И в первую очередь - в процессе естественного речевого общения, т.е. необходимо знать, что собой представляет спонтанная речь в ее акустическом проявлении.

Исходя из этого фонетическая транскрипция звучащих текстов, представленная на этом сайте, производилась с максимальной опорой на акустические параметры речевого сигнала при максимально возможом снятии влияния лексико-грамматических знаний оператора, производящего транскрипцию.

Поскольку в дальнейшем результаты подобной разметки текстов предполагается обрабатывать с использованием компьютеров, для описания сегментов не используются символы, требующие специальных наборов шрифтов. Вместо этого принята система, аналогичная набору SAMPA, используемому для отображения символов международной фонетической транскрипции в системе ANSII.

В результате получились следующие наборы символов:

ГласныеСимволы (латиница)
Между твердымиПосле или между мягкого(ими)Перед мягким
aa a:aI
oo o:oI
эe e:eI
иi ii
ыQ -Q
уu u:uI
шва@ @@I

Излишне долго произнесенные гласные дополнительно маркируются символом «#».

В основном для маркирования согласных используется их латинская транслитерация, а кроме того:


СогласныеСимволы (латиница)
ГлухиеЗвонкие и озвонченные
ж- Z
цc D
хx h
чC G
шS -
щ$ Z'

Мягкость согласных маркируется символом «'» после согласного.

Помимо этого при разметке текстов используются следующие маркеры: «нрзб» - для неразборчиво произнесенных слов или фраз; «ансмбл» - для одновременной речи нескольких дикторов; «pause» - глухие паузы; «inh» - вдохи; «gst» - гортанная смычка или участки ларингализации; «pXX» - краткие паузы (ХХ - длительность в мс).

В орфографической записи звучащих текстов по аналогии с Корпусом русского литературного языка используются "составные" слова (то=есть, потому=что и т.п), которые в фонетической трансрипции будут представлены единой "словоформой". Помимо этого, при фонетическом транскрибировании дополнительно возникают "составные" словоформы при наличии стяжения гласных или согласных на стыке соседних словоформ (если_они[je:sl'a:n'i]), а также при реализации фонетических слов типа "вначале в_начале", "заработай за_работой", "должно=быть должно_быть" и т.п. Следует учитывать это обстоятельство при формировании запроса.

Все результаты поиска выдаются на одну страницу и могут быть сохранены либо как web-страница, либо скопированы через буфер обмена. В конце каждой строки протокола даются координаты (в миллисекундах) соответствующего отрезка речевого сигнала в звуковом файле.

 
E-mail Home