Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

ПО для государственных и частных служб безопасности


Служба Рассылок Subscribe.Ru проекта Citycat.Ru

Программное обеспечение для государственных и частных служб безопасности

Выпуск # 12 от 13.12.00

Автор рассылки Юрий Тарасов

 

Здравствуйте уважаемые подписчики. Доброе всем время суток.

            В статье речь пойдет о системах идентификации личности по голосу. Основные цели  программных пакетов идентификации личности по голосу:

            - использование компьютера для автоматической сегментации речевого сигнала и автоматического измерения параметров;

            - повышение надежности идентификации за счет комплексного анализа речевого сигнала;

-         уменьшение субъективности эксперта и времени проведения экспертизы за счет автоматической обработки информации.

Рассмотрим комплекс программ «Аудио» фирмы «Нелк» и программу VIS созданную к.т.н. Новосельским А.Ф. 

Программа VIS

            VIS создан к.т.н. Новосельским А.Ф.  В VIS применен патент N 26107 Украины "Способ идентификации личности по параметрам устной речи" (А.Ф.Новосельский, Ю.Ф.Жариков, Ю.Ю.Орлов)

         Программа обрабатывает файлы с предварительно оцифрованной речью. Работа с пакетом включает 4 основных этапа:

            1) предварительная обработка записей речи (улучшение качества записей, устранение шумов и помех, отбор речевого материала достаточного количества и качества);

            2) обработка записанных речевых сигналов для измерения параметров речи;

            3) сравнение измеренных параметров речи с использованием меры близости;

            4) принятие решения об идентичности исследуемых записей речи.

              В пакете VIS применено 5 подходов:

            - параметрические статистические критерии (сравнение средних и дисперсий);

            - непараметрический статистический критерий (критерий Вилкоксона);

            - взвешенное эвклидово расстояние;

            - расстояние Махалонобиса;

            - искусственная нейронная сеть (2-слойный персептрон).

Весомость параметров учитывается во взвешенном эвклидовом расстоянии путем применения F-отношения, в расстоянии Махалонобиса - использованием ковариационной матрицы.

            Для учета возможной неидентичности амплитудно-частотных характеристик (АЧХ) трактов записи исследуемой фонограммы и фонограммы с образцами речи оценивается спектр шума в паузах. Полученная оценка спктра шума учитывается при вычислении взвешенного эвклидового расстояния для спектральных отсчетов.

     Эксперименты по идентификации, проведенные с собранной базой данных речевых сигналов, дали 92% правильных решений.

 

 Образец заключения идентификации личности по голосу.

 Идентификационное исследование речи лиц, записанных на фонограммах,

аудитивным анализом и анализом по физическим параметрам речевого сигнала.

 Аудитивный анализ посредством многоразового прослушивания позволяет сказать, что запись голоса, обозначенного как "1-й голос" в протоколе прослушивания звукозаписи компакт-кассеты "...", и запись голоса ... на компакт-кассете "..." принадлежат одному лицу. Про это говорит и близость физических параметров речевого сигнала на исследуемой фонограмме и фонограмме с образцами речи:

            - частота основного тона - ОТ (в звуке "...", слове "...", фразе "...")

нижняя граница                                              ... Гц

верхняя граница                                              ... Гц

            - частота 1-ой форманты (в звуке "..." слова "...")

нижняя граница                                              ... Гц

верхняя граница                                              ... Гц

            - частота 2-ой форманты (в звуке "..." слова "...")

нижняя граница                                              ... Гц

верхняя граница                                              ... Гц

            - частота 3-ой форманты (в звуке "..." слова "...")

нижняя граница                                              ... Гц

верхняя граница                                              ... Гц

Для анализа использовалась программа Signal Viewer (разработка Академии внутренних дел России).

            Для анализа физических параметров речевого сигнала также был использован программный пакет VIS (Voice Identification System, автор к.т.н.Новосельский А.Ф.). VIS в автоматическом режиме сегментирует речевой сигнал на собственно речь и паузы, находит на участках речи вокализованные кадры данных, на которых измеряет 5 групп параметров речи:

- спектральные отсчеты,

            - кепстральные отсчеты,

            - кепстральные коэффициенты,

            - коэффициенты линейного предсказания,

            - группа неоднородных параметров (частоты ОТ, формант, антиформанты, отношение частот 1-ой форманты и ОТ, отношение частот 2-ой и 1-ой форманты, наклон спектра речи к верхним частотам, коэффициент вариации СКЗ сигнала, изменение частоты ОТ и функции артикуляции в сравнении с предыдущим кадром данных).

            Анализ параметров 1-го голоса и голоса ... с использованием программного пакета VIS показал следующее:

1) При сравнении средних значений частоты ОТ, ..., ... выявлено отсутствие существенных расхождений. С доверительной вероятностью 0,999 расхождения можно считать случайными.

2) При сравнении дисперсий частоты ОТ, ..., ... с помощью критерия R Романовского выявлено отсутствие существенных расхождений. С доверительной вероятностью 0,889 расхождения можно считать случайными. Это подтверждает предыдущий пункт.

3) Взвешенное эвклидово расстояние между векторами параметров составляет соответственно для групп параметров

- спектральные отсчеты                                                                      ...;

            - кепстральные отсчеты                                                                      ...;

            - кепстральные коэффициенты                                                         ...;

            - коэффициенты линейного предсказания                         ...;

            - группа неоднородных параметров                                     ...;

            - предыдущие 5 групп (объединенные в один вектор)            ... .

Эти величины МЕНЬШЕ порога 0,6, что позволяет с вероятностью 0,92 говорить об идентичности голосов. Меньше порога и эвклидово расстояние для спектральных отсчетов, вычисленное с учетом спектра шума в паузах (то есть с учетом АЧХ канала записи).

4) Расстояние Махалонобиса между векторами параметров составляет соответственно для групп параметров (в скобках приведены значения порога для данной группы):

            - кепстральные отсчеты                                                                      ...            (1,6);

            - кепстральные коэффициенты                                                         ...            (2,3);

            - коэффициенты линейного предсказания                         ...            (4,4);

            - группа неоднородных параметров                                 ...            (0,5);

            - предыдущие 4 группы (объединенные в один вектор)       ...            (3,9).

Эти величины МЕНЬШЕ порога, что позволяет с вероятностью 0,92 говорить об идентичности голосов.

 5) Параметры 1-го голоса и голоса ... также сравнивались с помощью искусственной нейронной сети (2-слойный персептрон, алгоритм обратного распространения ошибки). Среднее значение выхода составляет соответственно для групп параметров:

            - кепстральные отсчеты                                                                      ...;

            - кепстральные коэффициенты                                                         ...;

            - коэффициенты линейного предсказания                         ...;

            - группа неоднородных параметров                                     ... .

Эти величины БОЛЬШЕ порога 0,5, что позволяет с вероятностью 0,9 говорить об идентичности голосов.

 Вывод: запись голоса, обозначенного как "1-й голос" в протоколе прослушивания звукозаписи компакт-кассеты "...", и запись голоса ... на компакт-кассете "..." принадлежат одному лицу.

Всего доброго!
С уважением     Автор рассылки Юрий Тарасов



http://subscribe.ru/
E-mail: ask@subscribe.ru
Поиск

В избранное