Речевые технологии. Голосовая биометрия для чайников на примере работы в контактном центре. Как определить тип голоса и какие виды существуют

Ребята, мы вкладываем душу в сайт. Cпасибо за то,
что открываете эту красоту. Спасибо за вдохновение и мурашки.
Присоединяйтесь к нам в Facebook и ВКонтакте

Не только внешность рисует образ человека, но и его голос. Ведь то, как мы говорим, зависит от особенностей нашей психики и, конечно, от настроения.

сайт решил узнать, как манера говорить отражает особенности нашей личности и соотносится с тем, как нас воспринимают.

Иногда всем нам встречаются любители посюсюкать, у которых голос словно из мультика. Тому, кто так разговаривает, это может казаться милым, но у других такая манера речи ассоциируется с двуличностью, желанием всем нравиться и даже пассивной агрессией. И еще кажется, что человеку от вас что-то нужно.

Такая манера речи вызывает сильный дискомфорт у слушателя, поэтому тот норовит побыстрее закончить разговор.

Часто стальной голос бывает у людей, чья профессия связана с командованием людьми (учителей, крупных начальников и военных), так что они просто привыкли так разговаривать . Также он встречается у тех, кто по жизни любит отдавать приказы и не терпит возражений.

Обычно у людей есть несколько причин тихо разговаривать:

Они не уверены в себе и неуютно чувствуют себя в компании.
В детстве родители постоянно шикали на них: «Веди себя потише!» У них сформировалась установка, что если они будут говорить громко, они кому-то помешают, покажутся навязчивыми.
Они устали от жизни, им не хватает энергии, они не хотят активных действий.

Может показаться, что на повышенных тонах разговаривают те, кто уверен в себе. На это и рассчитывают такие люди - часто они скрывают таким образом свою неуверенность, страх быть непонятыми и неуслышанными. Они хотят привлечь к себе внимание и добавить весомости.

Причин медленной речи собеседника может быть несколько:

Человек привык взвешивать каждое слово, чтобы не наделать ошибок. Он, как правило, немного медлителен, зато серьезен и обстоятелен.
Он высокомерен и хочет привлечь внимание к своей речи. Его совершенно не волнует, что у собеседника уже слипаются глаза.
В некоторых случаях медленная речь свидетельствует об угнетенном состоянии, унынии, горе или усталости.

Скорее всего, любитель быстро говорить по темпераменту напорист - холерик или сангвиник, он на все реагирует быстро.

Или дело может быть в том, что человек не уверен в себе и думает, что другим неинтересно его слушать. И он старается закончить мысль быстрее.
Как и в случае с громкоговорящими людьми, есть мнение, что любители потараторить росли в больших семьях и старались высказать свою мысль целиком до того, как их прервет кто-то из братьев и сестер.
Ну или человек на что-то сердится, испытывает стресс.

Мужчины, говорящие басом, нравятся дамам, да и женщины с низким голосом считаются весьма притягательными. Обычно мы называем такие голоса «бархатными» или «объемными» - они действительно приятны на слух и ассоциируются со зрелостью, авторитетом и стабильностью.

Когда вам кажется, что человек пытается соблазнить вас своим голосом, вероятно, так оно и есть. Но чтобы это понять, важно оценивать голос вкупе с языком тела. Они исполняют по жизни роль ведомых, но одновременно с этим не прочь поманипулировать другими людьми.

К примеру, древнегреческий оратор Демосфен имел слабый голос и говорил крайне невнятно. Его попытки выступать перед публикой заканчивались крахом - его речи вызывали только смех.

Но Демосфен занялся исправлением недостатков своей речи. В конце концов он стал блестящим оратором и политиком, вошедшим в историю.

Благодаря ему мы говорим, выражаем эмоции, показываем любовь или ненависть, управляем и даже манипулируем людьми. Голос влияет на все сферы нашей жизни. Ваш успех часто определяется только качеством голоса.

Высокий голос - низкие должности?

Безусловно, высокий голос чаще всего раздражает слушателей. Этот дискомфорт связан с тем фактом, что пронзительные звуки вызывают обеспокоенность. Поэтому очень высокий голос, который время от времени переходит на визг, часто мешает его обладателю наладить отношения с людьми, так как он отвлекает и очень раздражает барабанные перепонки.

Низкий голос и сексуальная привлекательность

Обладатели низких тембров - часто самоуверенные и самодостаточные интеллектуалы. Этот факт базируется на физиологических характеристиках организма и на том, как мы их воспринимаем. Американский психолог Сюзан Хагис считает, что низкий голос характерен для мужчин и женщин, которые обладают традиционной гетеросексуальной привлекательностью, то есть такие женщины имеют средние плечи, среднюю или большую грудь, узкую талию и бедра, объем которых гармонирует с шириной плеч, а мужчины - широкие плечи и узкие бедра. Считается, что эти признаки говорят о физическом здоровье и зрелости, а потому такой человек считается самостоятельным и способным принимать важные решения.

Состоятельным - бархатный голос, начальникам - громкий

Люди, которые постоянно командуют и отчитывают других, не сомневаясь в собственной правоте, как правило очень громкие не только на работе, но и дома. Они или не умеют владеть собой, или им недостает самокритичности. Сдержанный и скромный человек говорит тихо и вкрадчиво. Если к тихому голосу прибавляется робость или просительная интонация, то перед вами неуверенный в себе человек. Постоянные перепады голоса говорят о повышенной эмоциональности или о волнении.

Быстрая речь - насыщенная жизнь

Скорость речи соотносится с темпераментом человека и ритмом его жизни. Спокойные, люди, не склонные к риску и резким перепадам настроения, говорят медленно и не спеша. Холерики зачастую излишне эмоциональные и громкие, они говорят очень быстро и часто жестикулируют.

Немаловажной является также дикция. Чем четче говорит человек, тем определеннее его жизненная позиция, тем проще и яснее его взгляд на мир.

Не забывайте также про собственную речь. Хотя бы в целях маскировки (например, в волнительных ситуациях) старайтесь говорить четко и разборчиво, чтобы никто не заподозрил вас в неуверенности. Хорошая дикция и достаточно громкий голос сразу покажут людям, кто вы есть на самом деле.

Обратите также внимание на использование в обыденной речи редких слов и оборотов. Человек, который говорит так, как никто из окружающих, часто цитируя известных авторов и приукрашая речь разнообразными эпитетами и метафорами, явно стремится выделиться и подчеркнуть свою исключительность.

Читайте також:

Каждая девушка мечтает о том, чтобы иметь шикарную копну длинных волос. Ради такого результата представительницы прекрасного пола готовы тратить уйму денег и мучиться с народными средствами и «яичными» масками. Но, чаще всего невозможность отрастить густую шевелюру кроется в неправильном уходе за волосами. В нашем материале мы поговорим о том, как правильно мыть, расчесывать и су...

Пришла весна, а значит мужчинам следует искать подарки к Международному женскому дню. 8 марта не может пройти без обязательного подарка для жены, дочери, матери или бабушки. На это проявление внимания все ожидают, даже если не говорят об этом вслух. Поэтому вот несколько советов для тех, кто не знает, что приобрести. Презент жене Любимая женщина заслуживает лишь лучший подарок, поэтому к его выб...

Школьная обувь для мальчика: советы по выбору для родителей, которые ценят качество Новый учебный год близко. У мам школьников появляются особые хлопоты - подготовить ребенка к 1 сентября. Родители, которые ценят качество, понимают всю серьезность проблемы. С одеждой как-то легче, а вот подбор школьной обуви https://kidbutik.ua/detskaya-obuv/shkolnaya-obuv/ - та еще задача. Предлагаем...

"В одной из радиопередач услышала, что появились специалисты, которые по голосу могут не только определить характер человека по голосу, интеллект, диагностировать различные болезни, но даже предсказать судьбу человека. Если это правда, подскажите, как попасть к ним на прием?"

К. Лямина, Смоленск

Насчет судьбы, конечно, преувеличение, художественный вымысел, - улыбается профессор Владимир Петрович МОРОЗОВ, заведующий лабораторией невербальной коммуникации Института психологии Российской академии наук, - а что касается всего остального - чистая правда. Сам голос независимо от того, какие слова произносятся, несет колоссальный объем информации, можно определить характер человека по голосу и многое многое.

Согласитесь, ни для кого не составит труда угадать, кто говорит по телефону: мужчина, женщина или ребенок, но далеко не каждый сумеет определить физические данные говорящего: высокий человек или низкий, худой или толстый, молодой или не очень... Эксперты нашей лаборатории практически безошибочно определяют по голосу пол, рост, вес и возраст. Причем обмануть их трудно даже тогда, когда кто-то достаточно искусно имитирует детский голосок (помните, как великолепно это делала Рина Зеленая?) или мужчина начинает говорить тонким женским голосом.

- Интересно, как им это удается? Ну мужчина или женщина - это понятно, но где в звуке "спрятаны" рост и вес?

Дело в том, что голос напрямую связан с анатомией и физиологией: он зависит от строения тела в общем и органов голосообразования в частности. Напомню, что звуки рождаются при колебаниях голосовых складок, которые подобно струнам натянуты в гортани. Они могут совершать от 80 до 10 000 и более колебаний в секунду, причем колебаться как всей своей массой, так и отдельными участками. Установлено, что под влиянием нервных импульсов, поступающих из центральной нервной системы, голосовые складки изменяют свою длину, толщину, степень напряжения. Сокращение их различных участков и обусловливает всю богатейшую гамму звуков, подобно тому как нажатие пальцами на гитарные струны в разных местах дает различное звучание.

Высота голоса зависит от длины складок, а сама длина их и толщина - от строения гортани: чем она больше, тем длиннее и толще складки, тем ниже голос, и обладатель этого голоса, следовательно, выше, потому что большая гортань - преимущество высоких людей.

Бывают, правда, исключения из правил: природа награждает низкорослого человека большой гортанью или мощными резонаторами. Ведь тембр голоса, его сила, окраска зависят не только от длины и толщины складок, но и от строения резонаторов. Знаете, почему великий Карузо пел тенором, хотя имел басовые голосовые складки? Резонаторы "размером не вышли".

Глотка, носоглотка, рот, полость носа и его придаточных пазух - это верхние резонаторы, а трахея, бронхи и легкие - нижние. У каждого человека эти органы имеют индивидуальные особенности, поэтому и голоса так несхожи между собой. Голос приобретает индивидуальную окраску в момент, когда младенец первым криком заявляет о своем явлении в мир. Родился обладатель уникального голоса! Не важно, что он никогда не будет певцом, голос его неповторим, он единственный.

- А как же искусные имитаторы? Скажем, всеми любимый Винокур или те же "Куклы". Для нас, телезрителей, голоса звучат "один к одному".

Для вас - может быть, но не для эксперта, который, применяя современные методы и аппаратуру, любой голос способен разложить, что называется, по полочкам, то есть по тембровым, ритмическим, частотно-амплитудным, интонационным параметрам. Подобно тому, как графологическая экспертиза выявляет искуснейшую подделку почерка, так и наши методы позволяют распознавать имитацию чужого голоса. Можно скопировать интонации, некоторые особенности произношения, но стопроцентно подделать голос практически невозможно. Не случайно на этой основе развивается целое научное направление в криминалистике. Это свойство голоса нашло применение и в... бизнесе. В крупнейших банках мира многие сейфы запрограммированы не только на парольную фразу, но и на голос владельца. Стоит, скажем, какому-то обертону отклониться в сторону - и сейф не отзовется, сколько бы к нему ни взывали " Сезам, откройся!".

- Итак, вы меня убедили, что с помощью голоса можно идентифицировать личность и даже нарисовать ее, этой личности, портрет: высокий-низкий, худой-толстый, молодой-старый...

Добрый-злой, открытый-замкнутый, скромный-заносчивый, - продолжает Владимир Петрович. - Не только физиологический, но и более важный для нас психологический портрет. Если человек говорит быстро, четко, напористо, завершая мысль, он энергичен, реактивен, из тех, кто сначала делает, а потом думает.

А вот если говорит медленно, как бы взвешивая каждое слово, - нетороплив, обстоятелен, анализирует ситуацию, любит семь раз отмерить, прежде чем отрезать. Человек, произносящий слова скороговоркой, глотающий окончания, не связывающий фразы логически, по характеру, интеллекту и по жизни такой, как его речь. Если только это не речевая "маска", специально выработанная манера, как у Талейрана, например. Этот умнейший дипломат и политик специально говорил невнятно, что-то бормотал себе под нос, зато потом всегда мог отказаться от своих слов и сказать, что его просто неправильно поняли.

Уже говорилось, что голос связан с анатомией и физиологией, поэтому практически любое заболевание так или иначе влияет на звучание голоса. В первую очередь, естественно, на нем отражается состояние голосового и артикуляционного аппаратов и резонаторов. Мы знаем, как неузнаваемо он меняется при различных ОРВИ, бронхитах, тонзиллитах, синуситах... Но вот, казалось бы, с голосовым аппаратом все в порядке: нет воспаления, каких-либо анатомических изменений, а голос все слабеет и слабеет - развивается фоностения. Причина этого недомогания кроется в глубоких отделах центральной нервной системы, там, где расположены центры, ответственные за деятельность голосового аппарата, воспроизведение и восприятие речи.

Сложная электроакустическая обработка голоса, произносящего фразы, выражающие разные эмоции - радость, горе, гнев, страх, показала, что каждое состояние имеет свой набор отличительных акустических признаков. Например, для горя - это наибольшая длительность слога, характерные "подъемы" и "съезды" в высоте звуков, для страха отличительными оказались резкие перепады силы голоса, нарушение темпоритма, увеличение пауз...

- Мне кажется, что и без электроакустической обработки каждый из нас способен определить эмоциональное состояние собеседника и его отношение. Бывает, тебе любезно говорят: "Как я рад вас видеть!", а слышится: "Ну какого... тебя принесло!" Фальшивая интонация, как и улыбка, читается без труда.

Вы правы. Мозговые центры, ответственные за восприятие эмоциональной окраски речи, звуков, начинают работать чуть ли не с момента рождения. Двухнедельный малыш безошибочно реагирует на эмоциональную окраску обращенной к нему речи, хотя слова, их значение он начнет понимать гораздо позже, когда в левом логическом полушарии "дозреют" речевые центры.

Но знаете, что показали недавно проведенные нами исследования? Наблюдается тотальное "притупление" эмоционального слуха, причем уже на уровне дошкольного, школьного возраста.

- Владимир Петрович, нельзя ли поучаствовать в вашем эксперименте и проверить эмоциональный слух?

Конечно, можно. Я дам вам прослушать одну и ту же фразу, произнесенную с разной интонацией замечательным актером Олегом Валериановичем Басилашвили, а вы будете ставить галочки в графах "гнев", "страх", "удивление", "радость", "норма". Слушайте внимательно...

А теперь подсчитаем галочки. По результатам тестирования вы набрали 75%. Совсем неплохо. Этот и другие тесты предлагаются абитуриентам, поступающим в театральные вузы, консерваторию, будущим дикторам радио и телевидения. Мы же предлагали их не только "лирикам", но и "физикам". Результаты не были неожиданными: у людей художественных и гуманитарных профессий эмоциональный слух оказался лучше, чем, скажем, у программистов ЭВМ и математиков, инженеров. У большинства женщин с эмоциональным слухом все в порядке, в среднем он на 10-15% лучше, чем у мужчин. Огорчили дети - подрастающее, так сказать, поколение. Более чем у половины участвовавших в эксперименте (а это были ученики обычных средних московских школ) эмоциональный слух понижен, искажен. Представьте, более 60% оценили гневные и угрожающие интонации как нейтральные, записали их в графу "норма". Это говорит о глубоком перерождении нашей психики: агрессия в сознании многих вытолкнула норму и заняла ее место. Повсюду начинает доминировать агрессивно-оборонительный стиль отношений. С малых лет дети привыкают либо нападать, либо обороняться. Это становится нормой.

- А не проводились ли подобные исследования среди политиков, чиновников, наделенных властью? Интересно, как у них с эмоциональным слухом.

Политиков пока не удалось охватить, а вот психологические портреты "новых русских" мы попытались нарисовать. Только у небольшого числа обследуемых такие необходимые качества, как высокий интеллект, компетентность, чувство собственного достоинства, уважительное отношение к партнерам и сослуживцам, проявились в достаточной мере. Психологические же портреты подавляющего большинства оставляют желать лучшего. Работать над ними и работать!

- Скажите, у вас есть рецепт, как это сделать?

При Институте психологии РАН открывается центр, где каждый желающий может узнать, как его воспринимают, как он выглядит в чужих глазах, и получить ряд практических советов, как улучшить свой психологический портрет и, следовательно, увеличить свое влияние на окружающих. Ведь имидж - это не только модный макияж и костюм от престижного портного, но и ваш голос, манера говорить, общаться. Помните, с чего начал профессор Хиггинс, когда задумал из грязной уличной цветочницы сделать даму высшего света? Не потребовалось ни пластических операций, ни прочих, сложных ухищрений - девушку просто научили ГОВОРИТЬ.

Беседовала О. ЗЕДАЙН

Голос - ваша визитная карточка. Сейчас для многих - политиков, бизнесменов, банкиров, менеджеров и прочих - он становится важнейшим инструментом работы. Так постарайтесь, чтобы никто не мог сказать: "Лучше бы он рта не открывал".

Для тех, кто приехать в институт не может, даем несколько практических советов. Звонкость, полетность голос приобретает за счет верхних резонаторов. Максимально использовать их возможности и исправить глухое звучание голоса помогут следующие упражнения:

1. Стоя или сидя сделайте короткий вдох через нос. Выдыхая, с закрытым ртом без напряжения произносите с вопросительной интонацией "м" или "н". Старайтесь ощутить вибрацию в области носа и верхней губы.

2. Глубоко вдохните. Выдыхая, произносите одно из следующих слов: "бимм", "бонн", "донн". Протяжно произнося последнюю согласную, добивайтесь ощущения вибрации в области носа и верхней губы.

3. Глубоко вдохните. Выдыхая, протяжно произнесите слоги "мимм", "момм", "мамм", "нинн", "нанн", "нунн" и т. д.

4. Глубоко вдохните. На одном выдохе сначала произнесите коротко, а затем протяжно один из открытых слогов: мо-моо, ми-мии, му-муу, ни-нии, но-ноо и т. д.

Выполняя упражнения для нижних резонаторов, старайтесь произносить гласные "о" и "у" как можно более низким голосом и протяжно, добиваясь ясно выраженного резонирования в области грудной клетки.

1. Стоя, положите руку на грудь. Зевните с закрытым ртом и зафиксируйте гортань в нижнем положении. на выдохе произнесите звук "о" или "у", стараясь почувствовать вибрационные движения грудной клетки. Если этого не получается, искусственно вызовите вибрацию легким постукиванием рукой в области грудины.

2. Стоя, положите руки на грудь. Наклоняясь вперед, на выдохе произнесите гласные "о", "у" длительно и протяжно.

Выполняя то же движение, на выдохе произносите слова: "око", "окно", "олово", "молоко", "мука". В голосообразовании принимает участие и артикуляционный аппарат - губы, язык, мягкое небо, нижняя челюсть. От того, насколько четко, быстро и согласованно он работает, зависят хорошая дикция и звучность голоса.

Занимаясь перед зеркалом, следите за тем, чтобы в упражнении принимали участие только органы артикуляции, а нос, лоб и глаза оставались неподвижными. Каждое упражнение делайте медленно, плавно.

1. На счет "раз" опустите нижнюю челюсть примерно на два пальца. На счет "два-шесть" удерживайте это положение. Медленно закройте рот.

2. Опустите нижнюю челюсть и медленно двигайте ею вправо и влево.

3. Опустите нижнюю челюсть, медленно выдвигайте ее вперед и возвращайте в исходное положение.

4. Рот закрыт, губы сомкнуты. На счет "раз" растяните губы в стороны, обнажая зубы и как бы произнося звук "иии". На счет "два-три" удерживайте губы в этом положении. На счет "четыре-пять" вытяните губы трубочкой вперед. На счет "шесть-семь" растяните губы в стороны.

Tutorial

Всем привет.
Недавно я написал вот такую про распознавание слитной речи, а сейчас хотел бы написать про голосовую биометрию, т.е. подтверждение личности человека по голосу и узнавание человека по голосу.

Опять же, т.к. моя работа связана с контактными центрами (КЦ), то говорить я буду о них. Это еще связано с тем, что сейчас именно они активно интересуются голосовой биометрией, что не удивительно, т.к. телефонный канал – это идеальное ее применение.
- вы не видите абонента на другом конце провода;
- вы не можете использовать другие модальности для подтверждения личности: по лицу, по сетчатке глаза, по отпечатку пальца.
- не нужны дополнительные сканирующие устройства, типа тех, куда надо приложить свой палец или кому показать свой глаз.
- это самый дешевый способ биометрии, хоть и слегка уступает по надежности другим способам. Но так как другие модальности технически не применимы по телефону в массовом использовании, то выбора по факту нет.
Вы, конечно, можете возразить про вариант подтверждения личности абонента «основанном на знаниях» - это пароли, секретные слова, TPIN коды (банки), паспортные данные и т.д. – но все это не надежно с точки зрения безопасности и требует запоминания информации у абонента или всегда держать информацию под рукой, что не очень удобно для абонента и не эффективно (затратно) для КЦ.

Для начала определимся с понятиями, что входит в понятие голосовой биометрии:
- Это идентификация , т.е. установление личности человека по голосу. Это когда вам звонит старый приятель по телефону с неизвестного номера и говорит: «Угадай кто это?» и вы пытаетесь в голове среди всех известных (знакомых) голосов найти наилучшее совпадение. Когда сканирование памяти закончилось и вы нашли более менее подходящее совпадение, то вы можете уже сказать: «Ага, это мой одноклассник Серега с которым я не говорил 10 лет». Но гарантии в том, что это именно он, у вас нет, и тут приходит время верификации.
- Верификация – это подтверждение личности по голосу, т.е. однозначное удостоверение личности. Для этого мы можем попросить доказать, что Серега именно тот, за кого себя выдает. Мы можем спросить у него: «Скажи, где мы были в 6 утра на выпускном» - эта информация позволит нам подтвердить личность Сереги, т.к. только он может являться носителем этой информации (аналогично паролю о котором я писал выше).

Если хотите более умное определение, то:
Идентификация - Проверяет совпадение одного образца голоса со многими из базы голосов. В качестве результата идентификации система показывает список личностей с похожими голосами в процентном отношении. 100% совпадение означает, что образец голоса полностью совпадает с голосом из базы данных и личность установлена достоверно.
Верификация - Производит сличение двух образцов голоса: голос человека, чью личность необходимо подтвердить, с голосом, который храниться в базе данных системы и чья личность уже достоверно установлена. В качестве результата верификации система показывает степень совпадения одного голоса с другим в процентном отношении.
Есть еще такое понятие как аутентификация . Однозначно сказать, чем она отличается от верификации сказать трудно. У некоторых наших сотрудников есть мнение, что это некий процесс подтверждения биологической (!) личности, когда трудно отделить процесс идентификации от верификации, т.е. это обобщенный процесс.

Какая бывает верификация?

- Текстонезависимая
Когда подтверждение личности происходит по спонтанной речи абонента, т.е. нам не важно, что говорит человек. Это самый долгий метод подтверждения – чистой речи абонента должно накопиться минимум 6-8 сек. Обычно этот способ применяется непосредственно во время общения абонента с оператором КЦ, когда последнему нужно однозначно удостовериться, что абонент именно тот, за кого себя выдает. Самое интересное, что данный способ верификации можно применять скрытно от самого абонента. На рабочем месте оператора КЦ виден вот такой рабочий инструмент.

Рис 1. Часть интерфейса рабочего места оператора КЦ для проведения верификации клиента.

- Текстозависимая по статической парольной фразе
Когда подтверждение личности происходит по парольной фразе, которую на момент регистрации придумал абонент. Длительность парольной фразы должна быть не менее 3 сек. Обычно мы предлагаем говорить свое ФИО и название компании. Парольная фраза всегда одинаковая.
- Текстозависимая по динамической парольной фразе
Когда подтверждение личности происходит по парольной фразе, которую предлагает сама система в момент звонка для верификации, т.е. каждый раз парольная фраза разная! Обычно мы предлагаем динамическую парольную фразу из последовательности цифр. Абонент повторяет за системой числа до тех пор, пока она не примет однозначного решения «свой/чужой». Это может быть и одно число типа «32» или целый набор «32 58 64 25». Интересно то, то произнесение разных цифр дает разный объем информации для сличения: самая «полезная» цифра «восемь» – она больше всего содержит полезной речевой информации, самая бесполезная «два».

Шаг 1.
Что бы мы могли провести верификацию по голосу, нам нужно в своей базе уже иметь образец голоса (слепок голоса), хозяин которого достоверно известен. Поэтому первый шаг – это накопление базы слепками голосов, для этого мы просим абонентов (клиентов) пройти процесс регистрации в системе.
Регистрация в системе абонента означает, что он добровольно оставляет свой слепок голоса, который потом мы будем использовать для верификации. Обычно мы просим оставить подряд 3 слепка голоса, что бы была вариативность – три раза произнести свой пароль. Затем, когда верификация будет успешно пройдена, мы заменим наиболее старый слепок голоса новым, таким образом, происходит постоянное обновление слепков, если абонент часто пользуется системой. Так мы решаем проблему старения голоса.
Если мы применяем верификацию по динамической парольной фразе, то мы просим произнести абонента цифры от 0 до 9 три раза. В результате у нас будет 30 образцов голоса.

Желательно, что бы клиент оставлял свой слепок голоса (регистрировался) по тому каналу связи, по которому потом будет верифицироваться, иначе вероятность ошибок возрастает. Бывают случаи, когда проходят регистрацию с гарнитуры в скайпе, а потом верифицируются по домашнему телефону – здесь фактор канала связи будет играть большую роль в надежности сервиса. При построении сервиса можно учитывать, что каналы связи могут быть разные - это отрабатывается и тестируется отдельно под конкретный случай и нивелировать влияния канала связи можно практически полностью. Но не подумав об этом сразу и с наскока внедрить - будут сложности.

Важно, что бы клиент самостоятельно и осознано прошел регистрацию (знал зачем это нужно и как это ему потом поможет), т.к. пройти потом верификацию может только лояльный абонент, которому нужен результат и который принимает «правила игры».
Если клиента вынуждать проходить верификацию к месту и не к месту, то он может подсознательно изменять голос, дурачиться (быть не дружелюбным к сервису) - это будет приводить к ошибкам и лояльность клиента будет падать, хотя он сам в этом косвенно будет виноват.

Как проходит регистрация абонента в системе? (статическая парольная фраза)

Рис 2. Схема регистрации человека в биометрической системе.

1.Абонент звонит в биометрическую систему, которая предлагает ему придумать и произнести парольную фразу. Произнести 3 раза.
2.Голос обрабатывается сервером биометрии и на выход мы получаем 3 модели голоса. По одной на каждый произнесенный пароль.
3.На сервере мы заводим карточку клиента (Юрий Гагарин) к которой прицепляем полученные 3 модели голоса.

Что такое модель голоса?
- это уникальные характеристики голоса человека отраженные в матрице цифр, т.е. это файл размером 18Кбайт (для статической п.ф.). Это как отпечаток пальца. Именно эти модели голоса мы потом и сравниваем. В общей сложности модель голоса фиксирует 74 (!) разных параметра голоса.

Как получают модели голоса?
Мы используем 4 независимых метода:
- анализ статистики основного тона;
- метод смеси гауссовых распределений и SVM;
- спектрально-формантный;
- метод полной изменчивости.
Описывать их подробно я здесь не возьмусь – это сложно даже для меня и в курс «для чайников» точно не входит. Этому всему мы учим на нашей кафедре РИС в ИТМО (Санкт-Петербург).

Шаг 2.
Это непосредственно сама верификация. То есть у нас есть абонент на том конце провода, который утверждает, что он Юрий Гагарин. А у нас в базе, соответственно, есть карточка клиента Юрия Гагарина, где хранятся слепки его голоса, поэтому, все, что нам нужно сделать – это сравнить голос человека, который утверждает, что он Юрий Гагарин с голосом настоящего Юрия Гагарина.

Как проходит верификация абонента в системе? (статическая парольная фраза)

Рис 3. Схема верификации человека в биометрической системе.

1.Сначала мы поступаем как при регистрации, т.е. у нас есть произнесенный клиентом пароль, который мы отправляем в сервер биометрии и строим модель голоса «якобы» Юрия Гагарина.
2.Затем мы берем 3 модели голоса настоящего Юрия Гагарина, делаем хитрым способом усредненную модель и тоже отправляем ее в сервер биометрии.
3.Просто сравниваем 2 разные модели. На выходе мы получаем процент соответствия одной модели к другой.
4.Дальше нам нужно что-то делать с этим числом (на рисунке 92%). Много это или мало, можем мы однозначно сказать, что это Юрий Гагарин или это обманщик?

Рис 4. Порог доверия «свой/чужой».

В системе у нас есть такой параметр как «порог доверия» - это некий процент соответствия. Допустим, мы его сами задали в 60%. Таким образом, если процент соответствия модели голоса «якобы» Юрия Гагарина не доходит до «порога доверия», то нам позвонил обманщик. Если больше «порога доверия», то нам позвонил настоящий Юрий Гагарин. «Порог доверия» мы можем задавать сами, обычно это от 50 до 70% в зависимости от задачи верификации.

Здесь мне нужно было бы вам рассказать про ошибки первого (FR) и второго рода (FA), а также обобщенной ошибки (EER), но я это делать не буду – это сильно усложнит и увеличит текст. Если интересно, то я попробую уговорить, кого ни будь из научного отдела это популярно описать и размещу здесь отдельно.

Скажу просто, что в зависимости от задачи верификации, нам бывает полезней с большей долей вероятности пропустить «своего», чем не пропустить «чужого». И наоборот, иногда бывает важнее не пропустить «чужого», чем пропустить «своего».
Уверен, что с первого раза эти 2 предложения из вас никто не понял, и вам пришлось еще раз вдумчиво их прочитать, что бы осознать смысл.

Интеграция сервера биометрии в контактный центр.

Рис 5. Блок-схема продукта VoiceKey.

Честно говоря, здесь все очень просто: на вход мы подаем голос в формате wave или PCM по http, на выходе получаем результат сравнения. Больше подробнее на этом останавливаться не хочу.

Процесс верификации занимает в среднем 0.8 сек. Есть возможность работать одновременно со многими потоками.

Каждый голос уникален и неповторим по своему звучанию. Благодаря этим особенностям, мы можем легко узнавать голоса своих знакомых даже по телефону. Певческие голоса отличаются не только по тембру, но и по высоте раскрытия голоса, диапазону, индивидуальной окраске. И в этой статье вы узнаете, как правильно определить тип голоса ребёнка или взрослого человека. А также, как определить свой удобный диапазон.

Певческие голоса всегда подходят под одну из вокальных характеристик, которые придумали в итальянской оперной школе. Их сравнивали по звучанию с музыкальными инструментами струнного квартета. Как правило, звучание скрипки сравнивали с женским голосом сопрано, альта – с меццо. Самые низкие голоса – контральто – сравнивали со звучанием валторны (как и тембр тенора), а низкие басовые тембры – с контрабасом.

Так появилась классификация голосов, близкая к хоровой. В отличие от , в котором пели только мужчины, оперная школа Италии расширила возможности пения и позволила создать классификацию женских и мужских голосов. Ведь в церковном хоре женские партии исполняли дисканты (сопрано) или тенора-альтино. Эта характеристика голосов сохранилась и сегодня не только в оперном, но и в эстрадном пении, правда, в эстраде подача звука другая. Некоторые критерии:

4 критерия определения голоса

В профессиональном пении есть свои критерии определения. Во время прослушивания преподаватель обращает внимание на:

Тембр голоса . Так называют неповторимую окраску голоса, которая может быть светлой и тёмной, насыщенной и мягкой, лирической нежной. Тембр складывается из индивидуальной окраски голоса, которая есть у каждого человека. У одного голос звучит мягко, тонко, даже немного по-детски, у другого уже в ранние годы имеет насыщенную грудную окраску. Различают тембр головной, грудной и смешанный, мягкий и резкий. Он является основной характеристикой окраски. Есть голоса, резкий тембр которых звучит очень отталкивающе и неприятно до такой степени, что им не рекомендуется заниматься вокалом. Тембр, как и диапазон, является отличительной особенностью певца, а голос выдающихся певцов и певиц отличается яркой индивидуальностью и узнаваемостью. В вокале цениться мягкий, красивый и приятный для слуха тембр.
Диапазон. Каждый тип голоса имеет не только своё характерное звучание, но и диапазон. Его можно определить во время распевания или, попросив человека спеть песню в удобной для него тональности. Обычно певческие голоса имеют определённый диапазон, который позволяет безошибочно определить его тип. Различают рабочий и нерабочий диапазон голоса. Профессиональные певцы имеют широкий рабочий диапазон, который позволяет им не только замещать коллег с другими голосами, но и красиво исполнять оперные арии для других партий.
Тональность . Любой голос имеет свою тональность, в которой исполнителю удобно петь. Она будет разной у каждого типа.
Тесситура. Так называется определённый участок диапазона, в котором исполнителю удобно петь. Для каждого голоса он свой. Чем шире этот участок, тем лучше. Часто говорят о том, что есть удобная и неудобная тесситура для голоса или исполнителя. Это значит, что, песня или партия в хоре может быть удобной для пения одним исполнителем и неудобной для другого, хотя диапазоны у них могут быть одинаковыми. Так можно определить и особенности голоса.

Как правильно определить тип голоса у детей

Детские голоса ещё не имеют сформированного тембра, но уже в это время можно определить их тип во взрослом возрасте. Обычно их делят на высокие и низкие, как у мальчиков, так и у девочек. В хоре их называют сопрано и альт или дискант и бас. В смешанных хорах есть 1 и 2 сопрано, а также 1 и 2-й альт. После переходного возраста они приобретут более яркую окраску и уже после 16-18 лет можно будет определить взрослый тип голоса.

Чаще всего из дискантов получаются тенора и баритоны, из альтов – драматические баритоны и басы . Низкие голоса девочек могут превратиться в меццо-сопрано или контральто, а сопрано стать немного выше и ниже и приобрести свой неповторимый тембр. Но бывает, что низкие голоса становятся высокими и наоборот.

Дискант хорошо узнаваем по звонкому высокому звучанию. Некоторые из них могут петь даже партии для девочек. У них хорошо развит высокий регистр и диапазон.

Альты и мальчики, и девочки имеют грудное звучание. У них красивее звучат низкие ноты, а не верхние. У сопрано – самых высоких голосов у девочек – лучше звучат высокие ноты, начиная от соль первой октавы, чем низкие. Если определить их тесситуру, то можно понять, как он будет развиваться. То есть, как определить диапазон этого голоса во взрослом возрасте.

Как правильно определить свой тип голоса

В настоящее время есть 3 типа женских и мужских голосов. Каждый тип имеет свои отличия.

Сопрано – наиболее звонкий, лёгкий высокий женский голос. Он имеет яркий женственный тембр и может звучать высоко, звонко и пронзительно. Ему удобнее петь в конце первой октаве и во второй, а некоторые колоратурные сопрано легко поют высокие ноты в третьей. У мужчин похожее звучание имеет тенор.

Меццо-сопрано – сочный и насыщенный средний женский голос. Чаще всего, он имеет красивый глубокий тембр и диапазон, который красиво раскрывается в первой октаве и в начале второй. Низкие ноты этого голоса звучат наполнено, сочно, с красивым грудным звучанием. Он аналогичен звучанию баритона.

Контральто – глубокий, чувственный, бархатный и самый низкий голос у женщин. Он имеет звучание, напоминающее по тембру виолончель, и может брать низкие ноты малой октавы. А самым низким мужским голосом является бас-профундо, который в природе встречается очень редко. Чаще всего самые низкие партии в хоре поют басы.

Прослушав выдающихся певцов вашего пола, вы без труда поймёте, как определить по окраске свой тип.

Как определить безошибочно, тональность голоса? Вы сможете это сделать дома, если у вас есть музыкальный инструмент. Выберите песню, которая вам нравиться и спойте её в удобной тональности. Она должна иметь широкий диапазон, чтобы охватить хотя бы полторы октавы. Затем попробуйте подобрать её мелодию. В каком диапазоне вам удобно её петь? Затем поднимите её выше и ниже.

Где лучше раскрывается ваш голос? Это и есть наиболее удобный участок вашего рабочего диапазона. Сопрано будет удобно петь в конце первой и начале второй октавы и выше, меццо – в первой, а контральто ярче всего звучит в последнем тетрахорде малой октавы и в первой сексте первой. Это хороший способ, верно определить тональность своего голоса.

Вот ещё один способ , как определить, какой у тебя природный голос. Нужно взять распевку в диапазоне октавы (например, до – ми – ля – до (вверх) до –ми –ля (вниз), и спеть её в разных тональностях, которые будут отличаться на секунду. Если голос раскрывается, когда вы поёте верх, значит, его тип – сопрано. А, если тускнеет и теряет выразительность – меццо или контральто.

Теперь то же самое проделайте сверху вниз. В какой тональности вам стало петь удобнее всего? Не стал ли голос терять свой тембр и становиться тусклым? При движении вниз сопрано теряют свой тембр на низких нотах, им неудобно их петь, в отличие от меццо и контральто. Так вы сможете определить не только тембр голоса, но и наиболее удобный участок для пения, то есть рабочий диапазон.

Как определить, какой у тебя голос в студии? Выбрать несколько фонограмм любимой песни в разной тональности и пропеть их. Там, где лучше всего раскрывается голос, и стоит петь в дальнейшем. Ну а заодно вы будете знать, как определить свой тембр, прослушав запись несколько раз. И, хотя вы можете с непривычки не узнать свой голос, порой запись может наиболее точно определить его звучание. Так что, если вы хотите определить свой голос и понять, как с ним надо работать, отправляйтесь в студию. Удачи!