Re: Коле

  • From: "Andrej A. Kibrik" <kibrik@xxxxxxxx>
  • To: <neurosem@xxxxxxxxxxxxx>
  • Date: Mon, 20 Nov 2006 09:31:28 +0100

  Как я понял из последнего письма Андрея Александровича, Денис может 
предоставить нам только негативную информацию: какие файлы явно не принимаются. 
Те же, которые были вроде как приняты, все равно могут оказаться недостаточно 
хорошими. Но ведь среди файлов на диске могут оказаться и просто оцифровки! Так 
что нам в любом случае ОЧЕНЬ нужны данные Дениса...

Я думаю, Денис может предоставить нам всякую информацию, просто она вся 
подлежит новому раунду оценивания.

  Что же касается очисток, то, если честно, Вера Ц. довольно четко 
сформулировала на семинаре очевидную проблему: ранее окончательное решение о 
качестве очисток принимал Андрей Александрович (учитывая, конечно, оценки 
хозяев порций, но все же единолично). Сейчас, естественно, работать мы так не 
можем. Но и разнобоя хотелось бы как-то избежать. Андрей Александрович, нельзя 
ли составить какой-нибудь примерный алгоритм оценки? По крайней мере, я 
действительно руководствовался в первую очередь "общим впечатлением".


Я думаю, об алгоритме говорить нельзя. Весь смысл этой деятельности состоит в 
том, чтобы у потенциального стороннего слушателя не было ощущения ужаса от этих 
зв. файлов. Т.е. нам надо создать набор более-менее приличных файлов. Понятие 
"более-менее приличные, не вызывающие ужаса" плохо формализуемое, поэтому тут 
нужно "набить руку", точнее ухо. Как и в любой экспертной деятельности, надо 
научиться относительно стабильно принимать решение об уровне качества. Это 
достигается только опытом. Мне это, конечно, дается тоже не очень просто, т.к. 
опыт недостаточен. Поэтому, кстати, и получилось так много градаций. Я не могу 
гарантировать, что одинаковые по кач-ву файлы не получили в моем списке разные 
оценки. Но практически уверен, что если такое есть, то не более чем на 1 
градацию. 

Я собственно и принимал решения единолично, чтобы обеспечить хоть какое-то 
минимальное единообразие решений. Я бы считал правильным, чтобы и сейчас 
качество звука оценил кто-то один. Или можно поручить это двум людям (например, 
Коле и Наташе), Вы можете это сделать независимо и потом сравнить оценки. Чтобы 
обеспечить преемственность с уже сделанной моей порцией, я бы посоветовал 
сначала потренироваться на ней. Имея это в виду, я и спрашивал, могу ли я 
кому-то переслать все зв. файлы.

Все же несколько формальных подсказок, на которые можно отчасти опереться, 
есть. Но они позволяют не поставить конкретную оценку, а получить более грубое 
впечатление о файле.

1. Соотношение шума и полезного сигнала. На осциллограмме хорошо виден уровень 
шума. Когда шума мало, то он выглядит как тонкая ниточка или полоска. Так 
например обстоит дело в z17, получившем оценку "хорошо". Размер сигнала 
исчисляется в неких единицах на вертикальной шкале. В этих единицах шум 
находится в пределах 5 единиц. Полезный сигнал, если не считать тонких пиков, 
уходящих далеко вверх и вниз, находится в районе 50-60 единиц. Значит, шум - в 
пределах 10% от полезного сигнала. Такой результат обычно приемлем. Но это не 
может быть единст. критерием - иногда больший шум оказывается нераздражающим, 
иногда меньший почему-то не отражается в толщине полоски. В зв. файле z08 шум 
составляет около 50% от полезного сигнала. Но даже 20% - это уже очень много. 

2. Признак плохой очистки - разный размер шума в разных местах. Это часто 
бывает визуально хорошо заметно. При хорошем звуке размер шума в паузе должен 
быть равномерным.

3. Когда для какого-то различимого фрагмента речи не рисуется интонограмма, это 
очень плохо. Правда не всегда - если человек говорит шепотом или скрипучим 
голосом, это может быть. Но гораздо чаще встречаются случаи, когда никаких 
оправданий нет.

4. На интонограмме хороших файлов на месте паузы не должно быть много точек. 
Если их много (что значит много - можно научиться оценивать только через опыт), 
то это признак сильного шума.

5. В ряде файлов есть хорошо слышимые артефакты. Это может быть не видно на 
графиках, а только слышно. Это неприемлемо.

Думаю, этот список можно пополнить

АК

Other related posts: