?

Log in

No account? Create an account
расшифровка записи с помощью механического турка - Поклонник деепричастий [entries|archive|friends|userinfo]
Anatoly Vorobey

[ website | Website ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Links
[Links:| English-language weblog ]

расшифровка записи с помощью механического турка [июн. 8, 2015|01:26 am]
Anatoly Vorobey
[Tags|]

Месяц назад я прочитал лекцию по истории математики на иврите. С тех пор много раз собирался сесть и расшифровать ее запись в текстовый формат, чтобы легче было отредактировать и подготовить версию на русском или английском. Но все время это откладывал, потому что жалко было времени, и жалко было так скучно его тратить. Я не так быстро набираю на иврите, как по-русски или по-английски, и мне ясно было, что перевести час лекции в текст займет у меня как минимум 5, а то и 10 часов времени.

Почему-то идея заплатить кому-то, а не делать самому, мне всегда приходит на ум с большим опозданием. Но вот наконец она пришла, и я поискал услуги расшифровки аудиозаписи в текст. Оказалось, что израильские компании, занимающиеся этим, в основном заточены под расшифровку телефонных разговоров для судебных заседаний, и берут за это солидные деньги (некоторые из них, по крайней мере; большинство сайтов, в лучших традициях израильского бизнеса, не публикуют свои расценки, а просят, чтобы им позвонили или оформили запрос). Но зато я обнаружил, что по-английски такую расшифровку успешно делают задешево с помощью Mechanical Turk - платформы Амазона, позволяющей предложить армии анонимных работников умственного труда любые задания за любую плату, на которую они согласятся. Я ни разу не пользовался Механическим Турком и давно хотел попробовать, так что решил, что вот удобный случай.

Так вот, отчитываюсь. Если вкратце, то эксперимент прошел удачно. Я получил полную текстовую расшифровку своей часовой лекции на иврите, заплатив за нее примерно $30. Расшифровка отличного качества, кроме фамилий математиков и некоторых математических терминов (но этого я ожидал). До того, как я попробовал сделать это через Турка, я был готов заплатить за этот результат какому-то агентству в 3-5 раз больше (но не нашел, кому заплатить).

Теперь подробности. Я следовал почти точно рекомендациям в этой блог-записи: Cheap, Easy Audio Transcription with Mechanical Turk. Ей почти семь лет, но советами в ней можно пользоваться практически без изменений. Вот что я сделал:

- записал аудио своей лекции в отдельный MP3-файл
- с помощью программы Mp3splt нарезал звук на 5-минутные куски, всего вышло 13 кусков. Не пытался специально разбивать на паузах или еще как-то хитрить, просто по-тупому 5 минут 00 секунд на каждый кусок.
- скопировал эти 13 файлов в свой Dropbox, чтобы можно было дать на них ссылки
- зарегистрировался на сайте Турка. Вообще-то сайт требует, чтобы работодатель был из Америки, и просит ввести американский адрес. Но я ввел случайный адрес из Fake Name Generator и его это удовлетворило; баланс на своем счету оплатил израильской кредиткой без всяких проблем.
- создал шаблон задания на сайте Турка, начав с их шаблона транскрипции. Я изменил его, подчеркнув несколько раз в заголовке и описании, что речь идет о тексте на иврите, и нужно знать иврит, чтобы выполнить задание. Я полагал изначально, что на сайте можно будет каким-то образом указать, что я требую работников со знанием такого-то языка, но ничего такого я не нашел.
- следуя указаниям в той записи, на основании шаблона сделал партию из 13 заданий, каждое со своей ссылкой на свой mp3-файл, который нужно прослушать и транскрибировать. Указал, что хочу заплатить $2 за каждое задание (расшифровка 5 минут аудио). Судя по другим обсуждениям, что я нашел, за расшифровку англоязычных записей обычно платят еще раза в два меньше, но я решил, что на иврите рынок намного меньше, конкуренции меньше и цены скорее всего выше; кроме того, если честно, мне было неловко предлагать еще меньше.

(я не знаю, кто эти люди, которые выполняют задания на Турке - какие у них типичные жизненные обстоятельства. Подозреваю, что часто это бедные студенты или неработающие люди, которые зарабатывают этим не на жизнь, а на карманные деньги и мелкие расходы)
- Это важно: по умолчанию Амазон ввел на мое задание ограничение "Master Workers" - это значит, что только работники определенного элитного статуса могут его выполнять. За это ограничение Амазон также берет комиссионные 30% от всей суммы платежа. Я не хотел ограничивать пул потенциальных работников, учитывая мое требование знания иврита, так что убрал это ограничение, и это снизило мне комиссионные до стандартных 10%.
- Я дал срок в неделю на все задания, но в итоге все 13 заданий были выполнены за двое суток.
- Было несколько недоразумений, 3-4 раза, когда я в виде ответа получал что-то странное или оборванное посредине. Обычно мне тут же приходило письмо от работника, который объяснял, что случайно нажал на кнопку конца работы, и просил не отвергать задание (это влияет на их статистику, за которой следят работодатели). Во всех случаях я договаривался с ними, что они просто пришлют мне остаток по мейлу, и все это сделали. Я также мог просто открыть новый запрос на то же задание и ждать другого работника (и любопытства ради два раза так сделал).
- Несколько раз приходили уточняющие вопросы от работников. Меня удивило, что при переписке работника с работодателем Амазон просто посылает мейл от одного к другому, используя их реальные имена и адреса, и дальше они продолжают просто по мейлу. Я был уверен, что будет какая-то схема с сообщениями только с "работником/работодателем номер такой-то" через сайт.
- Я все время заходил на сайт и проверял, не сделали ли еще задания, потому что мне было любопытно и боязно, что никто не захочет делать, но я зря тратил на это время. Если бы я отнесся к этому с полным пофигизмом, то 15 минут на подготовку файлов и шаблона было бы все мои затраты времени, и я бы все равно получил те же результаты, заплатив на пару долларов больше.

Итог: 13 кусков текста. У меня заняло полчаса склеить их, пройтись и исправить основные имена/термины. Результатом очень доволен. Впредь несомненно буду пользоваться Турком для работ такого рода.
СсылкаОтветить

Comments:
[User Picture]From: oryx_and_crake
2015-06-07 10:39 pm
Я в последнее время присматриваюсь к приложению VoicePro - оно умеет очень много всего, но в том числе и автоматически распознавать речь из записи и превращать ее в текст. Стоит какие-то копейки и поддерживает несколько десятков языков, в том числе все разновидности английского, русский и иврит. Правда, у меня никак руки не доходят купить и попробовать на деле. Но надиктовывать сразу в текст было бы очень здорово.
(Ответить) (Thread)
[User Picture]From: tembel
2015-06-08 01:41 am
подумала, что интересно было бы таким заняться
пошла искать задания на русском, нашлось одно, 20 минут, оплата – 8 ЦЕНТОВ
8 ЦЕНТОВ
как это вообще
(Ответить) (Thread)
[User Picture]From: panikowsky
2015-06-08 02:31 am
8 ЦЕНТОВ, КАРЛ!
(Ответить) (Parent) (Thread)
[User Picture]From: solomon2
2015-06-08 04:31 am
Угу, я как-то давно один раз попробовал из чисто спортивного интереса, но расценки меня убедили, что это труд, недостойный человека. Пусть искусственный интеллект пашет :)
(Ответить) (Parent) (Thread)
[User Picture]From: avva
2015-06-08 06:26 am
Вот и мне непонятно, если честно.
(Ответить) (Parent) (Thread)
[User Picture]From: igrok2
2015-06-08 03:15 am
А почему не через https://www.fl.ru ?
(Ответить) (Thread)
[User Picture]From: dims12
2015-06-08 05:00 am
Круто!

P.S. Интересно, это мы у них позаимствовали традицию не публиковать цены на сайтах или они у нас? :)
(Ответить) (Thread)
[User Picture]From: michk
2015-06-08 05:31 am
Позабыты хлопоты,
Остановлен бег
Вкалывают роботы,
Счастлив человек.
(Ответить) (Thread)
[User Picture]From: geish_a
2015-06-08 05:49 am
На самом деле ужасно, что за такие деньги кто-то работает... Вряд ли это люди, живущие в Африке, где на 2 доллара можно прожить день.
(Ответить) (Thread)
[User Picture]From: aintlion
2015-06-08 06:48 am
2 $ за 5 минут аудио? Не так уж и мало.Если человек тратит на это 15 минут своего времени получается 8$/час. Не много, но и не "ужас ужас". Я например знаю, что некоторые такого рода работы, у нас в Израиле ,делают работающие в охране студенты.В ночную смену.За ночь +50 +100 шекелей кроме зарплаты.
(Ответить) (Parent) (Thread)
[User Picture]From: jmyshanya
2015-06-08 06:52 am
ога, вместо разгадывания кроссвордов можно денежку заработать!
(Ответить) (Parent) (Thread)
[User Picture]From: avva
2015-06-08 07:03 am
Логично, да, спасибо. Кстати, Турк показывает мне статистику, согласно которой в среднем расшифровать 5 минут занимало у работников 25 минут. Правда, это не совсем чистое время, очевидно, а время от "взял задание" до "сдал задание", в середине можно отвлекаться, заниматься мультитаскингом итд. Думаю, что у тех, кто делал это лучше других и не отвлекаясь, как раз 15-20 минут было.

(Ответить) (Parent) (Thread)
[User Picture]From: injj
2015-06-08 10:26 am
Извините, что вмешиваюсь. Расшифровка 5 минут занимает от 25 до 40 минут, в зависимости от качества записи, обилия терминов и опыта расшифровщика. Расшифровка часа - от 6 до 10 часов.
Был опыт. Труд действительно нечеловеческий и очень, очень малооплачиваемый.
(Ответить) (Parent) (Thread)
[User Picture]From: avva
2015-06-08 10:33 am
Спасибо!
(Ответить) (Parent) (Thread)
[User Picture]From: gaz_v_pol
2015-06-08 11:19 am
1. Я когда-то, лет 15 назад, подавал объявления в газету "Из рук в руки" по телефону. И еще много лет назад поразился -- предполагал, что нужно будет, как на диктанте, несколько раз одно и то же говорить. Но оказалось что нет, в большинстве случаев, если хорошо слышно, то достаточно один раз все сказать в обычном темпе, разве что нарочно хорошо проговаривая слова -- и девушка уже все успела набрать, и зачитывает мне обратно (как правило, полностью верно).

Если вдруг кто-то наловчился печатать на компьютере быстрее, чем обычная речь человека, он может ставить mp3-файл с увеличенной скоростью (т.е. в среднем обрабатывать минуту речи менее, чем за минуту своего труда). Не знаю, насколько это реально.


2. Люди могут заниматься какой-то деятельностью не столько ради денег, сколько ради ощущения нужности, что ли. Я и сам иногда на математические вопросы неизвестных людей из интернета отвечаю -- тратя на это много времени (не ради денег). Конечно, выглядит странным, что кто-то может добровольно переводить лекцию по математике с голоса в текст. Но кто знает, люди всякие бывают, моя жена тоже долго не могла поверить, что можно нужную неизвестно кому математическую задачу решать бесплатно в выходной день.
(Ответить) (Parent) (Thread)
[User Picture]From: olkab
2015-06-08 06:08 am
В принципе, имей в виду, что я занимаюсь всякими работами, связанными с текстами.
Английский-русский-иврит.
(Ответить) (Thread)
[User Picture]From: avva
2015-06-08 06:25 am
Понял, спасибо!
(Ответить) (Parent) (Thread)
[User Picture]From: zoff
2015-06-08 10:10 am
> я не знаю, кто эти люди, которые выполняют задания
> на Турке - какие у них типичные жизненные обстоятельства.
> Подозреваю, что часто это бедные студенты или неработающие
> люди, которые зарабатывают этим не на жизнь, а на карманные деньги

У NPR подкаста Planet Money был эпизод про работников Mechanical Turk, как раз на эти вопросы там пытаются ответить:

http://www.npr.org/sections/money/2015/01/30/382657657/episode-600-the-people-inside-your-machine
(Ответить) (Thread)
[User Picture]From: avva
2015-06-08 10:26 am
Спасибо, послушаю.
(Ответить) (Parent) (Thread)
From: mikkim08
2015-06-08 11:01 am
Все-таки интересно, можно ли на стороне работника прикрутить к этому Турку какого-нибудь робота (вроде программы для распознавания речи, автоматического перевода и т.п.). Наверное, не получится всё же. Все равно придётся редактировать вручную.

Edited at 2015-06-08 11:04 (UTC)
(Ответить) (Thread)
From: affidavid
2015-06-08 04:12 pm
Спасибо огромное, теперь я понял, как составляются экзаменационные задания.
(Ответить) (Thread)
From: dmpogo
2015-06-09 08:15 am
Я думаю что если бы вы сразу заказали написать лекцию, обошлось бы не слишком дороже :)
(Ответить) (Thread)