?

Log in

No account? Create an account
александрии не будет, нас всех тошнит - Поклонник деепричастий [entries|archive|friends|userinfo]
Anatoly Vorobey

[ website | Website ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Links
[Links:| English-language weblog ]

александрии не будет, нас всех тошнит [апр. 24, 2017|05:06 pm]
Anatoly Vorobey
[Tags|]

Torching the Modern-Day Library of Alexandria

Длинная, подробная, и очень интересная статья о том, как провалилась инициатива Гугла предоставить публичный доступ к гигантскому массиву в 25 миллионов книг, которые Гугл оцифровал в рамках проекта "Океан" во второй половине 2000-х. Эта коллекция включает в себя книги нескольких больших университетских библиотек, а также некоторых огромных публичных библиотек Америки и Европы. Эти 25 миллионов составляют по оценкам около пятой части всех книг мира, когда-либо опубликованных, и в планах проекта было продолжать и стремиться к 100% охвата. Книги, которые еще продаются издателями ("in print") нельзя было бы увидеть, но все книги, к которым уже нет коммерческого интереса - включая, что самое важное, огромный пласт книг последних 100 лет, до сих пор лежащих под копирайтом - можно было бы купить за номинальную цену или смотреть бесплатно в публичных библиотеках во всем мире.

Это был прекрасный проект - лучшее, на что можно было надеяться (с моей точки зрения, еще лучше было бы радикально сократить срок копирайта и освободить из плена этот огромный пласт книг - но это политически неосуществимо). Но он провалился, и виной тому сочетание копирайтных законов, особенностей американского судопроизводства, и активистов, которые протестовали против такой концентрации доступа у Гугла, и добились в итоге того, что никто эти книги не видит и в обозримом будущем не увидит.

Очень грустная статья, наводящая тоску.

Меня особенно бесит - и думаю, тут со мной согласятся другие цифровые гики и всякие программисты - ситуация, при которой все это богатство информации уже *есть*, оно уже оцифровано, уже распознано OCR, уже лежит на дисках, вся тяжелая работа уже сделана.. и из-за тупости законов и людей она недоступна никому, кроме горстки инженеров. Это хуже, чем если бы никто это не отсканировал и не приготовил. Такое же отношение у меня к проектам типа JStor и Project MUSE, которые оцифровали миллионы старых научных журналов, но не дают к ним доступа никому, кроме больших корпораций и учебных заведений за гигантские суммы.

Я не отрицаю копирайт и плату за книги в принципе - наоборот, я стремлюсь уже много лет всегда платить за цифровые книги, которые покупаю, если есть возможность это сделать по разумной цене. Но когда такой возможности нет, и книги или статьи лежат в плену бумаги и идиотского законодательства - это бесит.

Информация. Хочет. Быть. Свободной!
СсылкаОтветить

Comments:
Страница 1 из 3
<<[1] [2] [3] >>
[User Picture]From: webface
2017-04-24 02:12 pm
Я ошибаюсь, или все эти книги были оцифрованы с помощью гугловской Recaptcha?
(Ответить) (Thread)
[User Picture]From: gaz_v_pol
2017-04-24 03:07 pm
О Боги, неужели это может быть правдой?!

Это была бы фантастическая история (если правда)...
(Ответить) (Parent) (Thread)
[User Picture]From: vitus_wagner
2017-04-24 02:33 pm
Вот из-за половинчатой позиции большинства людей, эти книги и не достанутся никому. Если бы все, кто где-то как-то связан с созданием текстов заняли твердую позицию "копирайт - зло и должен быть уничтожен, и если я подчиняюсь каким-то требованиям правоторговцев, то делаю. это только под угрозой насилия", копирайт бы может быть удалось уже раздавить. Но когда большинство людей говорят "я не отрицаю копирайта, но" - это то, из чего делающие деньги на сокрытии информации черпают свою силу.
(Ответить) (Thread)
From: (Anonymous)
2017-04-24 02:46 pm

Правильно это так:

Когда копирайт принадлежит мне, я за копирайт. А когда другому, против.
(Ответить) (Parent) (Thread)
[User Picture]From: dr_lamer
2017-04-24 02:36 pm
Я - против монополий. Поэтому я думаю, что была бы там - вместе с этими активистами. Не надо забывать, что Гугл - не благодетель, и не мать родна, а коммерческая компания.
(Ответить) (Thread)
[User Picture]From: arhiloh
2017-04-24 02:43 pm
Хорошая иллюстрация на предмет полезности борьбы с монополиями, кстати.
(Ответить) (Parent) (Thread)
[User Picture]From: gimli_m
2017-04-24 02:38 pm
Мне кажется, что информация всё-таки больше хочет быть проданной.

И в этом причина очень печальной ситуации с распространением текстов.
(Ответить) (Thread)
[User Picture]From: taki_net
2017-04-24 03:59 pm
Если я правильно понимаю Авву (я сам не вникал в детали), ЭТА информация уже не хотела быть проданной.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: sciuro
2017-04-24 02:41 pm
Насчет "богатство информации уже *есть*" - да, очень бесит, как и вся трагедия копирайтной ловушки 20-21 века, но все-таки вселяет хоть какую-то надежду. Надеюсь, гугл надежно бэкапит и хранит все это добро до той поры, когда законы изменятся. Не сомневаюсь, что немалая физическая часть этих книг тем временем может оказаться списана и/или утеряна, и не факт, что такого же масштаба усилие по оцифровке сможет быть повторено еще раз.
(Ответить) (Thread)
[User Picture]From: ilya_dogolazky
2017-04-24 02:43 pm
а вот у нас городская библиотека купила абонемент на "нахос" --- это примерно то же, но не про книги, а про музыку. Ну там конечно не 100%, но довольно много. При этом не обязательно физически находиться в библиотеке.

Ты уверен про "25 миллионов = 20% всех книг"? Я чота думал их куда больше чем 125М.
(Ответить) (Thread)
From: frogqua
2017-04-24 03:04 pm
Вот бы в викиликс это все!
(Ответить) (Thread)
[User Picture]From: mr_k_bx
2017-04-24 04:01 pm
а как это поможет рашке и трампу? Другое виликиликсам неинтересно.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: gaz_v_pol
2017-04-24 03:11 pm
От Jstor и подобных проектов все же есть та польза, что через sci-hub можно выкачать любую доступную у них статью (и параллельно создается независимое хранилище этих статей). Т.е. технически математик из бедной страны, у которого нет и не будет официального доступа к Jstor, все же имеет доступ к миллионам старых научных журналов и может прочитать, как доказывать интересующую его теорему.
(Ответить) (Thread)
[User Picture]From: dr_lamer
2017-04-24 03:49 pm
Математику из бедной страны надо просто зайти на Research Gate и попросить автора, чтобы выслал. Сложнее, конечно, если это было давно и автора на Research Gate нету.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: p2004r
2017-04-24 03:46 pm
Французы нашли средство -- принудительная продажа отсутствующих в коммерческом доступе книг (и других произведений).

То есть, если владелец не продает сам произведение, то произведение продает фонд по справедливой цене (отчисляя владельцу деньги за вычетом расходов). Владелец в любой момент может взять и начать продавать сам, неся естественно расходы на наличие произведения в книжной сети.

Цель --- никто не может прекратить доступ к однажды опубликованному.

Странно, что Гуггл не рассмотрел такое решение проблемы, просто продавить аналогичный закон о принудительной продаже произведения по справедливой и доступной цене.
(Ответить) (Thread)
[User Picture]From: taki_net
2017-04-24 04:01 pm
В США??? О принудительной продаже?
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: alaev
2017-04-24 04:05 pm
Из головы упорно не идёт
Авторы. И. Издатели. Хотят. Есть.
хотя звучит как-то неромантично.

Если мы хотим отменить копирайт, то нужно взамен предложить что-то другое. "Номинальная цена" смущает тем, что не очень понятно, чему она должна быть равна.
(Ответить) (Thread)
[User Picture]From: labas
2017-04-24 04:09 pm
Так или иначе, Гугль совершил революцию. Даже поиск по сниппетам это уже революция в работе с источниками для историка или литературоведа.
Правда, меня удивляет, насколько мало историки или литературоведы плодами этой революции пользуются.
(Ответить) (Thread)
[User Picture]From: pharmazevt
2017-04-24 05:43 pm
Согласно статье в The Atlantic, сканирование и хранение электронных копий книг для поиска по сниппетам уже признано судом законным - fair use.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: snyders
2017-04-24 05:31 pm
Гугл же выиграл, показывает снипеты, в чем проблема?

"instead, it’s 50 or 60 petabytes on disk, and the only people who can see it are half a dozen engineers on the project."

Если в средней книге 300 страниц, то выходит 6 Mb на страницу, не многовато? К тому же после OCR это все занимает порядка 20 Tb, один современный хард диск.
(Ответить) (Thread)
From: (Anonymous)
2017-04-24 05:48 pm
6 Mb на страницу это совсем не много. OCR не заменяет картинку, а накладывается на нее. Добавьте сюда еще индексы для поиска.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: amarao_san
2017-04-24 05:38 pm
Оно явно требует диссидента из сотрудников гугла, которые случайно допустят утечку архива. А дальше свободное сообщество знает, что с этим надо делать.

Можно даже потом объявить виноватыми Ассанжа и русско-китайских хаккеров, ворующих интеллектуальную собственность во имя вселенской справедливости.
(Ответить) (Thread)
From: jozhin
2017-04-24 05:52 pm
Из статьи не совсем понятны условия гугля.
Бесплатный доступ к книгам предполгался только через специализированные терминалы? А доступ онлайн не предполагался вообще или предполагался за деньги?
Постоянны ли эти условия или Гугль может изменить их?
Что с правами собственности?
Судя по статье, среди противников проекта Роберт Дарнтон, директор библиотеки Гарварда; он опасается, сто с гугловской библиотекой моглослучиться то же, что и с академическими журналами. Если его опасения оправданны, то правильно запретили. Забавно, что Дарнтона в статье называют энтузиастом.
Ну и имя Мариссы Майер среди инициаторов проекта несколько настораживает. Как и тон статьи вообще
(Ответить) (Thread)
[User Picture]From: avva
2017-04-24 05:59 pm
Доступ онлайн предполагался бесплатный для всех книг без копирайта, и за небольшие деньги для книг, которые под копирайтом но out of print. Про книги, которые in print, решают сами издатели/правовладельцы.

Права собственности ни к кому не переходят, предполагаемое соглашение было видом имплицитной лицензии, которую все правовладельцы по умолчанию дают Гуглу, но каждый отдельный может всегда передумать и Гугл обязан перестать показывать его книги.

Сравнение Дарнтона несерьезно, потому что в случае с академическими журналами проблема в том, что у издателей этих журналов сохраняется копирайт на статьи (а фирмы, сканирующие старые журналы, заключают обычно экслюзивные договоры с владельцами прав). Гугл не имел бы ни копирайта, ни эксклюзивной лицензии на отсканированные им книги, и никак бы не мог и не хотел помешать никому другому тоже их отсканировать - что невозможно в случае журнальных статей.
(Ответить) (Parent) (Thread) (Развернуть)
[User Picture]From: janatem
2017-04-24 06:28 pm
Интересно, найдется ли среди причастных сотрудников Гугла свой Аарон Шварц? Или в компании есть свои методы защиты от инсайдеров?
(Ответить) (Thread)
Страница 1 из 3
<<[1] [2] [3] >>