a_kleber | Опять про то же

Вожусь с книжным гуглом. Глядя на такое количество уникальных книг испоганенных неаккуратным сканированием, тем более раздражают радужные рекламные посулы Гугла про оцифровывание миллионов книг, богатейшие библиотеки, и прочий ПУСТОЙ ТРЕП. У них сканнинг происходит в ангарах (да, в ангарах!) на индустриальном потоке, никакого совершенно внимания к качеству, никакой заботы. Наверное какие-нибудь низко-оплачиваемые подсобные рабочие на конвеере пихают все эти непонятные, ветхие книженции в сканеры и тупо переворачивают страницы - на мучительно высокой скорости к тому же. Ну вот и получается ублюдочный продукт на выходе...

Кстати это они так обращаются не только с иноязычной мукулатурой. Вот нашла хорошую разгромную статейку американского историка, которые пытался пользоваться гугловскими сканами. Ему тоже обидно. Интересно, университеты, которые пошли на партнерство с гуглом в смысле сканирования их фондов, они что - будут выбрасывать потом эти книжки?? Почему-то мне кажется, что где-то на гаризонте эта задумка у них точно маячит - надо же как-то избавляться от старья, освобождать площадь под новые фонды, более актуальные. В 90'е стали активно переводить старые книги на микрофильмы. Теперь вот Гугл нарисовался... только он халтурит по-черному. А ведь очень даже могли б с первого захода хорошо делать - если б захотели. Вопрос: почему не хотят? Что им важно в этом проекте на самом-то деле?

Они делают где-то 3000 книг В ДЕНЬ... У них план и пятилетка. Чуть ли не каждый месяц в проект вступают все новые библиотеки... а сканы по-прежнему очень плохие и ущербные... а сканов все больше...

"No one really knows how many books there are. The most volumes listed in any catalogue is thirty-two million, the number in WorldCat, a database of titles from more than twenty-five thousand libraries around the world. Google aims to scan at least that many. “We think that we can do it all inside of ten years.”

И нахуй так спешить-то, позвольте спросить?

А вот тут про то как гугл заморачивается с копирайтом и блокирует свободный доступ к старым книгам для всего мира кроме США: http://archiv.twoday.net/stories/2922570/

***

Я им в саппорт писала, они ответили (гугловцы всегда отвечают, что харакретно), что проект находится в стадии разработки, мол, "бета", и типа какие тут могут быть претензии? Но это дурацкий подход. Бета может быть программа или механизм (например, модель сканнера - она может хуево работать), а сканирование каждой отдельной книжки не может быть в стадии "бета" - это делается один раз, при таком колоссальном масштабе иначе и невозможно. И если хуевый сканнер хуево работает, то нельзя сразу ставить сканирование на поток, надо скромнее быть.

В общем, пока понятно только то, что все что сейчас уже отсканировано и пущено в открытый доступ так навсегда и останется в стадии бета - все это "старье" и вся эта "мукулатура". Скажем так: на этих букинистических редкостях гугловские пионэры впервые учились индустриальному сканированию...

Другие люди

Опять про то же

Опять про то же

no subject

Profile

Style Credit

Expand Cut Tags