[personal profile] a_kleber
Вожусь с книжным гуглом. Глядя на такое количество уникальных книг испоганенных неаккуратным сканированием, тем более раздражают радужные рекламные посулы Гугла про оцифровывание миллионов книг, богатейшие библиотеки, и прочий ПУСТОЙ ТРЕП. У них сканнинг происходит в ангарах (да, в ангарах!) на индустриальном потоке, никакого совершенно внимания к качеству, никакой заботы. Наверное какие-нибудь низко-оплачиваемые подсобные рабочие на конвеере пихают все эти непонятные, ветхие книженции в сканеры и тупо переворачивают страницы - на мучительно высокой скорости к тому же. Ну вот и получается ублюдочный продукт на выходе...

Кстати это они так обращаются не только с иноязычной мукулатурой. Вот нашла хорошую разгромную статейку американского историка, которые пытался пользоваться гугловскими сканами. Ему тоже обидно. Интересно, университеты, которые пошли на партнерство с гуглом в смысле сканирования их фондов, они что - будут выбрасывать потом эти книжки?? Почему-то мне кажется, что где-то на гаризонте эта задумка у них точно маячит - надо же как-то избавляться от старья, освобождать площадь под новые фонды, более актуальные. В 90'е стали активно переводить старые книги на микрофильмы. Теперь вот Гугл нарисовался... только он халтурит по-черному. А ведь очень даже могли б с первого захода хорошо делать - если б захотели. Вопрос: почему не хотят? Что им важно в этом проекте на самом-то деле?

Они делают где-то 3000 книг В ДЕНЬ... У них план и пятилетка. Чуть ли не каждый месяц в проект вступают все новые библиотеки... а сканы по-прежнему очень плохие и ущербные... а сканов все больше...
"No one really knows how many books there are. The most volumes listed in any catalogue is thirty-two million, the number in WorldCat, a database of titles from more than twenty-five thousand libraries around the world. Google aims to scan at least that many. “We think that we can do it all inside of ten years.”
И нахуй так спешить-то, позвольте спросить?

А вот тут про то как гугл заморачивается с копирайтом и блокирует свободный доступ к старым книгам для всего мира кроме США: http://archiv.twoday.net/stories/2922570/

***

Я им в саппорт писала, они ответили (гугловцы всегда отвечают, что харакретно), что проект находится в стадии разработки, мол, "бета", и типа какие тут могут быть претензии? Но это дурацкий подход. Бета может быть программа или механизм (например, модель сканнера - она может хуево работать), а сканирование каждой отдельной книжки не может быть в стадии "бета" - это делается один раз, при таком колоссальном масштабе иначе и невозможно. И если хуевый сканнер хуево работает, то нельзя сразу ставить сканирование на поток, надо скромнее быть.

В общем, пока понятно только то, что все что сейчас уже отсканировано и пущено в открытый доступ так навсегда и останется в стадии бета - все это "старье" и вся эта "мукулатура". Скажем так: на этих букинистических редкостях гугловские пионэры впервые учились индустриальному сканированию...
This account has disabled anonymous posting.
If you don't have an account you can create one now.
HTML doesn't work in the subject.
More info about formatting

Style Credit

Expand Cut Tags

No cut tags
Page generated Mar. 1st, 2026 10:16 am
Powered by Dreamwidth Studios