[personal profile] a_kleber
Вожусь с книжным гуглом. Глядя на такое количество уникальных книг испоганенных неаккуратным сканированием, тем более раздражают радужные рекламные посулы Гугла про оцифровывание миллионов книг, богатейшие библиотеки, и прочий ПУСТОЙ ТРЕП. У них сканнинг происходит в ангарах (да, в ангарах!) на индустриальном потоке, никакого совершенно внимания к качеству, никакой заботы. Наверное какие-нибудь низко-оплачиваемые подсобные рабочие на конвеере пихают все эти непонятные, ветхие книженции в сканеры и тупо переворачивают страницы - на мучительно высокой скорости к тому же. Ну вот и получается ублюдочный продукт на выходе...

Кстати это они так обращаются не только с иноязычной мукулатурой. Вот нашла хорошую разгромную статейку американского историка, которые пытался пользоваться гугловскими сканами. Ему тоже обидно. Интересно, университеты, которые пошли на партнерство с гуглом в смысле сканирования их фондов, они что - будут выбрасывать потом эти книжки?? Почему-то мне кажется, что где-то на гаризонте эта задумка у них точно маячит - надо же как-то избавляться от старья, освобождать площадь под новые фонды, более актуальные. В 90'е стали активно переводить старые книги на микрофильмы. Теперь вот Гугл нарисовался... только он халтурит по-черному. А ведь очень даже могли б с первого захода хорошо делать - если б захотели. Вопрос: почему не хотят? Что им важно в этом проекте на самом-то деле?

Они делают где-то 3000 книг В ДЕНЬ... У них план и пятилетка. Чуть ли не каждый месяц в проект вступают все новые библиотеки... а сканы по-прежнему очень плохие и ущербные... а сканов все больше...
"No one really knows how many books there are. The most volumes listed in any catalogue is thirty-two million, the number in WorldCat, a database of titles from more than twenty-five thousand libraries around the world. Google aims to scan at least that many. “We think that we can do it all inside of ten years.”
И нахуй так спешить-то, позвольте спросить?

А вот тут про то как гугл заморачивается с копирайтом и блокирует свободный доступ к старым книгам для всего мира кроме США: http://archiv.twoday.net/stories/2922570/

***

Я им в саппорт писала, они ответили (гугловцы всегда отвечают, что харакретно), что проект находится в стадии разработки, мол, "бета", и типа какие тут могут быть претензии? Но это дурацкий подход. Бета может быть программа или механизм (например, модель сканнера - она может хуево работать), а сканирование каждой отдельной книжки не может быть в стадии "бета" - это делается один раз, при таком колоссальном масштабе иначе и невозможно. И если хуевый сканнер хуево работает, то нельзя сразу ставить сканирование на поток, надо скромнее быть.

В общем, пока понятно только то, что все что сейчас уже отсканировано и пущено в открытый доступ так навсегда и останется в стадии бета - все это "старье" и вся эта "мукулатура". Скажем так: на этих букинистических редкостях гугловские пионэры впервые учились индустриальному сканированию...

Date: 2007-09-03 11:10 am (UTC)
From: [identity profile] shiro-ta.livejournal.com
+1 по поводу ужасного качества сканирования (http://www.scandocs.ru/)!
Никакого уважения и трепета к старинным книгам :(

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 28th, 2026 08:32 pm
Powered by Dreamwidth Studios