ПредишенСледващото

Книга в цифров вид, ако е необходимо България единна електронна библиотека, официалният блог ABBYY

Днес много се говори за важността на цифровизацията на библиотечни и архивни документи. Ние сме в ABBYY знам какво да дигитализира цялата библиотека и са готови да се изяснят някои аспекти на този амбициозен и предизвикателна задача.

На защо е толкова важно да се дигитализират книги и как да го направя, казва Дмитрий Shushkina, заместник-генерален директор на ABBYY България, на сайта на Forbes. Можете да прочетете статията в блога ни, ние се надяваме, че ще се интересуват!

Въпроси за безопасност и достъпност на културното наследство в миналото, наложени на равнището на правителството и съответните министерства. Въпреки това, повечето от дискусиите бяха от много общ характер. Техните членове често не разбират какво означава - да дигитализира цялата библиотека. Ние трябва да ABBYY е истински опит за участие в такива проекти, ние са били активни в цифровизацията на подбрани български и чуждестранни библиотеки и технологични партньори са мащабни международни проекти за запазване на културното наследство - Гутенберг и META-д.

Аз ще се опитам да се изяснят някои чисто технически и цена - във всеки смисъл - аспекти на цифровизацията на библиотеки и архиви, които разкриват истинската обхвата и сложността на проблема.

Защо цифровизацията

Първата задача - е да се запази книги, като ги сканирате. Разбира се, древни томове, библиографска рядкост не могат да бъдат напълно запазени като цифрово копие, тя е предоставила текстурата на хартията, художествената стойност на изображения, игра на светлината върху пергамент, и т.н. Но в други случаи, книгата - .. Е, на първо място, е източник на знания, информация ,

Втората задача - да направи книгата достъпна за широк кръг от читатели. И тя трябва не само да сканира текста, но и да го признае. Тъй като хората обикновено не се нуждаят от снимки на страниците, а именно самата информация, които могат да бъдат изтеглени за цифровизацията в правилния електронен формат, и в много по-малка степен, отколкото под формата на сканиране.

Българските библиотеки са огромни и ценни архиви, както и процеса на тяхното цифровизиране вече е започнала. Например, RSL е сканирал около един милион книги и документи (всички го държи около 45.5 милиона единици). Темпото е бавно, но начало.

Как да се дигитализират книги

Преди сканиране, което трябва да се реши какво ще бъде цифровизирана. Ако установите, че някои книги са в лошо състояние и сканирането може просто да се разпадне, ще трябва да се грижи за него, и ако е възможно възстановяване, да ги ремонтира.

Ако сканирате или снимате на старите и порутени книги, дори и ремонтирани, на този етап изисква специални условия на работа и специално оборудване - вие трябва да използвате "магически" устройства с V-образен диван за книги и страница повратна система, включително и по въздух. Цената на тези скенери може да надвишава € 100,000.

Разбира се, не всички документи, изискват такава внимателни и скъпо лечение.

Повечето от документите XIX-XXI век, можете да сканирате по-познат начин. Но във всеки случай, цялото оборудване за сканиране на книги бавно, тъй като документите не са изготвени през скенера и предадени ръчно или автоматично страница по страница. Така сканиране книга не може да се сравни с сканирането на договори пакет. Това е много време и скъп процес.

Проверка на резултатите от разпознаването - един доста дълъг и отнема много време работа, която, обаче, може да се извърши с помощта на краудсорсинг, тя се възлага обществена. Така, например, ние бяхме в състояние да дигитализира повече от 45 000 страници, когато записа 90-обем издание от 3000 доброволци сили на Лев Толстой с нас за половин година.

Книга в цифров вид, ако е необходимо България единна електронна библиотека, официалният блог ABBYY

Как да се създаде национална електронна библиотека

Програмата на цифровизацията на библиотечни и архивни стопанства в цялата страна изисква систематичен подход план и работа.

Например, как да се реши какви материали са дигитализирани, на първо място? От една страна, правото да прехвърли на електронен носител, който чете и да вземат най-често - най-популярните книги и документи. От друга - ясно е, че необходимостта от запазване на уникалните и ценни книги, които съществуват в един-единствен екземпляр.

Как да се намали рискът от дублиране на работа в различни библиотеки - за цифровизирани книги скъпо?

Струва ми се, че е необходимо първата фаза на такъв проект да се създаде една директория или да се регистрирате на всички съоръжения за съхранение. И осъзнавам, че е по-добре "отдолу". Например: библиотеките и архивите ще формулират изисквания за цифровизация, въз основа на които ще се събират някои басейн приложения. След помирение, насочени към проблемите с дублиращи се имена и систематизиране на басейна и да стане нашата директория.

На този етап, между другото, че е възможно да се вземе предвид работата, извършена от библиотеки: те са в действителност в първия сканирате своите каталози, така че читателите дистанционно за списъка на книгите. Поради това, някои части на нашата единна каталог готов.

След това, на базата на един единствен каталог ще бъде да се разработи подробен план за дигитализиране, за да бъде цялостен и единен за всички публични архиви и библиотеки.

Колко нужда от пари

Ако някога се сблъскват с поточно сканиране, тогава знаете колко е лесно. Мощният скенера поставен пакет от документи, сканиране и разпознаване се проведе почти изцяло автоматично, а вие в крайна сметка ще се получи напълно цифровизирани архив офис. Тогава все още трябва да бъдат проверени, това е, за да се провери признатите данни, това може да стане автоматично или ръчно. Във всеки случай, в този метод, цифровизацията струва няколко цента на страница.

Книги - още по-редки и стари броеве - така че да не могат да сканират, за които говорихме по-горе. Благодарение на по-сложни Скенерът разполага Признаване (странни шрифтове, сложни среди и т.н.) или по-усилена работа на хората, цената се увеличава до страницата на записа десетки и дори стотици рубли.

За да не се усложни изчисленията, нека вземем сумата от 50 рубли - колкото средно може да струва работата по записа една страница с климатик историческа колекция библиотека. Да приемем, че средната книга в библиотеката съдържа 500 страници. На това, че последните 100 милиона рубли? Около 4000 книги на средна сложност. Отново, ние говорим за "сферични книгите в вакуум", тоест за всяка библиотека ще има своя собствена стойност. Но приблизителния ред на номерата, според мен, е ясно.

За по-голяма яснота, ще кажа, че пострадалите от огъня основната библиотека INION, според официалните данни, които се съдържат 14.7 милиона книги, от които трезора в Nakhimovsky Avenue 10.2 млн. Разликата, както виждаме, три порядъка.

Цифровизацията в други страни

Един от най-известните чуждестранни проекти за дигитализиране на книги и документи - на Гутенберг. стартира през 1971. В рамките на доброволците се дигитализира и се съхранява в текстов формат различни произведения на световната литература са свободно достъпни. Сега 45 000 книги могат да се изтеглят безплатно проект онлайн във всички популярни формати. И със собствен дизайн брояч показва само 4,5 милиона сваляния през последния месец.

Друг проект за дигитализиране на стари книги, си струва да споменем, -META-е. Той също така е планирането и развитието на страните от ЕС. В рамките на проекта, парите бяха отпуснати за развитие на софтуерни системи за признаване на всички европейски текстове, публикувани през вековете на XVI-XIX с едва случва сега готически шрифт.

Докато Европейската библиотека дигитализира много по-голяма степен, отколкото българина.

Така например, на интернет страницата на Френската национална библиотека, която има сравними с тези средства INION на разположение повече от 3 милиона книги и документи. Да се ​​надяваме, че нашите библиотеки в близко бъдеще ще могат да се похвалят с такива цифри.

СНИМКА 1: Шарън Ники McCutcheon, www.flickr.com

Фото 2: Майкъл Бекуит D, www.flickr.com

Подкрепете проекта - споделете линка, благодаря!