ПредишенСледващото

В този кратък урок, бих искал да споделя мислите си за бързо сканиране на книги в PDF формат и впечатления от технологията ClearScan на разположение в Adobe Acrobat от версия 9.0. По мое мнение, това е една чудесна технология, която прави (най-накрая!) PDF формат, подходящ за сканирани текст.

В действителност, когато разрушителни за сканиране на книги (скъсани чаршафи и употребяван лист скенер), процеса на сканиране - почистване - трансфери PDF - OCR може да се извърши в три часа, като средният размер на книгата. (Трябва да кажа, че нямам опит в областта на фотографията книги, очевидно снимана също може да се извърши бързо, с необходимото оборудване, и по този начин да се избегне разрушаването на книгата на хартия). Ако "стъклар", т.е., че имате достатъчно търпение, за да сканирате книгата на стъклото на скенера сканира очевидно отнеме повече време.

Като начинаещ сканирания

Като начинаещ сканирания

В случай че имате скенер, който искате нещо да се сканира! И благодаря на Бога. Погледнете изобилието на цифрови библиотеки. Благодаря на всички, който е сканиран и качен на другите.

Това понякога е вярно. Има голям брой различни ценни книжа (брой 1, 2 ... 10 страници), които направих. Защо Chica с тях? Погледнато - ще. И още, и не е нужно. Но тук е книга ... а дори и за тези, които обичат книгите ... освен ако не могат да назоват получения уклончив неща с ивици, петна, черни точки, с разкъсана печат книга? Къде е същността на въпроса? Какво трябва да се сложи опция, лост, да се обърне към всичко това е била сходна с оригинала?

Това е просто точката, че няма нито един лост. Налице е процес на четири етапа, всеки етап на което изисква някои оптимални решения от оператора. Скенер софтуерен пакет за работа в "всичко с един замах pobivahom" крие това от четири стъпки процес, което го прави един от операцията: лист хартия - електронен еквивалент. Но за това, което наистина се случва нещо трудно, но все пак може да се отгатне. Например, скенерът приключи сканирането, и компютърът не е готова да продължи; върху него, за да се отваря и затваря всички програми; мигаща светлина достъп до твърдия диск ...

За да сканирате книга с високо качество, е необходимо да се мине през стъпките на този процес: сканиране, почистване и превода в желаната форма и текст признаване (OCR).

Целта на този етап да превежда страниците на хартия от книга в съответните файлове в TIFF формат с резолюция 300dpi. Тази резолюция е достатъчна за обичайната книгата на текст ( "чете") размер. Дребния шрифт, или желанието да се предава прецизни детайли на изображенията може да изисква по-висока разделителна способност. Копаят в настройките си скенер. На изхода, трябва да получите файлове с изображения в TIFF формат. Един лист - един файл. И без много страници TIFF-а (където в един файл във формат няколко страници)! Не PDF-ите! Не OCR-ите (разпознаване на текст)!

На този етап също така трябва да се реши дали сканирането на книгата на цвят (цвят) или нива на сивото (нива на сивото). Обикновено това не се препоръчва да се сканира книгата в строго черно и бяло (телесно тегло), защото тогава скенерът ще трябва да реши какво да прави с черно и бяло, че. Например, един завой на страницата могат да се предават в черно и да се създаде черни ивици и петна, и дори по-лошо, тези петна ще бъдат затворени като черен текст. Тогава скраб е "черно на черно" е невъзможно. Ако светъл лъч (групата, друг дефект) на сиво (или друг, за цветно сканиране) цвят и черен текст (не-дефект) цвят, дефектът може да бъде отстранен в стъпката на почистване чрез изтриване на цветно изображение място. Има също така строго черно-бяло сканиране изтънява и паузи линии и шрифт (тоест, когато писмото, да речем, «г» се появява като «сантилитра»). Ето защо, за висококачествено сканиране, представете си, че опция (телесно тегло) не съществува.

За моя лист скенер, сканиране започва с рязането на капака. Един обикновен кухненски нож с късо острие и удобна дръжка е добре. За мека корица, ножът се изтласква между капака и на първата страница (със затворен капак) и капака се реже. Ако книга твърди корици, когато е отворен капака на самата книга е нарязано. Страница след това или излизам един по един, или отрязани. Назъбени краища след това могат да бъдат отстранени с стъпка програма за почистване. Основното нещо, което не се е изкачил назъбени краища на текст.

Пиша тези редове, и в главата ми прозвуча стихотворението Маршак:

В Skvortsova Griški Имало едно книга - мръсни, окъсани, разкъсан, гърбав ...

Имам една книга, дори и от моето детство, което много ми харесва, и аз няма да го нарежете. Но често това е необходимо, за да сканирате ползите, често компютърни, често дебели и рециклирана хартия - най-доброто място за тях. И е време да сканира "върху стъклото" Жалко за губене.

За пореден път от настройките на основните скенер. Резолюция - 300 dpi и цветен режим "сивата скала» (нива на сивото), или "цвят" (цвят). Формат на файла - TIFF.

Чрез измерване в мм страница от книгата, можете да зададете дължината и ширината. Разбира се, "чашата", това може да стане само приблизително, така че как точно да се постави книгата върху стъклото невъзможно. Един от листовете скенер ще смуче листовете с гладка страна (или горе / долу, или ако от страната, е необходимо да се постави плоската страна) и след това всичко ще бъде точно до милиметър. На лист му скенер Наскоро, поради вродената мързел, изберете опцията "подобряване на текст» (подобряване на текст), който "uzhirnyaet" и "uchernyaet" текст и разваля цветни илюстрации на (преувеличава) и опцията "подравняване на изображението" (Обръщане ) като плоски листове са след това по-лесно да се справя. Но можем да направим, няма други възможности, с изключение на разделителна способност и цвят да не се избират, и оставете всичко останало до етапа на почистване.

За почистване използвам ScanKromsator програма срещу 5.9. Необходимо е да се търси в Интернет. Аз съм малко плюе на пода поради своята интерфейс, но това е само на пръв поглед, докато не свикнете с него. След като спрете да забележи странности, а дори напротив, се празнува като удобен начин за правене на това или онова.

Позоваванията на описанието на програмата:

Програма, особено за новак, трудно, но все още не е толкова сложна, колкото, например, Photoshop. Има и ScanTaylor, който обещава да бъде по-лесно, но не съм пробвал. Която и програма не се използва, е необходимо

• отстраняване на страницата за наклон (Обръщане)

• отсече назъбени ръбове

• изравняване осветеност (премахване на сенки от неравномерно осветление)

• премахвате точки и други отпадъци (Despeckle)

• самостоятелна проверка / поправи илюстрации (включително корицата)

• повишаване на резолюцията на 600 dpi, ако сканирани при по-ниска резолюция.

След ScanKromsator преминава през страниците (т.е.., След като кликнете върху процеса на бутон), тя ще се отвори прозореца, за да се покажат резултат (гледката резултат) на. В този прозорец, има някои основни инструменти като гума, "магия лечение" и избор на цвят за нея. Не презирай да ги използва за самопочистващи особено мръсни отделни страници.

Можете да коригирате тези дефекти на страници като маргинални бележки (освен ако, разбира се, не е цел да ги спаси), изтриване на молив линии, като се набляга на текста (да пречи на програмата за OCR, който ще ги вземе за график), премахване на ленти, петна, а понякога и на заден план. Веднъж сканирани книга със сини букви на син фон; фон дойде грозен, а аз просто се отстранява с помощта на "магически лечение", т.е.. д. се е променило до бяло, тъй като той е малко по-леко текст и може да се изхвърлят чрез премахване на цвета му.

"ЧК-GPU - орган за цел да накаже, а ако просто да обрисуват случая. - не само да накаже, но наистина да накаже за другия свят се забелязва нарастване на населението, благодарение на работата на нашия GPU"

3. Прехвърлете крайния формат

3. Прехвърлете крайния формат

Така че ... превеждаме книгата в желания формат. Аз съм тук, като се има предвид само формат PDF като един, просто, бързо и радикално решение "аспект проблем" ... стои. Някъде вече съм го казал. А, да. Е, има много формати, в които можете да превод на книгата, в това число "текст". Както можете да прочетете една книга - коригирам. проверят само толкова, колкото трябва, и след това да изтеглите от интернет книга в текстов формат - има правописни грешки морето.

Ще обясня как да се направи една книга в PDF, освен с помощта ClearScan технология. ClearScan - модерна технология. Ако самият формат PDF не е идеален за съхранение на сканиране (получен или на голям файл или когато стиснете малко повече, изображенията с лошо качество), когато се прилага ClearScan, този формат е в близост до идеален.

Можете да конвертирате книга в текстов формат - TXT, RTF, DOC накрая, или в HTML-Най-Най и XML EPUB и FB2. Но това е - да се публикуват книгата отново. И може да загуби цялата или част от регистрацията книга във второто издание. Необходимо ли е, ако книгата вече е публикувана? Разбира се, вие решавате. Ако проектът е малко, а след това можем да се издава нов. И ако много от него и искат да се запази? Да, и просто не искам да губя време за повторно пускане? След това продължава да бъде "шамар" в книга DjVu или в PDF (някой "изскача" в PowerPoint, но това е, съжалявам ", най-накрая"). Тези формати като "малко TIFF-а" - книгата остава в графичен формат, но заема по-малко пространство.

ClearScan технология същност се състои в подмяна на изображенията на писма на сцената OCR за този шрифт. Този шрифт не е кой да е готов (система) на шрифта е малко или много подобен на оригиналния шрифт, специален тип, произведен програма Acrobat «в движение" за определена буква от текста.

В резултат на това, вместо да има страница с (почти) на настоящия текст, под формата на (почти) същите като оригиналните страници на книгата в графичен формат.

Както е посочено в тази статия и доказан в практиката, най-добри резултати са получени с оригиналния висока разделителна способност (600 dpi) и липсата на намеса на оригиналния страна (отломки, артефакти). Поради това, в процеса на почистване, след скенера на изображението (осветление подравняване, отстраняване на отломки, повишаване на резолюцията до 600 dpi) се изисква да се произвеждат висококачествени текст и да извлечете максимума от малък размер на файла.

Къде ще стигнем Adobe Acrobat 9.0 и по-горе? Ръководителят след това започва да върти един <нехорошее слово>. Но защо трябва да ви научи лоши думи? Вие ги знаете добре без мен. Ето защо, като екзотичен алтернативен начин, мислех да отида и да е търг, например E-Bay, наберете Adobe Acrobat 9 Pro и да видим дали можете да получите това, което искате, на разумна цена. Да - може да бъде. И ти Acrobat.

Работещи Acrobat, изберете TIFF-и всичко се получи след почистване. За да направите това, ние натиснете върху файла ^ Комбинирайте ^ Обединяване на файлове в един PDF формат. Отваря прозорец, в който

• Право на върха, изберете опцията Single PDF (това е най-вероятно, и така избрани)

• Право на дъното, където можете да видите три страници, изберете най-голямата страница за по-добро качество

• Кликнете върху Добавяне на файлове ^ Добавяне на файлове и се добавят всички TIFF-S. За да добавите всички файлове наведнъж, кликнете с мишката на първия файл, след това задръжте натиснат клавиша Shift и щракнете върху последния файл. Кликнете Комбинирайте файлове, и търпеливо изчака резултата - един файл в PDF формат.

4. OCR опция с ClearScan

4. OCR опция с ClearScan

Е, ние стартирате OCR в една и съща Adobe Acrobat. За да направите това на документа - OCR разпознаване на текст - разпознаване на текст Използване на OCR и в отворилия се прозорец кликнете върху Редактиране под Settings. Изборът

• Първична OCR език - това е необходимо да се посочи като основен език на документи

• PDF Output Style - сложи ClearScan

• Downsample Снимки - можете да обикновено Low (300dpi).

Очакваме с нетърпение да още по-търпелив от първата, а по-скоро отидете на почивка. Изходът е желаният PDF файла. Намери го в някои bukovku и да започне да се увеличава. Тази форма като писма трябва да остане свободно по всяко увеличение.

Готово. Не забравяйте да запишете файла.

А какво друго ... Не измама, щипка файла в Acrobat, т.е., за да се спести място на диска. Аз дори няма да каже как да го направя. Не развалят качеството на файла, както и на мобилни устройства, в които по-слабият процесор, както и програма за разглеждане на PDF не е толкова умен, играе затягане книга - мъчение.

Опитайте се да хвърли своя книга на мобилно устройство - за мен това ще бъде Ipad с текста на iBooks книга. Колко добре изглежда! Колко бързо може да се превърне страници! Има търсене по ключова дума! Студентите! Сканиране на техните книги! Майки и татковци! Моля, сканирайте добрите детски книжки с картинки!

И не забравяйте да ги постави в електронната библиотека.

Написа другар Кузнецов, Иван Иванович, според другаря Филип Фьодорович Петров, който беше чул всичко това от сива мишка.

Свързани статии

Подкрепете проекта - споделете линка, благодаря!