Автоматично подравняване на изображението

За тези, които сканира или да сканира процеси, не е тайна, че изравняването на сканираното изображение доста неприятно процедура (ако е направено с ръце). Съществуват няколко подхода (алгоритми) за автоматично подравняване. В основата на двата метода - намиране линии в изображението, от отклонението на тези редове от хоризонтална / вертикална може да се съди за това как да завъртите изображението. Облягане най-лудите опции и представите, където трябва да се обърне.

Наслаждавах се на първия алгоритъм Hufa. което е добре документирано в интернет и да дава добри резултати като цяло. Но - само за изображения, които се състоят изцяло от текст. И моята задача - да приведе изображението с текст и снимки. (Съм правил в свободното си сканиране време и възстановяване на съветските книги. И това е трансформацията е толкова удивително открива линия и изчислява ъгълът на наклона, реших да се намери откъде краката растат, и се опитват да го пренапише в Java. Източници има толкова объркващо код. и оптимизирани за C ++, че прехвърлянето се някъде ден 2. Ето какво излезе от него:

Алгоритъмът работи Готини бързо поради карти на всички възможни варианти на бита в един байт, който е в една итерация се изчислява веднъж на 8 пиксела. Но как работи и какво се случва вътре в една гатанка :) Основното нещо, което работи за мен.

Аз не вярвам на очите си. Налице е съвпадение.

Преди два дни свърших пренасяне и същи код в Java. И този процес, между другото, също отне няколко дни. По принцип, поради пълната липса на разбиране на същността на алгоритъма. Опитвайки се да се прочете една теория на всичко е напълно объркан. Но като всичко работи както трябва.

Сега тук мисля как да се реши проблема с изрязване. Аз съм това, което вече има опит в мрежата - и тук се блъсна в публикацията си.

С изрязване може да отнеме част от ImageMagic - има тапицерия опция, която е съвсем просто премахва областта с най-голяма гъстота на съдържание.

Аз също мисля за изрязване, но имам други особености - аз нарязани сканиране - там byaki на ръбове и остатъчен линия след изчистване на заден план. Когато пишат, изложи.

Между другото, защо DJVU да PDF да конвертирате? Първият Форматът е една и съща железопътна линия е по-подходящ за сканирани книги. PDF доковете Получените повече и качеството не е много - резолюцията намалява.

> Между другото, защо DJVU да PDF да конвертирате? Първият Форматът е> Е-подходящ за сканирани книги. PDF докове> стане по-голям и качеството не е много - Резолюция> намалява.

> Аз също мисля над изрязване, но имам различна специфичност -> аз нарязани сканиране - там byaki на ръбове и остатъчен линия> след отстраняване на фон. Когато пишат, изложи.

Аз организираха ideentichna проблем: абсолютно същите суровини мръсни сканира, но са изложени в DjVu.

Имам тази седмица на почивка, аз ще се върна -'ll плътна материя (ако има натрупвания на основната работа). Ще имате малка представа - акция.

Между другото, ако проявявате интерес, е друг проблем - избледнял цвят на шрифта. Реших почти. Проблемът е, че искам да направя това автоматично и не може просто да бъде определен цвят (цвят на шрифта), за да направите черно, тъй като той е намерил и на други места - например, една книга с цветни снимки, или на фона на текста от картинката там. Аз така - се избира в страницата на книгата, където има снимка и текст. Тогава Изработени област, в която има само текст. Определяне на обектите, които се съдържат в страницата. Тези обекти, които са в областта на текст, да възложат на етикета "Текст", останалата част от "Изображение". Най-близко се свързват помежду си в определена група от обекти, например, 3-4 и рекордни комуникации и размера на обектите в масив от функции. Тогава самоорганизираща Mape им даде всичко - влак. В крайна сметка се оказва, много високо качество за преобразуване, което е, текста и кое не е. Опита на книга за деца, резултатите от 100% от отгатване на страницата, на която учените. Сега трябва да се опитаме да подкрепят другите страници. Ако всичко това се случи, аз ще напиша статия, дори как да го направя. Единственият byaka е, че алгоритъмът трябва първо да се покаже полето за текст - да преподават. Но никъде в интернет е нищо по-добро не съм намерил.

I направи повече или по-малко приемливи области алгоритъм култури. Разбира се, в много отношения тя е съобразена с моя тест документи и универсалността не се прилага. Но тук да тествам всичко в ред - главно zaparyval само на корицата и богато илюстрирани страници (не може да бъде разпознат, къде свършва и мръсотията започва изображение или ръб на картината може да се сбърка с сянката на свързване). Мисля, че за една седмица заслепен нова версия.

обучението си за избелени почернялата страници от писма до мен много интересно. Сега просто попълване на бели или черни всички пиксели, които не попадат в рамките на определени граници. В резултат - носен и разкъсан по краищата на буквите.

Това е, което аз naryl за изрязване.

Момчета предлагат добър метод. Изпълнението може да шпионира в ocropus.

Свързани статии