Компресиране на данни

В този план, има и други приложения, вижте. Компресия.

компресия на данните (Engl компресиране на данни.) - алгоритмична реализация. произведени с цел намаляване на обема им. Използва се за по-ефективно използване на съхранение на данни и прехвърляне на средства. Синоними - опаковане данни, компресия, компресия кодиране, източник кодиране. Свържи се с процедура, наречена възстановяване на данни (декомпресиране, декомпресия).

Компресията се основава на премахването на съкращения. съдържаща се в оригиналните данни. Най-простият пример на излишък е повторение на фрагменти текстови (например, думи на физическо или машина език). Такова съкращения обикновено се елиминира чрез заместване на повторно последователност на вече кодиран позоваване фрагмент, което показва неговата дължина. Друг вид излишък се дължи на факта, че някои от стойностите в компресираната информация се появи по-често от другите. Намаляване на размера на данните се постига чрез замяна на често срещаната данни кратки кодови думи, и рядко - дълго (ентропия кодиране). компресиране на данните, че не е собственост на съкращения (например случаен сигнал или бял шум. криптирани съобщения) е невъзможно по принцип, без загуба.

Принципи за компресиране на данни

В основата на всеки метод за компресиране е модел източник на данни, или по-точно, модела на съкращения. С други думи, за компресиране на данни използва някои предварително познаване на това, което е компресиран вид данни. Липсата на такава информация за източника, не можете да правите каквито и да било предположения за преобразуването, което би довело до намаляване на обема на съобщения. Redundancy модел може да бъде статичен, неизменен за всички сгъстен съобщение или изграждане или параметризиран в етап компресия (и възстановяване). Методи за въвеждане на данни, въз основа на промяна модел на съкращение, наречени адаптивна. Nonadaptive обикновено са високо специализирани алгоритми се използват за данни, които имат добре дефинирани и постоянни характеристики. По-голямата част от алгоритми са достатъчно универсален до една или друга степен адаптивна.

Всички техники за компресия на данни са разделени в две основни категории:

Характеристики на алгоритми за компресия и тяхната приложимост

компресия

Съотношение - основната характеристика на алгоритъм за компресия. Тя се определя като съотношението на началната некомпресиран обема на обема на компресирана информация, която е: където к - степен на сгъстяване, така че - обем на първоначалните данни, както и Sc - сгъстен обем. По този начин, по-високо съотношение на компресия, алгоритъмът ефективно. Трябва да се отбележи:

ако к = 1, алгоритъмът не произвежда компресия, който е изходен съобщение е равен на обема на входа;
ако к <1, то алгоритм порождает сообщение большего размера, нежели несжатое, то есть, совершает «вредную» работу.

Ситуацията с к <1 вполне возможна при сжатии. Принципиально невозможно получить алгоритм сжатия без потерь, который при любых данных образовывал бы на выходе данные меньшей или равной длины. Обоснование этого факта заключается в том, что поскольку число различных сообщений длиной n бит составляет ровно 2 n. число различных сообщений с длиной меньшей или равной n (при наличии хотя бы одного сообщения меньшей длины) будет меньше 2 n. Это значит, что невозможно однозначно сопоставить все исходные сообщения сжатым: либо некоторые исходные сообщения не будут иметь сжатого представления, либо нескольким исходным сообщениям будет соответствовать одно и то же сжатое, а значит их нельзя отличить. Однако даже когда алгоритм сжатия увеличивает размер исходных данных, легко добиться того, чтобы их объём гарантировано не мог увеличиться более, чем на 1 бит. Тогда даже в самом худшем случае будет иметь место неравенство:

Това се извършва, както следва: ако количеството сгъстен данни е по-малко от първоначалния обем, върне компресирани данни, добавянето им в "1", в противен случай се върне оригиналните данни чрез прибавяне към него "0"). Един пример за това как се осъществява в псевдо-C ++. показано по-долу:

Степента на сгъстяване може да бъде или постоянно (някои аудио алгоритми, изображения и така нататък. е. Например, една практика. μ практика. ADPCM. Съкратени блок кодиране) и променливи. Във втория случай, тя може да бъде определена или даден съобщение или otsenon на определени критерии:

среда (обикновено от няколко теста набор от данни);
максимална стойност (най-добрия случай компресия);
минимум (най-лошия случай на компресия);

или който и да е друг. Със загуби компресия така силно зависи от качеството или компресия допустимата грешка. които обикновено действа като параметър на алгоритъма. Като цяло, постоянна компресия може да предостави само техники за компресиране на данни със загуби.

По допустимостта на загуби

Основният критерий за разликите между компресия алгоритми е описано по-горе в присъствието или отсъствието на загуби. В общи линии, без загуби алгоритми за компресия са универсални в смисъл, че прилагането им със сигурност е възможно за всеки тип данни, а възможността за прилагане на компресия със загуби следва да бъде обоснован. За някои видове данни за корупция не е приемливо по принцип. Сред тях

Системни изисквания алгоритми

Различни алгоритми могат да изискват различно количество ресурси на компютърната система, на която те се прилагат:

RAM (под междинните данни);
енергонезависима памет (за програмен код и константи);
CPU време.

Като цяло, тези изисквания зависят от сложността и "умни" алгоритъм. Общата тенденция е: на ефективността и гъвкавостта на алгоритъма, на високите изисквания на изчислителни ресурси го прави. Въпреки това, в определени случаи, прости и компактни алгоритми могат да работят по-добре от сложен и многостранен. Системни изисквания определят техните потребителски качества: по-малко взискателни алгоритъм, толкова по-лесно и по този начин компактен, надежден и евтин система, тя може да бъде изпълнена.

Тъй като алгоритмите за компресия и декомпресия работят по двойки, има стойност на съотношението на системните изисквания към тях. Често това може да бъде сложно алгоритъм да се опрости значително по-различно. По този начин, има три възможности:

Алгоритмите за компресия на данни неизвестен формат

Има два основни подхода за компресиране на данни неизвестен формат.

На всяка стъпка, алгоритъм на компресия или друг свиваем символ е поставен в изхода буфер енкодер компресия като е (със специален флаг, флаг, не се пресова), или група с няколко знака се заменя свиваем позоваване съвпада с група на вече кодираните символи. Тъй като възстановяването на компресираната информация по този начин е много бърз, този подход често се използва за създаване на саморазархивиращи се програма.
За всеки сгъстим характер последователност веднъж или всеки път, когато на статистическите данни за наличие Събирани са в кодирани данни. Въз основа на тези статистически данни за изчисляване на вероятността стойността на следващия знак, за да бъдат кодирани (или последователност от символи). След това се прилага един или друг вид кодиране с ентропия. например, аритметично кодиране или Huffman кодиране. да представлява общите къси последователности от кодови думи, и рядко - по-дълго.

литература

Вижте това, което "за компресиране на данни" в други речници:

Компресиране на данни - процес, който гарантира намаляване на обема на данните чрез намаляване на неговото напускане. компресия на данни е свързан с компактна конструкция на стандартни части данни размер. Разграничаване компресия със загуба и без загуба на информация. На английски език: Данните ... ... финансов речник

Компресия на данни - сгъстен данни в изчислителна техника, което позволява да се постигне намаляване на размера на паметта, заета от данните. За тази главни букви представляват по-малко битове, отколкото обикновено, и често използвани думи възпроизвежда съкратени ... ... Научно-техническа енциклопедия

компресиране на данни - компресиране на данни 05/02/34 [данни уплътняване]: Техниката или алгоритъм за източник на данни, обработка за целите на ефективното им изпълнение, което води до намаляване на необходимия брой октета в среда за съхранение в сравнение с броя на ... ... речник на термините на стандартна техническа документация

компресиране на данни - duomenų spūda statusas T sritis radioelektronika atitikmenys: Angl. компресиране на данни Vok. Datenkompression, е Рус. компресиране на данни, п pranc. компресия де données, е ... Radioelektronikos terminų žodynas

компресиране на данни със загуба - Този термин, има и други приложения, вижте компресия .. метод Компресия със загуби на данни (компресия) на данните при използване на декомпресира данните, която е различна от оригинала, но степента на различие не е от значение от гледна точка ... Уикипедия

Компресирането на данни с ограничени ресурси. Михаил Медведев. В момента голяма разпространените мобилни компютърни устройства и разнообразие от уреди за вграждане, които често се характеризират с минимална производителност ... прочети повече купи за 4889 UAH (Украйна само)
компресия на данни. Джеси Ръсел. Тази книга ще бъде направено в съответствие с вашата поръчка на технологии технология за печат при поискване. Високо качество на съдържанието от статиите в Уикипедия! компресия на данни (на английски език за компресиране на данни.) - алгоритмично ... Прочети повече купи за 998 рубли
Компресиране на данни, изображения и звук. Г. Саломон. Наръчникът за подготовка се определя как основните идеи и принципи на теорията на информацията компресия и практиките, с подробно описание на специфични алгоритми за компресия на различни видове цифрови данни. Повече ... Купи за 293 рубли

Други "компресия на данните" на книгата при поискване >>