Любительница поэзии и программист Джулия Эванс написала красивую программку gzip.jl, которая в замедленном режиме показывает, как архиватор gzip осуществляет декомпрессию текста, сжатого с помощью алгоритма LZ77.
LZ77 использует словарный подход и кодирует совпадения текста, так что при повторном упоминании одинакового фрагмента вставляет код для предыдущего упоминания (красным цветом).
Поэзия идеально подходит для архивирования, потому что она основана на повторениях — ритм, рифма, повторение фраз для усиления эффекта. В этом примере видно, что количество красного (повторного) текста увеличивается с каждой строкой.
ссылка на оригинал статьи http://habrahabr.ru/post/199042/
Добавить комментарий