А, понятно, о каких повторах идет речь. Количество этих повторов действительно можно вычислить однозначно, но к вычислению энтропии они имеют отдаленное отношение. Для вычисления безусловной энтропии "повторы" вообще не используются, для условной они - редкий частный случай зависимости вероятности очередного символа от предыдущих.Повторы это повторы, хоть символы, хоть цепочки которые идут подряд.
Для сжатия с фиксированными частотами символов, зависимостью можно считать общую таблицу частот символов. По оси X - номер символа, по оси Y - его частота. Зависимость, заданная таблично, плюс сумма частот символов =1, то есть частоты взаимозависимы.Какие зависимости для энтропийного сжатия?
Также для энтропийного сжатия используются зависимости частот символов от N-го количества предыдущих символов (условная энтропия).
Если размер буфера >= размера файла, они так и делают. В остальном - видимо, ограничения на объем используемой памяти/время архивации поджимают.Чего так архиваторы не делают?




Ответить с цитированием