Существует ли идеальное сжатие без потери данных?

**CodeMaster** · 13.08.2017, 08:17

Определённого конкретного набора данных, если единственным критерием будет коэффициент сжатия? Если да, то каково (примерно) различие идеального с оптимальным значением коэффициент/время?

**Advertiser** · 13.08.2017, 08:17

**Shiny** · 13.08.2017, 11:35

**Bedazzle** · 13.08.2017, 12:38

Да, существует. Любой набор данных можно упаковать в один байт (версия пакера), при условии что упаковщик/распаковщик будут модифицироваться под каждый конкретный входной файл и содержать полный словарь.

**CodeMaster** · 13.08.2017, 13:23

Шынни, велика вероятность потери данных. Да и не ко всем типам данных подходит.

Сообщение от Bedazzle

Любой набор данных можно упаковать в один байт (версия пакера)

Очень маленькое количество данных можно так упаковать. Понятно, что 2 байтами гораздо больше, но так же понятно, что и вопрос был не об этом.

**Black Cat / Era CG** · 13.08.2017, 13:54

Ну имхо несерьезное восприятие данной темы вполне естественно.
Вы ставите проблему, опираясь на два сомнительных предмета:

идеальное сжатие без потери данных

Можно говорить о максимальном сжатии. Об идеальном сжатии - вряд ли.

оптимальным значением коэффициент/время

Оптимальное для чего? Оптимальность - это в корне относительное понятие, крайне зависящее от конкретных задач и условий.

И далее вы предлагаете сравнить гипотетическое идеальное с относительным. Как?

**CodeMaster** · 13.08.2017, 14:20

Сообщение от Black Cat / Era CG

Можно говорить о максимальном сжатии. Об идеальном сжатии - вряд ли.

Это всё софистика, думатцо 99,99% понятно, что речь идёт о минимальном размере набора служебные данные + словарь + сжатые данные.

Сообщение от Black Cat / Era CG

И далее вы предлагаете сравнить гипотетическое идеальное с относительным. Как?

Ответ в первом посте.

Сообщение от CodeMaster

примерно

Т.е. максимальное теоретически возможное (a.k.a. идеальное) сжатие для данного набора данных и данного алгоритма равно, например, 51%, то в оптимальном для 90% случаев сжатии оно составляет например ~60% или может ~52%, интересно понять соотношение этих величин.

**shurik-ua** · 13.08.2017, 15:04

Если оцифровать белый шум с любой разрядностью - то

Сообщение от CodeMaster

максимальное теоретически возможное (a.k.a. идеальное) сжатие для данного набора данных

равно 0%.

**SfS** · 13.08.2017, 19:36

Математически доказано, что для любого алгоритма Z сжатия данных можно подобрать два набора данных D1 и D2, таких, что:

1. Алгоритм Z для набора данных D1 будет самым эффективным из всех алгоритмов.
2. Алгоритм Z для набора данных D2 будет неэффективным (т.е. выходной файл данных будет по размеру больше входного).

То есть, если на минутку стать омерзительным философом-интеллегентом, о можно мрачно сказать "Ах, в этом мире нет ничего идеального!" и пойти пить водку

**nlo_j77** · 13.08.2017, 21:40

Вообще... - если брать в рассчёт теорию... - любой массив данных (включая бесконечный), можно упаковать (множественными проходами) в 2кб (учитывая, что данные 8-миразрядные!!)
эти два кб упакованных данных будут содержать 4 равных части - 1 словарь, 2 перекрестный словарь, 3 распаковщик и 4 сами упакованные данные

При каждом проходе распаковки, оба словаря обновляются, распаковщик остаётся без изменений.
Однако... - при множественной распаковке.... - чем больше объём данных, тем больше времени на распаковку (бесконечный объём данных будет распаковываться бесконечно)

P.S. Похоже на ахинею, но могу обосновать

P.P.S Про белый шум - добавляем к разрядности один пустой бит.... и всё замечательно пакуется!

**NEO SPECTRUMAN** · 13.08.2017, 22:01

Сообщение от CodeMaster

идеальное сжатие без потери данных?

ну идеального быть не может
для каждого типа файла/конкретного файла идеальным будет свое сжатие

Сообщение от nlo_j77

Вообще...

но как ни старайся в один бит
больше чем 1 бит данных ты не запихнешь...

самое оптимальное не жать каждый файл по отдельности
а жать все вместе
оптимальное в нахождении максимально похожих участков

мне интересно почему до сих пор нету пакера с готовым встроенным словарем так мегабайт на 1000

User Tag List

Тема: Существует ли идеальное сжатие без потери данных?

Опции темы

Отображение

Существует ли идеальное сжатие без потери данных?

Скрытый текст

Информация о теме

Пользователи, просматривающие эту тему

Похожие темы

Архивирование, сжатие, упаковка.

RLE сжатие (покритикуйте)

Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео

Ваши права