Вход

Просмотр полной версии : чтение файлов MS-word



p@lex
07.12.2007, 21:57
Можно ли для Спектрума создать программу для чтения файлов минимум Word-97.И какова структура этих файлов.

skyther
07.12.2007, 22:39
можно. вот только если есть возможность записать фалй на trdos диск, то проще его в текст сконвертить ДО записи...

scl^mc
07.12.2007, 22:45
а асеdit не открывает такие файлы?..

Black_Cat
07.12.2007, 23:01
Можно ли для Спектрума создать программу для чтения файлов минимум Word-97
поддерживать проприетарные форматы - не кошерно

Vitamin
08.12.2007, 13:10
На сайте у Рощина есть небольшая прога для конверсии. Вроде как на С написана.
http://ivr.webzone.ru/articles/doc2txt/index.htm

spensor
08.12.2007, 16:34
Можно ли для Спектрума создать программу для чтения файлов минимум Word-97.И какова структура этих файлов.
Некоторое время назад уже было сделано нечто сабжевое. В году примерно 2000 встречал прогу, которая была заявлена как конвертор MS-Word файлов в .txt. Правда попытки скормить ей .doc файлы ничем путным не увенчались - кажется оно просто зависало.
Что до структуры файла, то эта информация как бы не попадала под защиту авторсих прав MS. Даже на PC нет текстового процессора, который бы мог со 100% точностью повторить все особенности заданные в .doc файле, даже в формате старенького MSWord97 (попытки открыть файлы с таблицей под OpenOffice не привели к желаемому результату). Если же стоит задача просто достать текст из такого файла и файл не имеет защиты, то достаточно вьювера, который понимает кодировки 1251, UTF-16 и Unicode - текстовая информация внутри .doc файла может содержаться в любой из этих кодировок.

Добавлено через 2 минуты
PS: Прога про которую я упомянул работала на Спектруме.

p@lex
08.12.2007, 22:58
то есть проще файл из ms-office перегнать в файл с расширением txt или doc а затем
записать на Спектрум?

breeze
09.12.2007, 01:42
то есть проще файл из ms-office перегнать в файл с расширением txt или doc а затем
записать на Спектрум?

100% :rolleyes:

Alexandr Medvedev
10.12.2007, 18:14
Можно ли для Спектрума создать программу для чтения файлов минимум Word-97.И какова структура этих файлов.Учитываюя что пустой файл MS Word (в формате Unicode) занимает килобайт 30, а предел для размера файл TR DOS всего 64Кб, то смотреть можно будет только файлы на пару страниц без иллюстраций и таблиц.

spensor
10.12.2007, 21:55
Учитываюя что пустой файл MS Word (в формате Unicode) занимает килобайт 30, а предел для размера файл TR DOS всего 64Кб, то смотреть можно будет только файлы на пару страниц без иллюстраций и таблиц.
Ну почему же так категорично. Можно производить предконверсию файла, как в jpeg-вьювере на спектруме. Можно и кусками подзагружать и просматривать - в BestView текстовый буфер примерно 16Кб, но это ему не мешает просматривать файлы и в 64Кб.

Alexandr Medvedev
12.12.2007, 20:45
Ну почему же так категорично.Таково ограничение TR DOS -- файл не может быть больше 64Кб.
Вот iS DOS совсем другое дело, там на длину файла отводится уже не 2 а 3 байта.

p@lex
12.12.2007, 21:52
А разве по типу биг вьювера сделать нельзя? Когда картинка смотрится сразу не вся а окном.

Black_Cat
12.12.2007, 22:37
А разве по типу биг вьювера сделать нельзя? Когда картинка смотрится сразу не вся а окном.
А хранить её в виде нескольких десятков (сотен) трдос файлов?

spensor
13.12.2007, 11:03
Таково ограничение TR DOS -- файл не может быть больше 64Кб.
Все что я скажу это конечно беспредметный спор, но в принципе ограничение для файла в системе TRDOS составляет 640Кб. В году примерно 1997 в TRDOS стали применять способ хранения файла кусками по 64Кб, только с тем условием, что кусочки идут последовательно, без пропусков, а расширение файла формируется в духе rar-архивов (.zip, .z00, .z01...). Этот принцип используется в hrip-архивах, в pkunzip на Спектруме. А вообще 640Кб это тоже не придел, логическая емкость TRDOS-дискеты составляет 1Мб.

Evgeny Muchkin
13.12.2007, 16:47
А хранить её в виде нескольких десятков (сотен) трдос файлов?
А что в этом удивительного? Вон, например, MOD файлы амижные так и хранятся у многих на TR-DOS дискетах, и ничего.

Ewgeny7
21.12.2007, 08:57
но в принципе ограничение для файла в системе TRDOS составляет 640Кб.
Подобным подходом я пользуюсь уже несколько месяцев, разбиваю файло на куски и пишу их один за другим без пробелов. Кста, использую сий подход как раз для чтения больших файлов (до 600кб) на своей читалке файлов Win-1251 :)
Если кому нужно, могу выложить три файлика ридера (васик-загрузчик, кодовый блок и фонты). Чтение текста никак не привязано к наименованию файлов, просто диск считывается посекторно.

Alexandr Medvedev
21.12.2007, 19:39
в принципе ограничение для файла в системе TRDOS составляет 640Кб
Этот принцип используется в hrip-архивахДля начала советую изучить описание формата HRiP:

Заголовок блока:
--------------------
+0(5) - "Hrst2" - сигнатура
+5(1) - байт флагов
+6(2) - длина исходного блока
+8(2) - длина упакованного блока (без длины заголовка)
+10(1) - длина дополнительной информацииОграничение на длину - 2 байта, т.е. как и в TR DOS 64Кб. В случае если упаковываемые файлы после упаковки занимают более 64Кб, то создаётся многотомный архив причём размер одного тома 64Кб. Суммарный размер томов не ограничен даже в 640Кб.
Естественно архивы можно создавать и многотомными с размером тома 64Кб, следовательно файлы Word можно таким образом перенести в TR DOS.

p@lex
22.12.2007, 09:42
Сейчас всё делается под жёсткий диск и СД-РОМ.Разве нельзя сделать программу
для читания файлов МС-офиса с диска с переконвертацией и последующим просмотром
непосредственно на Спеке.