User Tag List

Страница 1 из 4 1234 ПоследняяПоследняя
Показано с 1 по 10 из 35

Тема: Разработка парсера образов дисков RT11 Files11 различных БКшных итд для индексации

Комбинированный просмотр

Предыдущее сообщение Предыдущее сообщение   Следующее сообщение Следующее сообщение
  1. #1

    Регистрация
    25.08.2012
    Адрес
    г. Красноярск
    Сообщений
    1,245
    Спасибо Благодарностей отдано 
    343
    Спасибо Благодарностей получено 
    369
    Поблагодарили
    261 сообщений
    Mentioned
    22 Post(s)
    Tagged
    0 Thread(s)

    Exclamation Разработка парсера образов дисков RT11 Files11 различных БКшных итд для индексации

    на тему проблемы https://zx-pk.ru/threads/21450-vsjo-...y/page107.html

    Есть большой архив софта https://mirrors.pdp-11.ru/ снабженный системой поиска
    система поиска использует имена файлов и полного пути для индексации
    те достаточно выкладывать файлы или образа дисков в разумную иерархию директорий и имен

    Систему поиска можно улучшить - сделать извлекалку списка файлов из образов RT-11 и Files11 под линукс
    можно даже на яве (тк индексатор у меня на яве написан)
    и тогда система поиска будет искать образа где есть нужный файл

    Соответственно необходимо определить следующие важные моменты
    1. список расширений файлов с образами которые парсер будет проверять - у меня это dsk img - если есть еще варианты - добавляем
    2. список файловых систем которые надо индексировать - RT11 и по каким признакам файловую систему можно быстро и однозначно идентифицировать
    3. описание формата файловой системы
    тк большим запасом свободного времени увы не обладаю то прошу сразу кидать ccылки или саму документацию
    те в случае с БК я честно уже плохо помню как там файлы хранятся в МКДОС-е и уж тем более в CSIDOS
    4. какую информацию имеет смысл использовать в индексе - те что кроме имени файла ? дату ? длину ? адрес ?

    сам индексатор написан на яве, соответственно если кто-то готов помочь с написанием каких-либо кусков парсера
    Вообще мне представляется модульный парсер, который сначала получает путь до файла с нужным расширением (в индексе уже это есть)
    затем открывает его, выясняет тип файловой системы, вызывает модуль парсера этой файловой системы, получает список файлов и кладет в базу поиска

    принимаются идеи, предложения и помощь тк индексация файлов в образах серьезно улучшит качество архива в целом
    Все о БК ДВК УКНЦ VAX Alpha

    Архив ПО для ретрокомпьютеров

    предоставляю бесплатный хостинг на PDP-11.RU для проектов о ретрокомпьютерах

  2. #1
    С любовью к вам, Yandex.Direct
    Размещение рекламы на форуме способствует его дальнейшему развитию

  3. #2

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от SuperMax Посмотреть сообщение
    4. какую информацию имеет смысл использовать в индексе - те что кроме имени файла ? дату ? длину ? адрес ?
    Я для ускорения поиска в своей файловой помойке сохраняю в файле-описателе каталога и хеш файла (сейчас MD5 и SHA1). Соответственно, есть программа, которая для файла вычисляет их же и пробегая по файл-помойке - показывает, где есть ещё файлы с такими же хешами

  4. #3

    Регистрация
    16.08.2005
    Адрес
    Estonia,Tallinn
    Сообщений
    1,131
    Спасибо Благодарностей отдано 
    55
    Спасибо Благодарностей получено 
    257
    Поблагодарили
    195 сообщений
    Mentioned
    1 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    архив исходников эмулятора BK содержит парсинг для форматов разных ОС

  5. #4

    Регистрация
    22.11.2009
    Адрес
    Москва
    Сообщений
    1,699
    Спасибо Благодарностей отдано 
    84
    Спасибо Благодарностей получено 
    195
    Поблагодарили
    127 сообщений
    Mentioned
    12 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Парсеров rt-11 имеется в количестве, например
    - PUTR (http://www.dbit.com/pub/putr/putr.asm)
    - https://gitlab.com/NF6X_Retrocomputing/pyRT11
    - rt11dsk (https://github.com/nzeemin/ukncbtl-utils)

    Некоторые изыскания по этому поводу -- здесь: https://zx-pk.ru/threads/21137-fajlo...ema-rt-11.html

  6. #5

    Регистрация
    20.12.2005
    Адрес
    Москва
    Сообщений
    2,048
    Спасибо Благодарностей отдано 
    1,141
    Спасибо Благодарностей получено 
    1,460
    Поблагодарили
    520 сообщений
    Mentioned
    20 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Тоже думал на эту тему.
    У Хобота например тоже составлен текстовый индекс файло-архива, но вложенные *.dsk не показаны, плюс есть архивы *.lza, *.lzs, *.fcu итп, хорошо бы их тоже раскрывать, но вопрос чем.
    rt11dsk (https://github.com/nzeemin/ukncbtl-utils) можно собрать через make под линуксом.
    Помимо имени файла интересно: дата, размер в блоках, размер в байтах, хеши md5/sha1.

    Этот пользователь поблагодарил nzeemin за это полезное сообщение:

    SuperMax(01.03.2020)

  7. #6

    Регистрация
    30.11.2015
    Адрес
    г. Самара
    Сообщений
    7,505
    Спасибо Благодарностей отдано 
    344
    Спасибо Благодарностей получено 
    712
    Поблагодарили
    594 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от nzeemin Посмотреть сообщение
    Помимо имени файла интересно: дата
    Если бы, как Windows сохранялись даты создания и последней записи - возможно. А так дата в RT-11 - она как бы почти не о чем. В RSX в этом плане дела получше

    - - - Добавлено - - -

    Цитата Сообщение от nzeemin Посмотреть сообщение
    размер в байтах,
    Тоже самое - в RT такого понятия нет, придётся смотреть - какого типа файл и в зависимости от этого ставить или по размеру в блоках или искать - по содержимому и/или служебной информации (для RSX)

  8. #7

    Регистрация
    30.08.2011
    Адрес
    Зеленоград
    Сообщений
    7,161
    Спасибо Благодарностей отдано 
    2,979
    Спасибо Благодарностей получено 
    373
    Поблагодарили
    310 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от nzeemin Посмотреть сообщение
    хорошо бы их тоже раскрывать, но вопрос чем.
    руками содержимое подготовить и внести в данные по вложенным архивам (заняться этим не предлагать!).

    предупреждение к оглавлению в общедоступном архиве - достаточно информативное, о том что оно содержит и не содержит, более подробная информация (как правило) находится уже внутри папок с образами, кто лазил туда - тот всё сам видел - читал. Не смотря на критику (супер знатоков как надо делать) - количество обращений к архиву и смежным темам на нескольких форумах растёт (имею в виду суточные просмотры - статистика косвенная), по поводу критики, могу добавить : у одного из главных ненавистников архива есть свой сайт дико правильно оформленный с занудством до каждой буковки не докопаешься, табличками и прочее, кто про него знает? кто его видел? (я знаю и видел - поскольку сочувствую проблеме и интересуюсь любыми материалами вообще по теме), а критикуемый архив - знает толпа людей, в том числе за пределами РФ (чуть не написал Кольцевого шоссе), очень, кстати говоря, отрадно, что такой важный и уже знакомый олдовый ресурс - сайт Арсения Гордина - очень красочное переживает переоформление! На данном этапе я не планирую глобально что-то менять у себя на сайте. Спасибо.

    Последний раз редактировалось hobot; 02.03.2020 в 11:11.
    Архив программ для УК-НЦ, ДВК и БК.

    Ищу игру "СТРАНА МОНСТРОВ" [monstr.sav] для ДВК.

  9. #8

    Регистрация
    22.11.2009
    Адрес
    Москва
    Сообщений
    1,699
    Спасибо Благодарностей отдано 
    84
    Спасибо Благодарностей получено 
    195
    Поблагодарили
    127 сообщений
    Mentioned
    12 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от nzeemin Посмотреть сообщение
    архивы *.lza, *.lzs, *.fcu итп, хорошо бы их тоже раскрывать, но вопрос чем.
    запускать в эмуляторе rt11 соотв. архиватор?

    Этот пользователь поблагодарил shattered за это полезное сообщение:

    hobot(02.03.2020)

  10. #9

    Регистрация
    30.08.2011
    Адрес
    Зеленоград
    Сообщений
    7,161
    Спасибо Благодарностей отдано 
    2,979
    Спасибо Благодарностей получено 
    373
    Поблагодарили
    310 сообщений
    Mentioned
    13 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от shattered Посмотреть сообщение
    запускать в эмуляторе rt11 соотв. архиватор?
    c ключом текущей задачи! гениально! просмотр(состав архива), распаковка отдельного файла, там всё это ест
    Архив программ для УК-НЦ, ДВК и БК.

    Ищу игру "СТРАНА МОНСТРОВ" [monstr.sav] для ДВК.

  11. #10

    Регистрация
    25.08.2012
    Адрес
    г. Красноярск
    Сообщений
    1,245
    Спасибо Благодарностей отдано 
    343
    Спасибо Благодарностей получено 
    369
    Поблагодарили
    261 сообщений
    Mentioned
    22 Post(s)
    Tagged
    0 Thread(s)

    По умолчанию

    Цитата Сообщение от shattered Посмотреть сообщение
    запускать в эмуляторе rt11 соотв. архиватор?
    слона надо есть по частям

    сейчас первая часть - идентификация типа образа
    вопрос открытый
    те сколько читать в начале образа для гарантированного распознавания ?
    как распознавать ?
    Все о БК ДВК УКНЦ VAX Alpha

    Архив ПО для ретрокомпьютеров

    предоставляю бесплатный хостинг на PDP-11.RU для проектов о ретрокомпьютерах

Страница 1 из 4 1234 ПоследняяПоследняя

Информация о теме

Пользователи, просматривающие эту тему

Эту тему просматривают: 1 (пользователей: 0 , гостей: 1)

Похожие темы

  1. Ответов: 42
    Последнее: 31.07.2016, 00:52
  2. Просмотр образов CP/M дисков
    от Hakuna в разделе Утилиты
    Ответов: 270
    Последнее: 11.04.2016, 23:37
  3. Ответов: 14
    Последнее: 21.11.2011, 11:45
  4. Схемы WAIT для различных клонов ZX Spectrum
    от ARTi в разделе Несортированное железо
    Ответов: 0
    Последнее: 28.04.2008, 16:57

Ваши права

  • Вы не можете создавать новые темы
  • Вы не можете отвечать в темах
  • Вы не можете прикреплять вложения
  • Вы не можете редактировать свои сообщения
  •