AIGodChatBot [Архив] - Speccy

Просмотр полной версии : AIGodChatBot

Patison

07.10.2019, 15:45

Объявление.
Предварительно собираю желающих тестировать созданного мною чат-бота, который в текущей альфа-версии способен лишь ограниченно понимать смысл текста пользователя. После окончания тестирования и отладки понимания перейду к следующим этапам разработки чат-бота, т.к. без понимания вся его дальнейшая работа будет невозможна.
Из-за того, что каждый запрос требует значительных ресурсов, веб-сервис чат-бота в данный момент может одновременно обрабатывать очень мало запросов. И второе, мне требуются ваши замечания для исправления недочетов и улучшения чат-бота. Поэтому до окончания процесса разработки доступ к сервису будет ограничен кругом лиц, которым я выдам разрешение. Обсуждение буду вести в данной теме.
Для получения разрешения сообщите мне на почту victor1 собака kazarinov точка biz ваш e-mail и условное или настоящее имя, чтобы я мог к вам как-то обращаться, а также желаемый логин. В ответ я через некоторое время (когда полностью будет готов сервис) дам ссылку на этот сервис и пароль для доступа. Полученные от вас сведения не будут никуда распространяться, а будут использованы строго для целей, описанных выше в данном сообщении.
Чат-бот участвовал в сентябре - начале октября этого года в конкурсе компании Huawei под эгидой Сколково, но не попал в полуфинал. Возможно, что я представил слишком раннюю версию продукта, а точнее MVP - минимально жизнеспособный продукт. Не могу гадать. Конкурсная комиссия подробностей не сообщила. Но это не повод прекратить дальнейшие работы. Напротив. Я намерен удвоить усилия по созданию полноценного искусственного собеседника.

- - - Добавлено - - -

Понимаю, что не видя продукта, так говорить невежливо, но "понимать" - не слишком ли громкое слово? Вообще не представляю себе архитектуру программы, способную что-нибудь "понять". Например, только об организацию корпуса концептов ломают голову все теоретики NLP: у людей нет чёткого разделения понятийных доменов, грамматика продиктована биологией, а устройства мозга мы понимаем на уровне "если сюда лить бензин, то отсюда может пойти дым, а может не пойти".

Гугл конечно выкатил BERT, но и это не более чем классификатор с указателем в пространстве понятий (что вообще-то огромный прогресс).
У меня работает это так:
Текст, написанный пользователем, поступает в модуль анализатора текста, который производит синтаксический анализ. На выходе - ссылки на узлы онтологии WordNet.
Далее - модуль смысловой интерпретации, который связывает WordNet с онтологией верхнего уровня. На выходе - онтология входного сообщения. Каждый узел этой онтологии ссылается на онтологию верхнего уровня.

Wierzbowsky

07.10.2019, 21:02

Какие задачи будут решаться с помощью этого чатбота?

Patison

07.10.2019, 21:22

Какие задачи будут решаться с помощью этого чатбота?
Задач, которые данный чат-бот смог бы решать, множество. По сути дела - это робот, который получает глобальные команды на естественном языке и сам пытается найти решение поставленных задач. Эффектором может быть не только текстовый вывод, но и различные механические приводы. Но даже в разговорном жанре я вижу этого чат-бота не простой говорилкой типа Алисы, которая сразу же после знакомства с моим именем напрочь его забывает. Мне видится, что это со временем будет мудрый помощник и эксперт в самых разных профессиональных сферах. Профессионализм будет зависеть от загруженных в чат-бота специализированных знаний и умений. Хотя и самообучаемость также будет присутствовать.
Не сочтите данный пост за набор завиральных идей. Я лишь высказал свое видение дальнейшего развития проекта. Мне привычнее обсуждать характеристики уже действующего программного или аппаратного продукта.

SaintTurnip

07.10.2019, 21:28

Не пробовали делать на основе ворднета статистическую грамматическую модель в многомерном пространстве? Моя идея в том, чтобы превратить введенный текст в набор векторов, а по ним уже делать парсинг. Если расчеты верны, по расстоянию между векторами можно понять, что это синт. группа.

Patison

07.10.2019, 22:34

2SaintTurnip: Посмотрите программный код и статистические данные синтаксических анализаторов, например, FreeLing. Там есть кое-что интересное.

CodeMaster

08.10.2019, 21:21

Я намерен удвоить усилия по созданию полноценного искусственного собеседника.
Это, конечно, погубит человечество, но раз невозможно подавить восстание машин, то надо его возглавить. НаписАл в личку.

SaintTurnip

09.10.2019, 01:43

2SaintTurnip: Посмотрите программный код и статистические данные синтаксических анализаторов, например, FreeLing. Там есть кое-что интересное.

FreeLing выдает очень приличный результат, но:

вавра брадая шпилила йиндриха => noun, verb, verb, noun

Деепричастный оборот? - не, не слышали.

Интересная штука. Завтра погоняю по гутенбергу.

Patison

09.10.2019, 06:08

FreeLing выдает очень приличный результат, но:
Деепричастный оборот? - не, не слышали.
Интересная штука. Завтра погоняю по гутенбергу.Да, там есть ошибки. Например, часто путает время (прошлое, настоящее, будущее). Но многие из этих ошибок можно исправить. Для русского языка у этих испанцев функционал недоделан или кривоват. Нужны усилия для доработок. АОТ не сильно лучше, а скорее всего и хуже.
Сейчас для меня вопрос стоит так: либо ограниченные возможности понимания с кривоватыми синтаксическими анализаторами, либо никак. Ждать идеальной обработки русского языка можно еще двадцать лет, как я ждал.

Patison

10.10.2019, 21:53

Можете почитать кое-что про текущее состояние чатостроения и масштабность решаемых задач:
Facebook ставит на то, что следующим популярным интерфейсом будет разговор (https://habr.com/ru/post/470746/)

Patison

01.11.2019, 07:31

Относительно текущих работ. Все, что я обещал, сделал. Осталось написать краткую инструкцию и выдам логины с паролями всем, кто захотел участвовать в тестировании. В самое ближайшее время все это сделаю.

hobot

01.11.2019, 18:04

в теории всё красочно, перспективно и как минимум научно-интересно, практическое применение
"готовых" говорунов - да на каждом шагу, полностью роботизированный супер-маркет, где 2 человека по сменно только за экранами следят - рентабельно? про разного рода "кто там?" и электронных экскурсоводов до озвучки действий автопилота в общ. транспорте будущего. куча мест все не перечислить, вопрос
как уже на этом "начальном" этапе внедрить три закона-правила - гарантирующие что робот никогда
не сможет ни действием, ни бездействием причинить вред человеку или нарушить его права?
должен быть продуман экстренного останова любого ИИ "это курам на смех" !
Словом пару слов от экспертов в вопросе про безопасность как здоровья так и соблюдение прав живых
людей. В социуме - роботы должны оставаться роботами = участниками конвейра услуг, а не соц. единицами.

Patison

02.11.2019, 11:24

Вот драфт документации AIGod Personal Assistant версии 0.0.4
AIGod Personal Assistant (https://docs.google.com/document/d/e/2PACX-1vRlYRPzdaW9mjuiZmBcAIuahYv68GFYYJLptPciscVqKKXyt2 hiBeaKKXrgr0VtbR8GHFwYaLT1uS4-/pub)
Пока пишу, можете знакомиться и высказывать свое мнение. Как напишу релиз этой версии, выдам пароли всем пожелавшим тестировать и знакомиться с данной программой.

hobot

08.11.2019, 14:56

ребята, с конференции никто ничего интересного запостить не планирует?

Patison

12.11.2019, 14:10

Я разослал всем желающим тестировать мою программу логины и пароли. Если кто-то не получил, сообщите, я вышлю повторно.
Будьте внимательны. Прочитайте, пожалуйста, документ AIGod Personal Assistant (https://docs.google.com/document/d/e/2PACX-1vRlYRPzdaW9mjuiZmBcAIuahYv68GFYYJLptPciscVqKKXyt2 hiBeaKKXrgr0VtbR8GHFwYaLT1uS4-/pub)
Там есть примеры как нужно подавать запросы.
Напоминаю, что на данном этапе программа не выполняет функции обычного чат-бота, а лишь выдает тестовую информацию, которая отражает то, как поняла программа ваше сообщение на ограниченном естественном языке. Не пытайтесь ввести произвольный текст. Можно вводить только два типа сообщений: простое повествовательное с прямым порядком слов и вопросительное относительно существования какого-то понятия в памяти программы.

CodeMaster

12.11.2019, 19:27

Я разослал всем желающим тестировать мою программу логины и пароли.
Можно сделать так, что бы была на этой странице какая-то кнопочка авторизации (может быть виртуальной), что бы она инициировала запоминание браузером логина и пароля?

Patison

12.11.2019, 20:01

Можно сделать так, что бы была на этой странице какая-то кнопочка авторизации (может быть виртуальной), что бы она инициировала запоминание браузером логина и пароля?
Не хотелось куки применять. Есть ли другие способы хранения пароля на компе пользователя?

CodeMaster

12.11.2019, 21:18

Есть ли другие способы хранения пароля на компе пользователя?
Можно передавать в адресной строке, она сохранится в истории и можно будет быстро приступать к работе.

Patison

17.11.2019, 11:19

Здравствуйте, уважаемые все. И тестеры, и просто интересующиеся. Меня тут немного прижала другая тема. Но чат-бот в приоритете. Никакого особого секрета из своего проекта я не делаю. Я использовал FreeLing - проект создания свободного пакета инструментов обработки естественного языка, созданный в Политехническом университете Каталонии. И там в документации есть табличка, в которой написано, какие модули разработаны для разных языков. К сожалению, для русского языка они мало что сделали, а то, что сделали, содержит много ошибок. Поэтому приходится самому разбираться и доделывать их модули. Именно из-за этого такая кривизна в ответах. Но что удалось сделать мне? Я соединил их модули с моей версией онтологии WordNet, которая занимается словами и их отношениями. И, главное, соединил, с онтологией верхнего уровня SUMO, в которую добавил некоторые онтологии среднего уровня. Поэтому там есть простейшие знания из нашей жизни. Соединение FreeLing с моим проектом все еще довольно кривенкое из-за пока неработающих на русском языке многих важных модулей.
Но. Если появится хоть и плохо работающий интерфейс между человеком и компьютером, можно уже заниматься тем, ради чего все это и было затеяно - разумным поведением машины. Это как общение с иностранцем на ломаном языке. Общение хромое, но если стороны понимают друг друга, язык не будет непреодолимой помехой при обмене мыслями.
Уже сейчас на выходе анализатора создается граф - древовидная структура, каждый узел которой ссылается на узлы онтологии. Это означает, что если есть указание на понятие "человек", то программе становится понятно, что это живое существо, интеллектуальный агент и прочее. Следующим этапом будет проявление здравого рассудка программы. Сейчас этого нет. Но может относительно легко добавлено. К примеру, во фразе "Рыбы косяком летели по небу" программа сможет определить среду обитания рыб. И выявить парадокс: рыбы не могут летать по небу, в воздушном пространстве (за исключением выпрыгивающих ненадолго из воды "летающих" рыб). По небу могут летать птицы и самолеты. Поэтому все такие факты и противоречия в смысле сообщения собеседника программа довольно легко может обнаружить. Добраться хотя бы до здравого смысла самого маленького ребенка - вот ближайшая задача.

CodeMaster

17.11.2019, 15:38

вот ближайшая задача.
А какие задачи для тестеров?

Я разослал всем желающим тестировать мою программу

Прочитайте, пожалуйста, документ AIGod Personal Assistant
Документ прочитал, задал несколько вопросов боту - могу только сказать, что предложения из трёх определённых слов идущих в определённой последовательности это довольно скучно. Есть что-то ещё (вообще что-то), что можно там потестировать?