Инструкция
Memoza LLM

Все полезные функции и советы по использованию в одном сжатом руководстве. Просмотрите обязательно!

Оглавление

Подготовка
1
Ознакомление
2
Загрузка данных
3
Чат с документом
4
Массовая обработка
0
Предварительный шаг: Получение доступа к Memoza.Online

Запросите и получите доступ к демо-системе Memoza.Online, следуя инструкциям ниже:

👉 Перейдите на страницу https://search-centric.com/monline

Важно

Обратите внимание, что необходимо вводить рабочий адрес электронной почты для получения доступа.

Форма запроса доступа к Memoza.Online
1
Шаг 1: Ознакомление с системой

Ознакомьтесь с общими принципами работы системы Memoza.Online:

📚 Прочитайте онлайн руководство: https://search-centric.com/instruction-01

Поэкспериментируйте с основными функциями, чтобы лучше понять работу системы:

  • Поиск по различным критериям
  • Сортировка результатов
  • Работа с картографическим интерфейсом

• Используйте панель слева для переключения между разделами
• Кнопки фильтрации находятся в верхней части основного окна
• Для просмотра дополнительных опций используйте контекстное меню (правая кнопка мыши)

2
Шаг 2: Используем свои данные!

Доступ к интерфейсу Memoza LLM осуществляется через меню «Приложений» (см. изображение).

Для более интересной работы рекомендуется загрузить собственные данные, чтобы опробовать на них LLM, а также инструменты индексации содержимого и OCR Memoza:

Алгоритм работы: загрузить данные → дождаться индексации содержимого → открыть приложение Memoza LLM и начать работу.

Меню приложений с Memoza LLM
2.1
Шаг 2.1: Загрузка данных

Загрузите 3-5 файлов на геологическую тематику. Это могут быть отчеты из открытых данных ЕФГИ, например. (О том, как получить к ним доступ, можно посмотреть здесь).

Совет

Рекомендуется начать с небольшого количества файлов (3-5) и небольшого объема (до 100 МБ), чтобы ускорить процесс индексации.

Убедитесь, что файлы поддерживаются системой (описания поддерживаемых форматов в разделе «Memoza Content Service»).

Обязательно загрузите также графические файлы с текстом (PDF, TIFF, JPG), чтобы опробовать работу OCR.

Как загрузить файлы:

  1. Нажмите на иконку "фотоаппаратик" на вертикальной панели слева
  2. Выберите Мои Файлы → Файлы для LLM
  3. Нажмите кнопку Добавить файлы в нижнем левом углу
  4. Выберите один или несколько файлов и нажмите Сохранить
  5. Дождитесь, когда сообщение в правом верхнем углу «Процесс» сменится на «Файлы успешно загружены»
  6. Повторите, чтобы загрузить больше файлов
Иконка фотоаппарата в левой панели Выбор Мои Файлы -> Файлы для LLM
Кнопка Добавить файлы Кнопка Сохранить
2.2
Шаг 2.2: Индексирование

Дождитесь завершения контентного и векторного индексирования.

На этом этапе ничего делать не нужно - только ждать.

Индексирование происходит каждый целый час. Время индексирования зависит от размера и количества загруженных файлов (как правило, это несколько минут).

Как убедиться, что файлы проиндексированы?

В колонках "HAS CONTENT" и "HAS DENSE-VECTOR" должно стоять «true», а размер содержимого должен быть отличен от нуля.

Совет

Теперь можно воспользоваться поиском, чтобы найти ваши файлы по ключевым словам из их содержимого (функция, которую вы уже изучили в Шаге 1).

Индексированные файлы с колонками HAS CONTENT и HAS DENCE-VECTOR
3
Шаг 3: Чат с документом

Пообщайтесь с конкретным документом через интерфейс Memoza LLM:

  1. В приложении Memoza LLM (доступ через меню «Приложений») в нижнем левом углу выберите опцию «Документ»
  2. Убедитесь, что в средней графе указано «Мои файлы / Файлы для LLM»
  3. В правом нижнем углу введите путь к одному из документов, которые вы загрузили

Где взять путь к документу?

  1. В левой панели откройте схему «Мои файлы», нажав на плюсик
  2. Выберите класс «Файлы для LLM»
  3. В основном окне наведите мышку на интересующий файл в колонке «RESOURCE PATH»
  4. Клик правой кнопкой мыши: Копировать в буфер обмена - Копировать значение
  5. Вставьте скопированное в буфер в поле «введите путь к документу» интерфейса Memoza LLM
Подсказка

Если своих вопросов не рождается, нажмите на кнопку в правом углу строки ввода и выберите из готовых промптов.

Например:

  • «ДЕМО. Лицензионные обязательства» - для договоров на недропользование
  • «ДЕМО. Работы по изученности» - для геологических отчетов

Или просто спросите, кто главный герой произведения и чем он интересен, если загрузили научно-фантастический рассказ.

История диалога с LLM влияет на ее последующие ответы. Если вы не хотите учитывать историю диалога - нажмите кнопку «Новый чат» в правом верхнем углу, чтобы начать новый диалог.

Опция Документ в интерфейсе Memoza LLM Схема Мои файлы с плюсиком Копирование пути к документу Кнопка выбора готовых промптов
4
Шаг 4: Чат со всеми документами

В этом режиме вы задаете вопрос LLM, не указывая на конкретный документ, в котором она должна найти ответ. Memoza сначала находит подходящие документы и фрагменты с помощью векторного поиска и поиска по ключевым словам, а потом передает их LLM для формулирования ответа.

  1. В нижнем левом углу интерфейса Memoza LLM переключитесь с опции «Документ» на опцию «Класс»
  2. Убедитесь, что в средней графе по-прежнему указано «Мои файлы / Файлы для LLM»
  3. Теперь задавайте свои вопросы
Пример

Загрузив среди прочих документов билет на Сапсан, можно спросить «Когда Василий ездил в Питер» и получить правильный ответ.

Обратите внимание, что в правой части экрана, содержащего ответ LLM, есть кнопочка «i». Нажмите на нее и увидите названия и фрагменты документов, на базе которых LLM подготовила свой ответ.

Опция Класс в интерфейсе Memoza LLM Кнопка i с информацией об источниках
5
Шаг 5: Массовая обработка

Этот режим существует для автоматизации процесса назначения атрибутов загруженным документам. Если вы делали все по инструкции, то в основном интерфейсе Memoza вы заметите, что поле «Description» (вторая по счету колонка) осталось незаполненным.

Мы можем заполнить его с помощью LLM для всех загруженных документов разом, воспользовавшись готовым промптом:

  1. В интерфейсе Memoza LLM в левой панели перейдите в раздел «Массовая обработка»
  2. В левой части экрана в правом верхнем углу выберите категорию промптов «batch» и готовый промпт «ДЕМО: заполняем заголовок документа»
  3. В правой части вставьте путь к папке, куда загружены ваши документы (как правило, это /apps/USER_DATA/LLM_FILES/). Этот путь можно взять из пути к файлу, который вы копировали на Шаге 3
  4. Поле с поисковым запросом «enter Memoza search query (optional)» оставьте пустым, если не хотите ограничивать выборку обрабатываемых файлов
  5. В поле «Select class» выберите «Мои файлы/Файлы для LLM» (Система посчитает количество файлов к обработке. Их количество появится рядом с заголовком раздела «Batch processing» чуть выше.)
  6. В поле «Field mapping…» вставьте системное имя поля, в которое LLM будет записывать результат. В нашем примере просто скопируйте его из текста промпта: «docs_loaded:Description»
  7. В правом верхнем углу экрана нажмите кнопку «Start Batch Processing»
Результаты

В блоке «Active tasks» появится задание, которое в зависимости от количества файлов может занять одну-две минуты. Как только задание пропало из «Active tasks», оно появится в разделе «Completed tasks».

По кнопке «Download» можно скачать CSV файл с результатами работы модели.

Теперь перейдите в основной экран Memoza, нажмите поиск или перезагрузите экран, перейдите в ваш класс Мои файлы / Файлы для LLM и убедитесь, что теперь поле «Description» заполнено заголовками соответствующих документов, которые сгенерировала модель.

Пример использования

Вы были на конференции, и вам прислали 20 презентаций в PDF или PPT. Вы загружаете файлы и генерируете заголовки презентаций с помощью массовой обработки. Результат можно выгрузить в Excel, и вот у вас уже есть список презентаций с заголовками.

Создание собственных промптов

Если вы хотите отдельно выделить авторов презентаций, основную мысль, компанию, от которой делалась презентация, то можно использовать дополнительные поля. В основном интерфейсе Memoza, там, где вы видите таблицу с загруженными вами файлами, сдвиньте скроллер вправо - вы увидите пустые колонки с заголовками kmeta:Custom_1 … kmeta:Custom_5. Наполните их нужными вам значениями.

Создание своего первого промпта для массовой обработки:

  1. В интерфейсе Memoza LLM перейдите в раздел «Библиотека промптов» в левой панели
  2. В правом верхнем углу выберите категорию промптов «batch» и скопируйте текст готового промпта «ДЕМО: заполняем заголовок документа»
  3. В правом верхнем углу нажмите «Add new prompt»
  4. Вставьте скопированное тело промпта в поле «Content», придумайте ему заголовок и категорию так, чтобы вам удобно было его найти в разделе массовой обработки
  5. Отредактируйте текст промпта: «docs_loaded:Description» замените на «kmeta:Custom_1», и в тексте вместо требования определить заголовок документа напишите, например: «Определи авторов документа. ФИО авторов должны следовать через запятую…»
  6. Нажмите «Save»
  7. Вернитесь в раздел «Массовая обработка» и в левой части экрана найдите свой промпт (возможно, понадобится обновить страницу, чтобы он появился)

Все готово! Теперь вы можете повторить действия Шага 5 «Массовая обработка» уже со своим промптом, чтобы заполнить колонку «kmeta:Custom_1» списками авторов документов, и так далее.

Интерфейс массовой обработки документов