Перейти к основному содержимому

Часто задаваемые вопросы

Фильтрация данных

Работает ли фильтрация для файлов?

Да, но только для файлов с текстовым слоем. Про обработку файлов, присланных через Jay Copilot можно прочитать здесь, а через API — здесь. Jay Guard извлечет этот слой и обработает его согласно правилам фильтрации перед отправкой в LLM.

Данный механизм работает для всех типов файлов, которые содержат текстовый слой. Например, если ваш PDF-файл имеет такой слой, Jay Guard его обработает. Однако, если слой отсутствует и файл состоит только из изображений, Jay Guard его пропустит.

Как фильтровать коммерческую тайну?

Для фильтрации коммерческой тайны, которая выражается целыми предложениями, можно использовать пользовательские сущности типа «Справочник словосочетаний». Смотрите раздел Правила фильтрации для получения информации о подробной настройки правил.

примечание

Сейчас это основной способ. Мы планируем добавить более специализированные анализаторы для таких задач в будущих версиях.

Как работает фильтрация данных с ошибками?

Устойчивость к ошибкам зависит от типа сущности:

  • NER-модели (сущности «Личность», «Адрес») устойчивы к ошибкам и могут распознать данные даже при наличии опечаток.
  • Сущности на основе регулярных выражений неустойчивы к ошибкам и требуют точного соответствия шаблону.

Маскирование и демаскирование

Когда использовать методы маскирования/демаскирования?

Методы API для маскирования и демаскирования используются для интеграции сторонних приложений с Jay Guard.

Например, у вас есть пользовательский запрос, который нужно отправить в зарубежный сервис, но при этом запрос не должен содержать персональных данных.

В этом случае вы:

  1. Маскируете запрос с помощью API через эндпоинт POST /api/dataguard/public/user-masking/{service}/mask.
  2. Отправляете замаскированный запрос в сторонний сервис.
  3. При необходимости демаскируете полученный ответ через эндпоинт POST /api/dataguard/public/user-masking/{service}/unmask.

Используется ли маскирование при проксировании?

В режиме проксирования используются похожие, но более сложные механизмы. Основные различия:

  • Методы маскирования/демаскирования могут анализировать текст полностью как единое целое, а могут разбивать на отдельные поля. С их помощью вы можете точно настроить то, как будет работать маскирование/демаскирование.
  • Режим проксирования разбирает запрос к LLM и анализирует отдельные его поля. Предоставляет преднастроенный способ маскирования/демаскирования.

Такой подход при проксировании позволяет избежать маскировки служебной информации (названий полей, конфигурации) и сохранить запрос корректным.

Проксирование

Поддержка моделей для проксирования

Jay Guard может проксировать запросы к любой LLM по протоколу HTTP.

  • В Jay Copilot проксирование уже настроено для всех используемых моделей. Смотрите подробнее статью об интеграции с Jay Copilot.
  • Настройку для новых моделей с HTTP API можно выполнить самостоятельно. Смотрите подробнее руководство по проксированию запросов для получения подробной инструкции по отправке запросов к иным моделям напрямую.