Всё решаемо!

Что нельзя отправлять в LLM: персональные данные, секреты

Что нельзя отправлять в LLM: персональные данные, секреты
Содержание:

Персональные данные (PII) — всё, по чему вас можно узнать

В контексте LLM персональные данные — это любая информация, по которой можно прямо или косвенно идентифицировать конкретного человека. Проблема в том, что чат — не ваш личный блокнот: вы не всегда контролируете, где эти данные окажутся дальше, кто получит к ним доступ и как долго они будут храниться. Поэтому лучше держать правило простое: если это можно привязать к вам — не отправляйте.

Примеры PII:

  • ФИО (полностью или “Фамилия И.О.”)

  • домашний адрес и место работы/учёбы

  • номер телефона

  • e-mail

  • дата рождения

  • номера документов (паспорт, ID, водительские права)

  • геолокация/координаты, “я сейчас в таком-то отеле/квартире”

  • фото и сканы документов, селфи с бейджем/пропуском

И да — даже если кажется безобидным (например, “просто почта для рассылки” или “адрес, чтобы посчитать доставку”), лучше заменить всё на вымышленные данные или шаблоны.


Финансовые данные — то, что может стоить денег

С LLM лучше вообще не экспериментировать, когда речь про деньги. Нельзя отправлять любые данные, которыми можно оплатить, вернуть, списать или “переоформить” платеж — даже если вам кажется, что это просто «для примера».

Что точно не стоит вставлять в чат:

  • Данные банковских карт: номер карты (PAN), срок действия, CVV/CVC, PIN, фото карты (да, на фото всё читается).

  • Онлайн-банк и доступы: логин/пароль, одноразовые коды (SMS/OTP), токены, QR для входа, резервные коды 2FA.

  • Банковские реквизиты: IBAN/р/с, номер счёта, БИК/SWIFT, имя владельца + реквизиты в одной связке.

  • Платёжные ссылки и инвойсы: ссылки на оплату, счета/инвойсы с ID транзакций, invoice/payment/reference number, клиентскими номерами — всё, где есть идентификаторы.

  • Налоговые и идентификационные номера: ИНН, VAT ID, номера налогоплательщика, данные деклараций/выписок, суммы и остатки по счетам.

  • Платёжные сервисы: данные PayPal/Stripe/Apple Pay/Google Pay, merchant keys, API-ключи, секреты вебхуков.

Риск в одну строку: мошенничество — кража средств, подмена реквизитов и платежей, доступ к аккаунтам и оформлению операций от вашего имени.


Доступы и «ключи от квартиры» — пароли, токены, коды

Всё, что открывает дверь в аккаунт, сервис или внутреннюю систему, нельзя отправлять в LLM вообще. Даже “на секундочку, чтобы модель подсказала, почему не работает”. Потому что это буквально как сфотографировать ключи от квартиры и отдать незнакомцу — может, он и не зайдёт прямо сейчас, но шанс вы сами уже подарили.

Что точно не отправляем:

  • Пароли от почты, соцсетей, банков, админок, VPN и т.д.

  • Одноразовые коды: SMS-коды, 2FA/TOTP-коды из приложений-аутентификаторов

  • Recovery-коды / backup-codes (те самые “на случай, если потеряете доступ”)

  • API-ключи (OpenAI/Stripe/AWS/Google и любые другие)

  • Токены доступа: OAuth tokens, bearer tokens, session tokens

  • Приватные ключи (SSH private key, ключи криптокошельков, seed-фразы)

  • Ссылки-приглашения с доступом (invite links в Slack/Notion/GitHub/доступ к папке/доске)

  • Cookies и любые куски заголовков/дампов запросов, где они видны

Если нужно показать пример — подставляйте “XXX” или генерите фейковый ключ. Любая настоящая строка доступа в чате — это уже риск, и иногда один-единственный токен стоит дороже, чем весь ваш ноутбук.


Секреты компании — всё, что нельзя пересылать «в общий чат»

Есть простое правило: если документ или цифры неловко показать “всем в компании”, то в LLM их тоже лучше не тащить. Потому что это уже зона корпоративных секретов — и тут риски не теоретические. Утечка, нарушение NDA, потом разборки с партнёрами/клиентами, репутационные потери и, да, вполне реальные юридические последствия.

К корпоративным секретам обычно относится вот что:

  • Внутренние документы: регламенты, инструкции, политики безопасности, схемы процессов, оргструктура.

  • Стратегии и планы: дорожные карты, планы запусков, бюджеты, прогнозы, M&A, планы по сокращениям/найму.

  • Прайсы и условия до публикации: новые тарифы, скидочные сетки, маржинальность, спецусловия для ключевых клиентов.

  • Клиентские базы и лиды: списки клиентов, контакты, сегментация, история покупок, LTV, причины оттока.

  • Договоры и приложения: коммерческие условия, SLA, штрафы, акты, счета, реквизиты, переписка по согласованиям.

  • Переписка: письма с клиентами и партнёрами, внутренние обсуждения, особенно конфликтные кейсы и претензии.

  • KPI и внутренняя аналитика: планы продаж, воронка, показатели команд/людей, зарплатные вилки, бонусные схемы.

  • Исходники и дизайн до релиза: код, ключи, токены, архитектура, макеты, прототипы, тексты, которые ещё не вышли.

  • Данные из CRM/ERP: выгрузки, карточки сделок, заказы, остатки, себестоимость, логистика, финансовые отчёты.

И вот что важно: даже если вы “просто попросили модель переформулировать” договор или “подсказать по CRM-выгрузке”, вы всё равно передали наружу кусок внутренней кухни. А потом доказывай, что это никуда не утекло и не нарушило условия NDA.


Медицинские и другие «особо чувствительные» сведения

Есть категория данных, с которой лучше вообще не экспериментировать — чувствительные (особо чувствительные) сведения. Это информация, которая может реально навредить человеку, если всплывёт не там: про здоровье и психику, про детей, про убеждения, про биометрию. В отличие от “просто имени”, такие штуки часто нельзя нормально «отыграть назад», если они утекли.

Примеры, что сюда обычно попадает:

  • диагнозы, выписки, назначения врача (вроде “депрессия, F32.1”, “ВИЧ+”, “онкология”);

  • результаты анализов и обследований (ХГЧ, МРТ, генетические тесты, инфекции);

  • детали психотерапии: запросы, травматичный опыт, заметки сессий;

  • любые сведения о детях: ФИО, школа/сад, адрес, особенности здоровья;

  • политические/религиозные взгляды, членство в организациях, биометрия (фото лица, отпечатки, голосовые слепки).

Если без этого никак — обобщай: “мужчина 35 лет”, “анализы в норме/не в норме”, “симптомы такие-то”, и обязательно убирай идентификаторы (ФИО, даты рождения, адреса, номера карт/полисов, названия клиник и т.п.). Так полезный ответ получить можно, а рисков — сильно меньше.


Если очень нужно спросить у LLM: как обезличить и не спалиться

Иногда прям зудит спросить у модели про кейс “как есть”. Окей, но тогда включаем режим паранойи (в хорошем смысле) и вычищаем всё, что может привязать текст к реальному человеку или компании.

Мини‑чеклист обезличивания:

  • Имена → роли. “Иван Петров” превращается в “менеджер” или “клиент А”.

  • Телефоны, почта, адреса — удалить целиком. Не “+48…”, не “ul. …”, вообще ничего.

  • Даты и суммы — округлить/размыть. Было “12.03.2026” → стало “в марте 2026”; “12 430 PLN” → “около 12 тыс.”

  • Уникальные идентификаторы — вырезать. Номера договоров, паспорта, PESEL/ИНН, ID заявки, трекинги, номера счетов, VIN, серийники — всё это в топку.

  • Не вставлять документ целиком. Лучше пересказать: “в договоре есть пункт про штраф 10% при просрочке”, чем копипастить 3 страницы.

  • Фейковые примеры вместо реальных. Если нужен формат — делайте выдуманные данные, но сохраняйте структуру (поля/логика/ошибка).

Пример “до/после”:

До:
“Посмотри жалобу клиента Ивана Петрова (PESEL 900312…): заказ №A-19384 от 12.03.2026, доставка: Warszawa, ul. Grochowska 12, сумма 12 430 PLN, телефон +48… Что ему ответить?”

После:
“Клиент (физлицо) жалуется на задержку доставки по заказу [номер удалён], оформленному в марте 2026. Доставка — крупный город в Польше. Сумма — около 12 тыс. Нужен черновик ответа: извинение, срок решения, компенсация по политике компании.”


Решайте любые задачи с помощью ИИ — от генерации текста до создания изображений и видео.

Текст и код

Генерация контента, перевод, анализ данных и автодополнение кода.

Изображения, видео и музыка

Создание иллюстраций, видеоконтента и уникальных треков любого жанра.

Диаграммы, графики и схемы

Визуализация данных, построение графиков и генерация блок-схем.

Попробовать бесплатно 

Личный кабинет

  1. Приоритетная обработка
    Запросы от пользователей личного кабинета обрабатываются в первую очередь
  2. Бонус за регистрацию
    Стартовый бонус на счёт личного кабинета (~20 запросов), без регистрации - 3 запроса
  3. Все передовые нейросети
    В личном кабинете представлен широкий выбор нейросетей (120+).
  4. Генерация реалистичных изображений
    Midjourney 6.0, Stable Diffusion XL, Dall-E 3, Playground v2.5, Flux.1 Schnell, Flux.1 Dev, Flux.1 Pro, Flux.1.1 Pro, Kolors, Recraft v3, GPT Image 1 (low), GPT Image 1 (medium), GPT Image 1 (high), Google: Nano Banana, Google: Nano Banana Pro, FLUX.2 Flex, FLUX.2 PRO, FLUX.2 MAX, Google: Nano Banana 2
  5. Создание музыки
    Нейросеть Suno создает музыку на основе вашего текста
  6. Нет ограничения на количество символов
    Без регистрации вы можете отправить запрос не более 1000 символов
  7. Работа с файлами
    Поддержка всех популярных форматов: pdf, excel, word, powerpoint, odt, c, js, php, py, html, sql, xml, yaml, markdown, txt, json, csv, png, jpeg и другие
  8. Удобный вспомогательный чат
    На всех страницах проекта, для получения быстрых ответов
Зарегистрироваться
Личный кабинет smartbuddy.ru