Материал

Синтетические данные, маскирование или обезличивание: что выбрать для тестов и аналитики

Опубликовано: 14.04.2026 · Обновлено: 14.04.2026 · Время чтения: 17 мин

Полный разбор для тех, кто хочет не нарушить 152-ФЗ и не сломать тестовый процесс

Почему вопрос стал острым именно сейчас

Представьте типичную ситуацию. Разработчик просит коллегу из DBA прислать «реальные данные для воспроизведения бага». Коллега делает дамп тестовой базы. В дамп попадают имена, телефоны и паспортные данные 200 тысяч клиентов. Через неделю файл оказывается в мессенджере аутсорс-команды в другой стране.

Это не выдумка — это стандартная схема большинства утечек в России. По данным Роскомнадзора, только с начала 2024 года в сеть утекло более 600 миллионов записей о россиянах [16].

Ответ государства оказался жёстким. С 30 мая 2025 года действуют оборотные штрафы: за повторную утечку персональных данных компании грозит от 1% до 3% годовой выручки, но не менее 20 млн рублей и не более 500 млн рублей [5]. Параллельно с декабря 2024 года введена уголовная ответственность по ст. 272.1 УК РФ — до 10 лет лишения свободы [10].

В этом контексте вопрос «как дать разработчикам и аналитикам данные для работы, не рискуя нарушить закон» перестал быть академическим. Он стал вопросом выживания бизнеса. Три технических подхода претендуют на ответ: маскирование, обезличивание и синтетические данные. Разберём каждый.


Три подхода: в чём принципиальная разница

Маскирование (data masking)

Маскирование — это преобразование реальных данных таким образом, чтобы скрыть идентифицирующую информацию, сохранив при этом структуру и форматирование данных. Номер карты 4276 \\\\ \\\\ 7891, имя «Иван» → «Антон», дата рождения 15.03.1985 → 22.07.1988. Исходная структура базы данных не меняется.

Существует статическое маскирование (данные изменяются в копии базы раз и навсегда) и динамическое (данные маскируются «на лету» при каждом обращении, исходник остаётся нетронутым). В качестве алгоритмов применяются псевдонимизация, обфускация и скремблирование [12].

Ключевое юридическое ограничение: даже хорошо маскированные данные в большинстве трактовок российского и европейского права остаются персональными данными, поскольку теоретически сохраняется возможность их восстановления. Особенно это касается псевдонимизации с хранением таблицы соответствий.

Обезличивание/анонимизация

Обезличивание по ФЗ-152 — это «действия, в результате которых становится невозможным без использования дополнительной информации определить принадлежность персональных данных конкретному субъекту» [2]. Принципиальное отличие от маскирования: правильно выполненное обезличивание выводит данные из-под режима персональных данных.

С 1 сентября 2025 года Приказ РКН № 140 закрепил пять официальных методов обезличивания [4]:

  1. Введение идентификаторов (псевдонимизация с уничтожением таблицы соответствий)
  2. Изменение состава или семантики (удаление, обобщение: возраст «25» → «20–30 лет»)
  3. Декомпозиция (разбиение массива на несколько частей с раздельным хранением)
  4. Перемешивание (перестановка записей так, что связь атрибутов с субъектом теряется)
  5. Агрегирование, маскирование и техники, затрудняющие реидентификацию [3]

Новшество 233-ФЗ: с 1 сентября 2025 года обезличенные данные можно обрабатывать без согласия субъекта в статистических, исследовательских и технологических целях, в том числе для обучения ИИ [17]. Это существенно расширяет легальное пространство для аналитики и разработки.

Синтетические данные

Синтетические данные — это искусственно созданная информация, которая воспроизводит статистические свойства, паттерны и распределения реальных данных, но не содержит никакой реальной информации о конкретных людях [8]. Это не трансформация реальных данных — это создание новых данных «с нуля», хотя и на основе статистической модели реальных.

Методы генерации делятся на три класса:

  1. Rule-based (на основе правил): разработчик задаёт правила, система генерирует данные. Просто, дёшево, но ограничено реалистичностью.
  2. Statistical/model-based: статистическая модель, обученная на реальных данных, генерирует новые записи. Более реалистично, но требует доступа к реальным данным на этапе обучения модели.
  3. Generative AI (GAN, VAE, LLM-based): нейронные сети воспроизводят сложные зависимости в данных. Максимальная реалистичность, но высокие требования к квалификации.

Принципиальное преимущество: синтетические данные не являются персональными данными, поскольку не привязаны ни к одному реальному человеку. Это полностью снимает вопрос о правовом статусе таких данных.


Российский регуляторный контекст: что изменилось к 2025–2026 годам

За последние два года российское законодательство о персональных данных претерпело фундаментальные изменения, которые напрямую влияют на выбор технического подхода к защите данных в тестовых и аналитических средах.

Первое ключевое изменение — оборотные штрафы. С 30 мая 2025 года вступил в силу ФЗ-420, вводящий прогрессивную шкалу штрафов за утечки. Штраф за утечку данных 1000–10 000 субъектов — от 3 до 5 млн рублей. За утечку данных более 100 000 субъектов — от 10 до 15 млн рублей. За повторную утечку — оборотный штраф от 1% до 3% выручки, но не менее 20 млн и не более 500 млн рублей [5]. Для банков расчёт идёт от собственных средств на дату нарушения.

Второе изменение — новый режим обезличивания. ФЗ-233 от 8 августа 2024 года и Приказ РКН № 140 от 19 июня 2025 года создали принципиально новую правовую рамку. Теперь закон впервые формально разделяет «маскирование» и «обезличивание», закрепляет пять методов и прямо разрешает использовать обезличенные данные без согласия субъекта для ряда целей [3].

Третье изменение — уголовная ответственность. С декабря 2024 года в УК РФ введена ст. 272.1, предусматривающая до 10 лет лишения свободы за незаконное использование, передачу, сбор или хранение персональных данных [10].

Четвёртое изменение — обязательная передача обезличенных данных государству. С 1 сентября 2025 года операторы ПДн, состоящие в реестре РКН и соответствующие ряду требований, обязаны передавать обезличенные данные в государственную информационную систему по запросу Минцифры [4]. Это создаёт новый контекст для формализации процессов обезличивания.

Практический вывод: использование реальных производственных данных в тестовых средах стало юридически неприемлемым риском для большинства российских компаний. Вопрос не «нужно ли защищать тестовые данные», а «каким методом это делать грамотнее».


Где каждый метод работает лучше: разбор сценариев

Тестирование и разработка (DevOps/QA)

Тестовая среда — это исторически главная точка проникновения персональных данных в несанкционированные руки. В России DevOps внедрён более чем в 80% организаций, что превышает показатели Европы и Америки [71]. Но при этом, по данным K2View, только 7% компаний в мире полностью соблюдают регуляторные требования в тестовых средах [18].

Для QA и разработки маскирование — традиционный первый выбор: оно сохраняет реальную структуру БД, референциальную целостность и форматы данных, что критично для тестирования унаследованных систем и интеграционных сценариев [9]. Российский рынок решений по маскированию вырос в 2023–2024 годах: продуктами заинтересовались банки, производственные компании и крупные ретейлеры [16].

Однако у маскирования есть существенный минус в контексте DevOps: оно создаёт зависимость от производственных данных. Разработчик не может получить тестовый датасет самостоятельно — необходим доступ к реальной базе, её копирование, маскирование, доставка. Это создаёт задержки, особенно болезненные в CI/CD-пайплайнах.

Синтетические данные решают эту проблему: они генерируются по требованию, без доступа к реальным данным, и позволяют создавать нужное количество записей с нужными характеристиками, включая граничные и аномальные случаи. По данным Perforce Delphix, от 62% до 74% крупных предприятий в мире уже используют синтетические данные именно для тестирования и разработки [8].

Оптимальный выбор для DevOps/QA: маскирование — для регрессионного тестирования с реальными структурами, синтетика — для нагрузочного тестирования, тестирования граничных случаев и обеспечения независимости разработчиков от производственных баз.

Аналитика и BI

Аналитические задачи, как правило, не требуют доступа к данным конкретного человека — они работают с агрегатами, трендами, паттернами. Именно для аналитики обезличивание в его российском правовом понимании наиболее органично.

Обезличенные данные с 1 сентября 2025 года можно без согласия субъектов использовать для статистики и аналитики, при условии соблюдения требований Приказа № 140 [17]. Это создаёт легальный путь для построения аналитики поверх обезличенных массивов без необходимости хранить «сырые» ПДн в аналитических системах.

Синтетические данные тоже применимы в аналитике, особенно когда исходных данных мало или они несбалансированы. Классический пример — антифрод-модели: мошеннических транзакций в реальных данных катастрофически мало. Синтетические данные позволяют «дорастить» редкий класс до нужного объёма [2].

Обучение моделей ИИ

Это сценарий, где синтетические данные имеют наибольшее конкурентное преимущество. Gartner прогнозирует, что к 2028 году синтетические данные составят 60% от общего объёма данных, используемых для обучения ИИ [7]. В 2025 году Gartner включил синтетические данные в число ключевых трендов аналитики и ИИ, прямо назвав их инструментом обеспечения приватности при разработке ИИ-систем [11].

Синтетические данные позволяют: обучать модели без риска нарушить ФЗ-152; симулировать редкие события (мошенничество, аварии, медицинские осложнения); устранять дисбаланс классов; экспортировать данные для обучения в облаке или передавать внешним подрядчикам без правовых рисков.

Передача данных подрядчикам и внешним партнёрам

Это один из самых рискованных сценариев с точки зрения ФЗ-152: передача ПДн третьим лицам требует правового основания — как правило, договора поручения и согласия субъектов. Синтетические данные полностью снимают эту проблему: передавая набор синтетических данных внешней команде, компания передаёт не ПДн, а статистическую модель реальности.


Ахиллесова пята маскирования: риск реидентификации

Маскирование кажется надёжным — данные «закрыты», структура сохранена. Но академические исследования последних лет бросают этому ощущению серьёзный вызов.

Исследование, опубликованное в Springer в 2025 году, показало: зная только формат маскированных данных (то есть, по сути, не видя самих данных), атакующий способен восстановить реальные записи через атаки реидентификации [14]. Особую роль играет понятие «квазиидентификаторов» — атрибутов, которые по отдельности не идентифицируют человека, но в комбинации — могут. Исследование Georgetown Law, на которое ссылается ISACA, показало: более половины населения США можно реидентифицировать, зная лишь три атрибута — пол, дату рождения и почтовый индекс [13].

В российском контексте это не абстрактная угроза. Аналитик, получивший «обезличенную» выгрузку клиентов банка с полями «регион», «возраст», «доход» и «статус клиента», при наличии публично доступных данных и достаточной мотивации может восстановить значительную часть личностей.

Фундаментальное правило, которое часто игнорируется: маскирование скрывает прямые идентификаторы, но не уничтожает уникальность записи. Обезличивание по российскому праву требует именно уничтожения возможности идентификации — и именно поэтому закон разделяет эти два понятия.

Один из российских экспертов в сфере ИБ обращает внимание на ещё один аспект: «Основной минус деперсонализации заключается в том, что крайне сложно "сшить" данные, полученные из разных источников» [15]. Это делает обезличенные данные менее удобными для сложной аналитики, но одновременно более защищёнными.


Слабые стороны синтетических данных

Синтетические данные — не серебряная пуля. Gartner в своём прогнозе на 2025 год прямо предупреждает: критические сбои в управлении синтетическими данными будут угрожать AI governance, точности моделей и соответствию требованиям [12]. Это предостережение стоит воспринять всерьёз.

Основные риски синтетических данных:

Первый риск — «утечка данных через модель». Если синтетические данные генерируются статистической моделью, обученной на реальных данных, модель теоретически «запоминает» обучающие примеры. Особенно уязвимы уникальные или редкие записи: если в обучающей выборке был всего один клиент с редким сочетанием характеристик, генеративная модель может «воспроизвести» его с высокой точностью. Это называется «memorization attack» и является активной областью исследований.

Второй риск — потеря реалистичности. Синтетические данные хорошо воспроизводят статистические распределения, но могут плохо воспроизводить редкие, но реальные паттерны поведения. Тест, написанный на синтетических данных, может успешно проходить в тестовой среде и падать на производстве, столкнувшись с нестандартным сочетанием значений.

Третий риск — сложность валидации. Как убедиться, что синтетические данные достаточно похожи на реальные? Метрики качества (statistical fidelity, privacy score, utility metrics) существуют, но требуют компетенций, которых у большинства российских команд пока нет.

Четвёртый риск — высокий порог входа. Генерация по-настоящему качественных синтетических данных — это не задача одного дня. Для сложных реляционных баз данных с множеством связей и бизнес-правил это трудоёмкий проект.


Продвинутые техники: k-анонимность, дифференциальная приватность, псевдонимизация

Помимо базовых методов, существует несколько математически строгих подходов, о которых важно знать специалистам, занимающимся защитой данных.

k-Анонимность — модель, предложенная Sweeny в 2002 году. Набор данных удовлетворяет k-анонимности, если каждая запись неотличима хотя бы от k-1 других записей по набору квазиидентификаторов. Например, при k=5 каждый «клиент» из выборки неотличим от четырёх других. k-Анонимность интуитивно понятна и широко применяется, однако уязвима к атакам на основе знания предметной области и не защищает от атак «однородности» (когда все k записей имеют одинаковое значение чувствительного атрибута).

Дифференциальная приватность (Differential Privacy, DP) — математически строгая модель, введённая Cynthia Dwork. DP гарантирует: ни один результат запроса к базе данных не даёт значимой информации о том, присутствует ли конкретная запись в базе. Это достигается добавлением контролируемого «шума» к результатам. Сравнительное исследование Springer 2025 года показало: дифференциальная приватность с параметром ε=1.0 достигает риска реидентификации менее 0.1% при незначительной потере полезности данных (ΔAUC ≈ 0) [17]. По мнению исследователей, именно DP сегодня является «золотым стандартом» защиты приватности.

Псевдонимизация — замена идентифицирующих атрибутов на псевдонимы с хранением таблицы соответствий в защищённом месте. В отличие от необратимого обезличивания, псевдонимизация обратима при наличии ключа. Российское законодательство трактует псевдонимизацию как форму обезличивания («введение идентификаторов» по Приказу № 140), однако обращает особое внимание: таблица соответствий должна храниться отдельно и не передаваться третьим лицам [15].


Практические рекомендации: чек-лист выбора метода

Перед выбором метода защиты данных ответьте на следующие вопросы:

  1. Нужна ли вам реальная структура и референциальная целостность базы данных? Если да — маскирование предпочтительнее синтетики.
  2. Данные будут передаваться за пределы организации (подрядчикам, облачным сервисам, иностранным партнёрам)? Если да — синтетика или полное обезличивание обязательны.
  3. Данные используются для аналитики/статистики, а не для идентификации конкретных лиц? Если да — рассмотрите обезличивание по Приказу № 140: это легальный и экономически эффективный путь.
  4. Нужны граничные и аномальные случаи, которых нет в реальных данных? Синтетические данные — единственный вариант.
  5. Обрабатываются биометрические или специальные категории ПДн? Повышенные требования по Приказу № 140: биометрические данные исключаются из составов, передаваемых в ГИС [3].
  6. Ваша команда имеет опыт оценки качества синтетических данных? Если нет — начните с маскирования и параллельно инвестируйте в компетенции.
  7. Есть ли у вас актуальная «карта ПДн» — понимание, где и какие данные хранятся? Без неё невозможно применить ни один из методов корректно.
  8. Используете ли вы динамическое маскирование? Оно предпочтительнее статического: исходник не копируется и не хранится в тестовой среде.

Типичные ошибки и как их избежать

Ошибка первая: считать маскирование и обезличивание синонимами. Это не одно и то же. Маскированные данные, как правило, остаются персональными. Обезличенные по Приказу № 140 — нет. Разница критична с точки зрения ФЗ-152.

Ошибка вторая: хранить маскированные и исходные данные в одном месте. Это прямо запрещено новым регулированием для обезличенных данных и создаёт очевидный риск для маскированных [16].

Ошибка третья: думать, что шифрование = обезличивание. Шифрование без уничтожения ключа прямо не признаётся полноценным обезличиванием по Приказу № 140 [3].

Ошибка четвёртая: использовать синтетические данные без валидации качества. Если модель обучена на нерепрезентативной выборке, синтетика воспроизведёт искажения реальных данных, а не их паттерны.

Ошибка пятая: применять один метод ко всем данным. Разные таблицы одной базы требуют разных подходов: имена и паспорта — маскирование или обезличивание, транзакционные данные — синтетика, агрегаты — обезличивание.

Ошибка шестая: не знать, где вообще находятся ПДн. По данным опроса «К2 Кибербезопасность» и ГК «Гарда», 42% российских ИТ/ИБ-руководителей не знают о технологиях маскирования и обезличивания [15]. Но проблема глубже: большинство компаний не имеют актуального реестра систем, содержащих ПДн. Без этого любой выбор метода защиты становится угадыванием.


Будущее: куда движётся рынок

Рынок синтетических данных находится в фазе активного роста. По прогнозу Gartner, к 2028 году синтетические данные составят 60% объёма данных для обучения ИИ [7]. В марте 2025 года Gartner включил синтетические данные в список ключевых трендов аналитики и ИИ, прямо назвав их инструментом обеспечения приватности [11].

В России этот тренд также набирает силу. На визионерском вечере Ассоциации больших данных (АБД) в конце 2024 года была анонсирована идея создания биржи синтетических данных на уровне стран БРИКС [7].

Несколько технологических направлений будут определять рынок в ближайшие три года:

Первое — генеративный ИИ для создания синтетики. GAN (Generative Adversarial Networks) и VAE (Variational Autoencoders) уже применяются для генерации табличных данных, изображений и текстов. LLM-based синтез данных, в том числе использование больших языковых моделей для генерации структурированных записей, — активно развивающееся направление.

Второе — Privacy-Enhancing Technologies (PET). Комбинация дифференциальной приватности, федеративного обучения и синтетических данных создаёт новые возможности для обмена данными между организациями без раскрытия ПДн. Это особенно актуально для банков, страховщиков и медицинских организаций.

Третье — автоматизация обнаружения и инвентаризации ПДн. Прежде чем защищать данные, нужно знать, где они находятся. Инструменты автоматического обнаружения ПДн в корпоративных системах становятся необходимым предварительным условием для любого из рассмотренных методов.

Четвёртое — регуляторное давление продолжит усиливаться. Оборотные штрафы с 30 мая 2025 года — только начало. Правоприменительная практика будет развиваться, и уже в ближайшее время количество реально взысканных штрафов может существенно возрасти [6].


Как «Пятый фактор» помогает контролировать персональные данные на всём жизненном цикле

Выбор между маскированием, обезличиванием и синтетическими данными — это правильный вопрос. Но он предполагает другой, предшествующий вопрос: а вы вообще знаете, где у вас находятся персональные данные?

Именно здесь находится слепая зона большинства российских компаний. ИТ-ландшафт постоянно меняется: появляются новые поля в базах данных, новые сервисы, интеграции с подрядчиками. Без актуальной «карты ПДн» компания не знает, какие данные нуждаются в маскировании, какие — в обезличивании, а какие уже утекли через забытую интеграцию.

Платформа «Пятый фактор» решает именно эту задачу: автоматическое обнаружение, инвентаризация и контроль персональных данных в корпоративных системах — БД, хранилища, почта, AD/LDAP, CRM, 1С, API. Ключевое отличие: платформа работает только с метаданными, структурой и агрегатами, не передавая и не храня «сырые» ПДн. Это принцип privacy-by-design на уровне самого инструмента контроля.

Практический результат — живая «карта ПДн»: где и какие данные есть, кто их владелец, что изменилось с последней проверки. Платформа замечает новые риски раньше, чем они превращаются в инцидент — новые поля в БД, новые интеграции, неожиданное появление ПДн в нетипичных местах.

В контексте выбора метода защиты данных это означает: прежде чем решать, маскировать или генерировать синтетику, нужно знать полный периметр данных. «Пятый фактор» даёт именно это понимание, сокращая время аудита с недель до часов и существенно повышая готовность к проверкам Роскомнадзора.


Заключение: что делать прямо сейчас

Выбора «один метод для всего» не существует. Правильный ответ — это архитектура, в которой каждый метод занимает своё место:

Маскирование — для быстрого QA и регрессионного тестирования, когда необходима реальная структура данных и референциальная целостность. Предпочтительно динамическое маскирование.

Обезличивание по Приказу РКН № 140 — для аналитики, отчётности и статистики. С 1 сентября 2025 года это полностью легальный и достаточно гибкий инструмент для широкого круга задач.

Синтетические данные — для обучения моделей ИИ, нагрузочного тестирования, генерации граничных случаев и передачи данных внешним партнёрам.

Три первоочередных шага для компании, которая хочет навести порядок:

  1. Провести инвентаризацию: где в компании хранятся персональные данные, в каких системах, кто имеет к ним доступ. Без этого невозможно применить ни один из методов корректно.
  2. Оценить сценарии использования данных: для разных задач — разные методы. Создайте матрицу «сценарий → метод → ответственный».
  3. Начать с маскирования для тестовых сред и параллельно инвестировать в компетенции по синтетическим данным. Это даст быстрый результат сейчас и стратегическое преимущество в горизонте 1–2 лет.

Регуляторная нагрузка будет только расти. Штрафы, введённые в 2025 году, — это не потолок, а начало. Компании, выстроившие системный подход к работе с данными сейчас, окажутся в принципиально лучшей позиции при первой же проверке Роскомнадзора или первом инциденте.


Источники

[1] Приказ Роскомнадзора от 19.06.2025 № 140 об утверждении требований и методов обезличивания ПДн — <https://www.consultant.ru/law/hotdocs/90337.html>

[2] Обезличивание персональных данных с 1 сентября 2025 года: порядок — <https://www.kdelo.ru/art/386102-obezlichivanie-personalnyh-dannyh-21-m6>

[3] Новые правила обезличивания ПДн с 1 сентября 2025 года / Хабр — <https://habr.com/ru/articles/931348/>

[4] Инструкция по обезличиванию данных с 1 сентября 2025 / Klerk.ru — <https://www.klerk.ru/blogs/klerk/660468/>

[5] Новые штрафы за утечку персональных данных с 30.05.2025 / КонсультантПлюс — <https://www.consultant.ru/legalnews/28492/>

[6] Штрафы за утечку ПДн: Россия на восьмом месте в мире / Habr/InfoWatch — <https://habr.com/ru/companies/infowatch/news/989884/>

[7] Синтетические данные станут основным материалом для обучения ИИ к 2028 г. / ComNews — <https://www.comnews.ru/content/236938/2024-12-19/2024-w51/1008/sinteticheskie-dannye-stanut-osnovnym-materialom-dlya-obucheniya-ii-k-2028-g>

[8] Synthetic Test Data vs. Test Data Masking / Perforce Delphix — <https://www.perforce.com/blog/pdx/synthetic-test-data-vs-test-data-masking>

[9] Data Synthesis vs Data Masking / Tonic.ai — <https://www.tonic.ai/guides/data-synthesis-vs-data-masking>

[10] Персональные данные: чего ждать в 2025 году? / itsec.ru — <https://www.itsec.ru/articles/personalnye-dannye-chego-zhdat-v-2025-godu>

[11] Gartner Identifies Top Trends in Data and Analytics for 2025 — <https://www.gartner.com/en/newsroom/press-releases/2025-03-05-gartner-identifies-top-trends-in-data-and-analytics-for-2025>

[12] Gartner Announces Top Data & Analytics Predictions 2025 — <https://www.gartner.com/en/newsroom/press-releases/2025-06-17-gartner-announces-top-data-and-analytics-predictions>

[13] Re-identification Risks: Reidentifying the Anonymized / ISACA 2024 — <https://www.isaca.org/resources/news-and-trends/industry-news/2024/reidentifying-the-anonymized-ethical-hacking-challenges-in-ai-data-training>

[14] Pitfalls of Data Masking Techniques: Re-identification Attacks / Springer 2025 — <https://link.springer.com/chapter/10.1007/978-3-031-94455-0_19>

[15] В России о маскировании данных почти ничего не знают даже специалисты / ComNews — <https://www.comnews.ru/content/233287/2024-05-22/2024-w21/1008/rossii-o-maskirovanii-dannykh-pochti-nichego-ne-znayut-dazhe-specialisty>

[16] Маскирование данных в 2024 году: как выбрать подрядчика / IT-World.ru — <https://www.it-world.ru/security/73grcqkpjh0cw8kowwgwokg4sg8ocos.html>

[17] Comparative Evaluation of K-Anonymity, Differential Privacy, and Pseudonymization / Springer 2025 — <https://link.springer.com/chapter/10.1007/978-3-032-06497-4_56>

[18] Synthetic vs. Production Data: Choosing the Right Test Data Strategy / qalified.com — <https://qalified.com/blog/test-data-synthetic-vs-production/>

Быстрые вопросы и ответы

Что такое синтетические данные?

Искусственно созданная информация, не содержащая реальных данных о людях.

Какое главное преимущество маскирования?

Сохранение структуры и формата данных при скрытии идентифицирующей информации.

Что такое обезличивание?

Процесс, при котором невозможно определить принадлежность данных конкретному субъекту.

Какие штрафы за утечку данных в России?

Штрафы могут достигать 3% годовой выручки и составлять от 20 до 500 млн рублей.

Когда вступают в силу новые правила по обезличиванию?

С 1 сентября 2025 года.

Какой метод лучше для тестирования?

Маскирование часто является первым выбором из-за сохранения структуры данных.

Нужна консультация по вашему контуру?
Покажем, где появляются персональные данные и какие риски требуют внимания в первую очередь.