Задача конфиденциальности данных поставщика

1F team
oneFactor (Russia)
Published in
3 min readNov 30, 2021

Виктор Стрелков, директор по разработке oneFactor, выступил на конференции Intel® Experience Day 2021 с кейсом «Использование технологии Intel® Software Guard Extensions (Intel® SGX) для задач машинного обучения». oneFactor является разработчиком платформы SmartMachine для машинного обучения на глобальном графе клиентских связей, позволяющей конфиденциально объединять данные нескольких компаний с использованием аппаратного решения Intel SGX.

Платформ машинного обучения в России и в мире уже сотни, технология SGX позволила привнести в платформу ключевой дифференциатор — конфиденциальное совместное машинное обучение.

По результатам исследования компании oneFactor, добавление в признаковое пространство модели данных из нескольких доменных областей, например комбинация данных eCom и данных операторов связи, дает от 5 до 15% прироста точности данной модели.

Вместе с этим тренд на максимальную защиту данных только усиливается. Задача, поставленная для реализации — обеспечить конфиденциальность данных, загружаемых в платформу, от трех участников: от одного поставщика другому, от Data Scientist-а обучающего модель и от администратора платформы обучения.

Исследовав различные пути решения задачи защиты данных, разработчики oneFactor пришли к технологии Intel SGX, которая представляет собой набор инструкций процессора, позволяющий создавать защищённую область адресного пространства в том числе и от процессов с правами администратора. На базе данной технологии oneFactor разработал способ поставки данных в платформу без возможности компрометации.

Разработанное приложение «поднимается» как сервис на любом компьютере с поддержкой Intel SGX. Данный сервис предоставляет интерфейсы по загрузке данных, аттестации анклавов и выгрузке результирующих данных.

В первую очередь происходит аттестация анклава (подтверждение подлинности анклава), затем клиент создает защищенное соединение, по которому можно поставить свои данные. При аттестации анклава проверка происходит по двум идентификаторам: mr_signer — разработчик анклава, в данном случае oneFactor, и mr_enclave, конкретная сборка данного приложения. При пересборке mr_enclave меняется и oneFactor по защищенным каналам передает дата-провайдеру новый ID. Внешним сервисом подтверждения подлинности анклава также является Intel attestation server, аналог корневого центра сертификации.

После аттестации самого соединения анклав используется для хранения «секрета» дата-провайдера, в данном случае этим «секретом» является пара ключей (несимметричный алгоритм), которыми шифруется набор данных. Открытый ключ поставляется через соединение с анклавом внутрь и данные загружаются на компьютер, где развернут сервис SmartMachine, в зашифрованном виде. Это проделывают все поставщики данных, которые будут участвовать в обучении — загружают свои зашифрованные данные в обычную область на диск и «секреты», в данном случае открытый ключ, в зашифрованную область памяти.

Затем data-scientist, который одновременно может выступать и поставщиком данных, через привычный ему инструмент Jupyter Kernel заходит в ядро среды разработки, которое в свою очередь обращается к развёрнутому анклаву, в котором проходит машинное обучение.

Важно понимать, что это не кейс песочницы, в анклаве помимо защищенного ядра обучения существует также защищенное ядро исполнения. Архитектурно там расположен тот же самый анклав. После обучения модели в защищенном пространстве, аналитик публикует модель, то есть его модель поставляется в анклав исполнения и через небольшое время становится доступна для использования.

Как переход на технологию SGX 2.0 позволил ускорить обучение до 19 раз ранее было рассказано в публикации на Хабр.

Что же дальше? Виктор Стрелков поделился планами на 2022 год. По его словам, oneFactor реализует несколько улучшений платформы:

• динамически расширяемый по памяти анклав — позволит динамически расширять анклавы и сжимать после использования;

• использование локальной аттестации;

• возможность загрузки шифрованных эталонов для обучения.

Intel Experience Day — главное мероприятие Intel в России, на котором эксперты говорят о ключевых трендах, формирующих развитие ИТ-индустрии в России и в мире, представляют новейшие продукты компании, а также делятся опытом в создании передовых технологических решений на базе технологий Intel®.

Компания oneFactor (входит в «ИКС Холдинг») — ведущая российская IT-компания, лидер рынка безопасной монетизации данных, специализирующаяся на разработке решений для оптимизации ключевых бизнес-процессов на основе обработки больших массивов данных.

--

--