Как мы разработали AI модель, позволяющую экономить до $10 млн на бурении одной скважины

ASTERA.in
7 min readJul 23, 2018

--

В компании Astera мы привыкли иметь дело с задачами из различных областей производства. И иногда интересно обнаружить как один и тот же метод хорошо работает в совершенно разных областях. Месяц назад к нам обратились с просьбой посмотреть данные наклонно-направленного бурения и сказать — возможно ли предсказать инциденты заранее, и тем самым сократить издержки на устранении последствий.

Наклонно-направленное бурение

Метод сооружения скважин, при котором они имеют сложный пространственный профиль, включающий в себя вертикальный верхний интервал, после которого следуют участки с заданными отклонениями от вертикали.

Наиболее эффективная область использования наклонно-направленного бурения — при разработке месторождений в акваториях, в болотистых или сильно пересечённых местностях и в случаях, когда строительство буровых может нарушить условия охраны окружающей среды. Наклонно-направленное бурение применяют также при бурении вспомогательных скважин для глушения открытых фонтанов, при многоствольном бурении или отклонении нижней части ствола вдоль продуктивного горизонта с целью увеличения дренажа.

Наклонно-направленное бурение нефтяных и газовых скважин осуществляется по специальным профилям. Профили скважин могут варьироваться, но при этом верхний интервал ствола наклонной скважины должен быть вертикальным, с последующим отклонением в запроектированном азимуте.

Существенную опасность представляют различные инциденты, возникающие при таком сложном виде бурения. Большое количество непредвиденных инцидентов может привести к порче оборудования, лишней трате расходных материалов, простоям техники и персонала и даже травмам. Практически всегда инциденты приводят к существенному увеличению сроков бурения скважины по сравнению с запланированным и существенным материальным убыткам.

В рамках данной статьи мы остановимся на рассмотрении 1-го вида инцидентов — затяжек (Drags).

Затяжкой называется увеличенное по сравнению с расчетным сопротивление движению инструментов в скважине.

Причины затяжек:

  1. заклинивание инструмента посторонними предметами;
  2. заклинивание инструмента при обвалах в скважине;
  3. заклинивание инструмента при сужении ствола скважины;
  4. образование желобов в стенках скважины;
  5. прилипание инструмента и его прижатие к стенке скважины под действием перепада давления скважина-пласт.

Исходя из опыта предотвращение возникновения затяжек позволяет экономить до 10% стоимости бурения скважины, стоимость же устранения одной затяжки примерно равна 20000–30000 $.

Если персонал будет знать заранее о моменте наступления затяжки, то это позволит изменить параметры бурения для ее предотвращения или подготовить комплекс мероприятий для более быстрого и менее затратного ее устранения.

К сожалению, знать заранее о моменте наступления затяжки невозможно, однако, при помощи методов обработки данных и машинного обучения можно построить модель, позволяющую прогнозировать моменты высокой вероятности наступления затяжек, что позволит персоналу заранее перейти в режим повышенного внимания и минимизировать затраты в случае если затяжка все-таки случится.

Используемые технологии

Машинное обучение — это математическая дисциплина (раздел искусственного интеллекта), использующая разделы математической статистики, численных методов оптимизации, теории вероятности, дискретного анализа, и извлекающая знания из данных.

В данном случае мы говорим о прогнозной модели построенной при помощи обучения с учителем. Обучение с учителем — один из способов машинного обучения, который использует размеченные примеры для построения прогнозной модели.

Прогнозная модель — это математическая модель, построенная по историческим архивным данным эксплуатации технической системы, позволяющие предсказать поведение системы. Например, математическая модель может быть построена для предсказания с требуемой точностью отклонения поведения системы от нормального, в данном случае затяжки бурового инструмента.

Задача в данном случае формулируется так: не менее чем за 30 мин спрогнозировать момент с высокой вероятностью затяжки инцидент для повышения внимания и подготовки к ответным мерам.

Исторические данные в нашем случае представляют из себя цифровые данные технологического процесса бурения, которые регулярно агрегируются в реальном времени при помощи SCADA-систем вместе с комплексом различных датчиков, установленных на ключевых участках и системах бурильной установки с дальнейшей архивацией данных на цифровых носителях. Данные доступны в режиме реального времени во время бурения в рамках автоматизированной системы управления бурением на рабочих местах операторов и другого персонала.

Первый этап: выбор данных

Примерный перечень агрегируемых цифровых параметров технологического процесса бурения скважины обычно включает:

BPOS (Hook Height / Block Position) — Высота крюка/положение талевого блока относительно стола ротора.

DBTM (Bit Depth) — Глубина долота.

DMEA (Hole True Measured Depth) — Общаяглубинаскважины.

ECD (Equivalent Circulating Density) — Эквивалентнаяциркуляционнаяплотность. Эффективная плотность, создаваемая циркулирующей жидкостью против пласта, которая учитывает падение давления в кольцевом пространстве над рассматриваемой точкой. ECD рассчитывается как: d + P / (0,052 * D), где d — масса бурового раствора (ppg), P — перепад давления в кольцевом пространстве между глубиной D и поверхностью (psi), а D — истинная вертикальная глубина (ноги). ECD является важным параметром во избежание ударов и потерь, особенно в скважинах, которые имеют узкое окно между градиентом трещины и градиентом порового давления.

HKLD (Weight On Hook) — Полная сила, тянущая крюк вниз. Эта общая сила включает в себя вес бурильной колонны в воздухе, бурильные штанги и любое вспомогательное оборудование, уменьшенное любой силой, которая имеет тенденцию уменьшать этот вес. Некоторые силы, которые могут уменьшить вес, включают трение вдоль стенок ствола скважины (особенно в отклоненных скважинах) и, что важно, плавучие силы на бурильной колонне, вызванные ее погружением в буровой раствор. Если BOP закрыты, любое давление в стволе скважины, действующее на площадь поперечного сечения бурильной колонны в BOP, также будет иметь усилие вверх.

RPM (Surface rotational speed) — скорость вращения буровой колонны (обороты в минуту).

SPPA (Stand Pipe Pressure) — Давление в стояке, это полная потеря давления в системе, которая возникает из-за трения жидкости. Это суммирование потерь давления в кольцевом пространстве, потери давления в бурильной колонне, потери давления в узле отверстия (BHA) и потери давления на долоте.

TFLO (Total flow rate of all active pumps) — Общий расход всех активных насосов.

Для построения модели прогнозирования был взят архив данных технологического процесса бурения скважины со следующими параметрами:

  1. 12 технологических параметров контроля процесса бурения.
  2. Интервал считывания данных ~ 10 секунд.
  3. Период сбора данных ~ 1 сутки (8672 строки).
  4. 8 фактов инцидентов-затяжек.
На графике представлен график изменения подмножества параметров технологического процесса. Выделен периодом затяжки, на котором видна остановка основных процессов бурения.

И тут нам бы хотелось сделать небольшое отступление. Дело в том что эти данные на графике показались нам весьма похожими на данные задачи, которую мы решали прежде. Поведение данных очень напомнило нам данные газотурбинных станций. И хотя параметры там были разумеется совсем другие, а сама задача состояла в том, чтобы предсказать необходимость проведения внеплановых промывок, мы решили попробовать метод, который уже есть в математическом ядре нашей программной платформы для обработки данных установок горизонтального бурения.

Как и в случае с газотурбинными установками, имеющиеся данные в их исходном “сыром” виде не годятся для обучения. Основные проблемы заключаются в большом количестве пропусков — когда для какого-либо момента времени данные по одному или нескольким параметрам отсутствуют по каким-либо причинам.

По ряду параметров доля таких пропусков выше 50%.

Вторая основная проблема - высокая степень взаимной линейной корреляции. На практике такая ситуация негативно сказывается на качестве обучения модели и ее эффективности в прогнозировании.

Также для обучения не нужно такое количество строк.

По итогам обработка данных состояла в следующем:

  1. Удаление из набора параметров с малым количеством уникальных значений.
  2. Заполнение устранимых пропусков (предыдущим значением/не более 10 пропусков).
  3. Удаление больших пропусков (полупустые строки и параметры в которых отсутствует 75% значений).
  4. Стандартизация (приведение признаков к нулевому математическому ожиданию и единичной дисперсии).
  5. Корреляционный анализ (удаление столбцов с коэффициентом линейной корреляции> 0.95).
  6. Поминутное усреднение значений.

Набор данных после обработки составил 1446 значений для 10 параметров.

Второй этап: формирование обучающей выборки для модели

Решим данную задачу как задачу классификации — то есть отнесение объекта к одной из категорий на основании его признаков. Объекты в данном случае — это усредненные поминутные наборы значений параметров из обработанного набора по всем параметрам или вектора данных.

В данном случае 2-х классовая классификация в которой класс “1” — это вектор, соответствующий моменту времени примерно за 30 мин до затяжки, или “ожидается затяжка”, класс “0” — вектор после которого на период времени>>30 минут затяжек не происходит (затяжка не ожидается).

На основе такого формирования классов подготовлена обучающая выборка: 62 вектора класса «1» (ожидается затяжка), 201 вектор класса «0» (затяжка не ожидается).

Предварительный анализ данных показал, что вектора разных классов вероятнее всего линейно не разделимы, поэтому для решения данной задачи выбираем одну из моделей с возможностью нелинейной разделимости классов.

У данной модели есть небольшой набор гиперпараметров, параметров, задаваемых для модели перед ее обучением. Для подбора оптимальных значений данных параметров используем метод кроссвалидации.

Подобранные в результате данной процедуры гиперпараметры (score = 0.97), используем для обучения модели.

В результате обученная модель показывает следующие результаты:

Модель среагировала 16 раз, из этих случаев 8 (50%) — прогнозы реальных затяжек, 8 (50%) — ложные срабатывания.

И это очень хороший результат для модели, на построение которой ушло всего 2 недели! Стоимость повышения внимания персонала при ложном срабатывании на порядки ниже убытков от инцидентов. Не будем так же забывать, что модель была обучена на небольшой выборке данных и дальнейшее обучение улучшит точность работы модели. Особое удовольствие эта задача доставила нам тем, что наши методы отлично показали себя при повторном применении.

Если у вас возникли вопросы или предложения — обращайтесь, мы с радостью обсудим ваши задачи и вместе подумаем, как их лучше решать.

Иван Исаев, СЕО ASTERA.in
Михаил Бояркин, ведущий инженер ASTERA.in

Еще больше разборов кейсов на astera.in

--

--