Применение интеллектуальных алгоритмов анализа данных для решения прикладных задач нефтяного инжиниринга

25.12.2018

Источник: Журнал «PROнефть»

Application of data mining for handling applied problems of petroleum engineering 

УДК 622.276.1/.4.001

М.В. Симонов, Д.С. Перец, В.С. Котежеков
Научно-Технический Центр «Газпром нефти» (ООО «Газпромнефть НТЦ»)

Электронные адреса: Simonov.MV@gazpromneft-ntc.ru, Perets.DS@gazpromneft-ntc.ru

Ключевые слова: машинное обучение, интеллектуальный анализ данных, забойное давление, поиск аномальных значений, сглаживание

M.V. Simonov, D.S. Perets, V.S. Kotezhekov
Gazpromneft NTC LLC, RF, Saint-Petersburg

The fields of application of machine learning in the oil industry are actively expanding. Despite this, there are currently no convenient and simple tools that allow you to use machine learning methods to solve applied problems without special programming skills. The purpose of this work is to create a program that will allow to carry out data mining using machine learning algorithms and solve common problems associated with the analysis and construction of predictive models. Created an algorithm to implementation typical stages of the data analysis process (detection of abnormal values, filling the skipped values, smoothing the time series, reducing the dimension of the original feature space) and build a predictive models. Test examples showed that the developed program allows to construct a predictive models, as well as the search for significant features, which is applicable both for the construction of surrogate models for the optimization of oilfield development and for an analysis of hydrodynamic connectivity of wells.

Keywords: machine learning, data science, bottomhole pressure, anomaly detection, smoothing

DOI: 10.24887/2587-7399-2018-4-48-51

Введение

Машинное обучение занимает все большее место в различных областях деятельности благодаря универсальности и возможности обрабатывать большое количество информации. Активно расширяются сферы применения машинного обучения и в нефтяной промышленности. Несмотря на это, в настоящее время отсутствуют удобные и простые инструменты, позволяющие использовать методы машинного обучения для решения прикладных задач без специальных навыков программирования. Целью данной работы является создание программы, которая даст возможность проводить интеллектуальный анализ данных при помощи алгоритмов машинного обучения и решать типовые задачи, связанные с анализом и построением прогнозных моделей. Функционал инструмента должен включать решение следующих задач: выявление аномальных значений (выборов); заполнение пропущенных значений; сглаживание временных рядов; снижение размерности исходного пространства признаков при помощи выделения наиболее значимых признаков; вычисление прогнозных значений целевой функции.

Описание реализованных алгоритмов

1. Детектирование аномальных значений 

Для детектирования аномальных значений используется алгоритм Local Outlier Factor [1, 2]. Для каждой точки x формируется множество-контекст Q(x, k), состоящее из k соседей. Предполагается, что расстояние от анализируемой точки до окрестности распределено нормально, следовательно, можно вычислить «стандартное расстояние» 

где q – элемент множества соседей Q(x, k). Мера выбросов рассчитывается по формуле: 

где Eq ∈ Q(x, k) [pdist(q, k)] – математическое ожидание расстояния от анализируемой точки до окрестности. Точки с низкими значениями этой меры считаются выбросами.

2. Заполнение пропущенных значений 

Заполнение пропущенных значений выполняется при помощи метода «Градиентный бустинг» [3, 4]. Пусть имеется набор пар признаков х и целевых переменных у{(х i, yi )}i =1,…, n, на котором будет восстанавливаться зависимость вида у = f(х ) приближением у ≈ f ˇ  (x) Критерием для определения лучшего приближения является функция потерь L(y, f ), которую необходимо минимизировать

где ˇ θ – параметры каждого дерева решений. Оптимальные параметры ˇ θ приближаются итеративно

Для минимизации Lθ(ˇ θ) используется градиентный спуск. В качестве f(xi, ˇ θ) выступают деревья решений.

3. Сглаживание данных 

Для сглаживания данных используется параметрический фильтр Savitzky–Golay [5]. Пусть данные представляют собой набор {х i,y i}, i = {1, 2,…, n} (х – независимая переменная, y – наблюдаемая переменная). В таком случае сглаженная функция Y вычисляется по формуле

4. Прогнозная модель 

Отбор значимых признаков и построение прогнозной модели выполняются при помощи случайного леса (Random Forest) [6]. Случайный лес – это алгоритм машинного обучения, который является ансамблем решающих деревьев и представляет собой реализацию метода бэггинга над решающими деревьями. При обучении последних для каждого разбиения обучающая выборка признаков формируется из некоторого случайного подмножества признаков.

Примеры решения тестовых задач

Для тестирования возможностей разработанной программы было решено несколько тестовых задач. Первая задача состояла в создании прогнозной модели для определения накопленной добычи за 15 лет при варьировании различных геологических параметров для синтетического месторождения (рис. 1).

рис. 1. Синтетическая модель месторождения (вертикальными линиями обозначены скважины) 

На основе результатов 100 расчетов гидродинамического симулятора с помощью разработанной программы было выполнено машинное обучение модели, что позволило прогнозировать накопленную добычу нефти по месторождению при различных значениях проницаемости прослоев, критической водонасыщенности, остаточной нефтенасыщенности, проводимости трещины, высоты водонефтяного контакта. Результаты расчетов на тестовой выборке из 40 наборов параметров представлены на рис. 2.

рис. 2. Прогноз накопленной добычи месторождения, выполненный двумя методами

Таким образом, используя разработанную программу можно прогнозировать результаты гидродинамического расчета с точностью до 99 %. При этом время расчета будет составлять несколько секунд, что в несколько десятков раз быстрее, чем на гидродинамическом симуляторе. Для тестирования возможностей алгоритма на примере синтетического месторождения также была решена задача поиска нагнетательных скважин, изменение режимов работы которых влияет на показатели эксплуатации добывающей скважины. Исследовалась модельная система разработки с семью вертикальными скважинами: (скв. 1–6 – нагнетательные, скв. 7 – добывающая) (рис. 3).

рис. 3. Синтетическая модель элемента разработки

Скв. 5 и 6 не имеют гидродинамической связи с добывающей скважиной. Данные закачки по всем нагнетательным скважинам использовались как входные переменные (вектор X), добыча по добывающей скважине – как выходной параметр (вектор Y). Необходимо определить какие элементы вектора Х, соответствующие номеру нагнетательной скважины, имеют наименьшую статистическую значимость. С помощью разработанной программы были корректно выделены наименее значимые скв. 5 и 6 (рис. 4).

рис. 4. Синтетическая модель влияния нагнетательных скважин на показатели эксплуатации добывающей скважины

Таким образом, разработанная программа позволяет определить гидродинамическую связь между скважинами на основе данных их эксплуатации. После проведения серии тестов с использованием синтетических данных разработанный алгоритм был применен для определения забойного давления скважины без информации о давлении на приеме насоса. При расчете забойного давления учитываются данные о наличии датчика давления на приеме насоса, при их отсутствии расчет выполняется по динамическому уровню. Давление, рассчитанное по динамическому уровню, может существенно отличаться от давления, определенного через давление на приеме насоса. Эта разница обусловлена в первую очередь большими погрешностями при измерении динамического уровня и сложностью корректного учета многофазного потока в стволе скважины. Если отсутствует информация о давлении на приеме насоса, то оценка забойного давления таким способом может иметь существенную погрешность. Вследствие этого могут быть приняты ошибочные решения по контролю режима эксплуатации скважины и оптимизации скважинного оборудования, что может приветси к неоптимальным режимам эксплуатации скважины, а также ее остановке и потере добычи нефти. С помощью разработанной программы была настроена модель машинного обучения, которая на основании данных технологического режима эксплуатации скважины (глубина спуска насоса, глубина до верхних отверстий перфорации, динамический уровень, затрубное давление, объемный коэффициент нефти, плотность воды и нефти, газовый фактор, давление насыщения, вязкость нефти в пластовых условиях, дебит жидкости, обводненность) дает прогноз забойного давления. Настроенный алгоритм позволяет определитьзабойное давление без данных о приеме насоса. При этом получаемая погрешность значительно меньше, чем по формулам, используемым при расчете технологического режима (рис. 5). Таким образом, применение предложенного алгоритма позволяет снизить число неэффективных оптимизаций работы насоса. 

рис. 5. Распределение погрешности восстановления забойного давления в условиях отсутствия или неисправности датчиков давления на приеме электроцентробежного насоса

Заключение

Машинное обучение дает возможность получать новые знания на основе имеющейся информации и автоматизировать рутинные процессы. Однако отсутствие удобных и универсальных инструментов до настоящего времени не позволяло активно применять алгоритмы машинного обучения для решения задач нефтяного инжиниринга. В ходе выполнения данных работ был разработан инструмент, обеспечивающий проведение интеллектуального  анализа данных при помощи алгоритмов машинного обучения для быстрого и эффективного решения большого числа прикладных задач нефтяного инжиниринга. 

Тестовые примеры показали, что разработанная программа позволяет решать задачи построения прогнозных моделей, а также поиска значимых признаков, что применимо как для построения метамоделей для оптимизации системы разработки месторождения, так и для анализа гидродинамической связи между скважинами. Разработанная программа также дала возможность решить задачу определения забойного давления по данным технологического режима эксплуатации скважины, что повышает  качество определения забойного давления по сравнению со стандартными методами. рис. 5. Распределение погрешности восстановления забойного давления в условиях отсутствия или неисправности датчиков давления на приеме электроцентробежного насоса

Список литературы

1. Markus M.B., Kriegel H.-P., Raymond T. Ng, Sander J. LOF: Identifying Density- Based Local Outliers. Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data. SIGMOD. pp. 93–104.
2. Enhancing effectiveness of outlier detections for low density patterns / J.Tang, Z. Chen, A.W. Fu, D.W. Cheung / In: Chen MS., Yu P.S., Liu B. (eds) Advances in Knowledge Discovery and Data Mining. Lecture Notes in Computer Science PAKDD. - Springer . -  2002. - vol 2336. – P. 535-548.
3. Hamming R.W. Digital Filters, 2nd ed. Englewood Cliffs, N: Prentice-Hall, 1983. – 257 р.
4. Ziegler H. Properties of digital smoothing polynomial (DISPO) filters //Applied Spectroscopy. – 1981. –V. 35. –P. 88–92.
5. Savitzky A., Golay M.J.E. Smoothing and differentiation of data by simplified least-squares procedures // Analytical Chemistry. – 1964. –V. 36. –P. 1627–1639.
6. Bromba M.U.A., Ziegler H. Application hints for Savitzky-Golay digital smoothing filters // Аnalytical Chemistry. – 1981. –V. 53. –P. 1583–1586.

Reference

1. Markus M.B., Kriegel H.-P., Raymond T. Ng., Sander J., LOF: Identifying density- based local outliers, Proceedings of the 2000 ACM SIGMOD International Conference on Management of Data, SIGMOD, 2000, pp. 93–104.
2. Tang J., Chen Z., Fu A.W., Cheung D.W., Enhancing effectiveness of outlier detections for low density patterns, In: Advances in Knowledge Discovery and Data Mining. Lecture Notes in Computer Science PAKDD: edited by Chen MS., Yu P.S., Liu B., Springer, 2002, V. 2336, pp. 535-548.
3. Hamming R.W., Digital filters, 2nd ed. Englewood Cliffs, N: Prentice-Hall, 1983, 257 р.
4. Ziegler H., Properties of digital smoothing polynomial (DISPO) filters, Applied Spectroscopy, 1981, V. 35, pp. 88–92.
5. Savitzky A., Golay M.J.E., Smoothing and differentiation of data by simplified least-squares procedures, Analytical Chemistry, 1964, V. 36, pp. 1627–1639.
6. Bromba M.U.A., Ziegler H., Application hints for Savitzky-Golay digital smoothing filters, Аnalytical Chemistry, 1981, V. 53, pp. 1583–1586.

Возврат к списку