Анализ применимости алгоритмов машинного обучения для задач интерполяции и прогноза геологических свойств в межскважинном пространстве

24.12.2018

PROНЕФТЬ. Профессионально о нефти. – 2018 - № 4(10). – С. 13-16

УДК 550.8.072

Д.В. Егоров, Б.В. Белозеров
Научно-Технический Центр «Газпром нефти» (ООО «Газпромнефть НТЦ») 

Электронный адрес: egorov.dvi@gazpromneft-ntc.ru 

Ключевые слова: машинное обучение, геологическое моделирование, интерполяция 

Исследованы алгоритмы машинного обучения исследовались на применимость в качестве альтернативного инструмента для геологического моделирования. Модель гребневой регрессии в отличие от других моделей показала наиболее высокую точность при прогнозе распределения значений песчанистости в межскважинном пространстве. Изучена зависимость прогнозной способности модели от объема и пространственного распространения имеющейся информации. Показано, что даже при малом количестве имеющейся информации по площади месторождения получаемый прогноз является устойчивым и реалистичным. Следовательно, полученное решение применимо даже на самых ранних стадиях эксплуатации месторождения. Доказана применимость методов машинного обучения для задач межскважинной интерполяции.

Analysis of machine learning algorithms applicability for tasks of interpolation and geological properties forecasting within interwell space

PRONEFT''. Professional'no o nefti, 2018, no. 4(10), pp. 13-16

D.V. Egorov, B.V. Belozerov 
Gazpromneft NTC LLC, RF, Saint-Petersburg 

E-mail: egorov.dvi@gazpromneft-ntc.ru

Keywords: machine learning, geological modeling, interpolation

Obviously, in last years complexity of oil and gas fields has increased dramatically and the era of simple and easy re- trievable resources has almost gone. This situation leads to necessity of careful and comprehensive uncertainty quantification and risk analysis during field evaluation and planning development strategy. Conventional and widely used geological modelling algorithms based on kriging and stochastic simulation process produce biased results due to not accurate variogram ranges induced by the lack of knowledge about geological setting of target formation. It is necessary to develop a tool that could explore available geological data and retrieve spatial environmental dependen- cies of a particular field and then exploit them for the following geological modelling. Modern statistical methods such as machine learning algorithms can be used for these tasks.
In this research applicability of machine learning algorithms for the task of interpolation and reservoir properties pre- diction within interwell space was analyzed. Robustness and quality of forecast produced by different machine learn- ing models also were considered. Influence of information amount and sparsity of geological data on prognosis accu- racy were estimated in order to determine range of used method applicability.

DOI: 10.24887/2587-7399-2018-4-13-16

ВВЕДЕНИЕ

Несмотря на то, что алгоритмы машинного обучения не являются инновационными, они получили широкое распространение только недавно в связи со значительным увеличением вычислительных компьютерных мощностей, повышением их доступности, а также вследствие кратного увеличения объемов информации, аккумулируемой в цифровом виде. В настоящее время подобные когнитивные методы используются при решении различных задач, включающих распознавание образов [1], прогнозировании экономических временных последовательностей [2], рекомендательных системах в медицине [3]. Несмотря на широкое распространение, применимость подобных методов относительно мало исследовалась в задачах прогнозирования геологических свойств нефтяных и газовых резервуаров. 

Например, в работах [4, 5] авторы рассматривали не общую применимость методов, а конкретные алгоритмы, в частности машины опорных векторов [6], в то время как для решений подобной регрессионной задачи прогноза свойств в межскважинном пространстве существует множество других моделей.  В настоящее время наиболее широко применяются алгоритмы для геологического моделирования, основанные на интерполяции с помощью кригинга и стохастической симуляции, которые в большинстве случаев дают некорректную оценку при прогнозе геологических свойств. Даже самая детальная концептуальная геологическая модель не может в полной мере описать сложную геологическую обстановку целевого пласта. Это является одной из причин ошибок при выборе значения ранга вариограммы, что в результате ведет к созданию нереалистичных геологических моделей, а также переоценке или недооценке прогнозируемых свойств. Алгоритмы машинного обучения не требуют какого-либо экспертного знания и способны самостоятельно извлекать пространственную геометрическую информацию из геологических данных, а имеющаяся концептуальная модель может быть использована, например, для оценки достоверности полученных результатов.

 

Рис. 1. Карта распространения песчанистости по площади резервуара

Описание данных

В настоящей работе исследовалась синтетическая 3D геологическая модель, построенная на основе детального седиментологического описания Шестаковского обнажения, расположенного в Кемеровской области. Разрез обнажения сложен юрскими отложениями и представлен сложной флювиальной системой, включающей шесть фаций с различными петрофизическими параметрами. Таким образом, рассматриваемая геологическая модель достаточно сложна, что позволяет считать ее подходящей основой для экспериментов. Кроме того, одно из значительных преимуществ модели заключается в том, что она построена на основе разреза, являющегося аналогом для многих месторождений Западной Сибири, на которых планируется дальнейшее применение разработанной методики.

В качестве целевого прогнозируемого параметра была выбрана песчанистость резервуара. Используемая геологическая модель характеризуется крайне сложным и неравномерным распространением данного параметра по площади (рис. 1), что позволяет протестировать алгоритм в условиях, приближенных к реальным, и доказать устойчивость полученного решения. Карта песчанистости, построенная на основе используемой модели и представленная на рис. 1, содержит 1380 точек (46х30 ячеек), каждая из которых может быть рассмотрена в качестве синтетической скважины, пробуренной в ячейке размером 200х200 м.

Методика исследований 

В ходе исследований изучались применимость и устойчивость решения на различных стадиях освоения месторождения, которые могут быть охарактеризованы разным числом скважин, а, следовательно, разным объемом имеющейся геолого-геофизической информации. Только часть точек из геологической модели рассматривалась как входная информация (от 1 до 50  , что соответствует 14–690 скважинам). На начальном этапе имеющиеся данные применялись для построения пространства признаков, которое в дальнейшем могло бы быть использовано алгоритмом для прогноза параметра песчанистости в конкретной точке (рис. 2). Таким образом, для каждой точки выборки был построен набор характеристик, включающий значения целевого параметра по ближайшим скважинам, а также координаты, расстояния и различные статистики. Эти данные были использованы для обучения алгоритма с целью последующего прогноза значений параметра на неразбуренных участках.


Рис. 2. Прогноз песчанистости в точке 244-919

Второй этап заключался в применении обученной и настроенной модели для оценки значений песчанистости в точках с отсутствующей информацией с последующей оценкой качества и устойчивости прогнозной способности алгоритма. 

В ходе этих двух этапов испытывались различные алгоритмы машинного обучения, включающие как относительно простые регрессионные модели (множественная регрессия с L1 и L2 регуляризацией – регрессия на основе машин опорных векторов), так и сложные ансамблевые решения (случайный лес, градиентный бустинг) с целью оценки устойчивости их работы при разном количестве информации и различной пространственной представленности. Наилучшее качество прогноза и его устойчивость по результатам экспериментов показал алгоритм гребневой регрессии (ridge regression), который хорошо подходит для ситуаций с достаточно малым объемом информации (десятки точечных значений на площади в несколько квадратных километров) благодаря L2 регуляризации, позволяющей избежать жесткой привязки к имеющимся данным.  

Как отмечалось ранее, в ходе работы исследовалось влияние количества входной информации (рис. 3). В дополнение к этому одно и то же число точек отбиралось случайным образом 20 раз с последующем переобучением и прогнозом, чтобы оценить влияние пространственного расположения данных на устойчивость получаемого прогноза и его дисперсию. 

Из рис. 3 видно, что уже 5 информации позволяет достаточно точно восстановить поле распространения целевого параметра в межскважинном пространстве.


Рис. 3. Распределение песчанистости по скважинам и карты спрогнозированной песчанистости, построенные на основе 1 (а), 5 (б) и 10 (в) % информации об исследуемой площади

Количественная математическая оценка в ходе экспериментов показала, что при очень малом объеме информации достаточно сложно получить устойчивый прогноз, который при наличии около 1 данных по площади имеет как достаточно большую среднюю квадратическую ошибку, так и большую ее дисперсию (рис. 4). Однако, уже при 5 данных качество прогноза значительно увеличивается, а дисперсия ошибки уменьшается, что также было отмечено ранее при визуальном анализе.  

На основе на полученных результатов можно сделать вывод о том, что выбранная модель применима для решения задач прогнозирования геологических параметров в межскважинном пространстве уже на этапе перехода от геолого-разведочных работ к опытно-промышленной разработке месторождения, поскольку позволяет получить устойчивую оценку с очень незначительной ошибкой.

Рис. 4. Зависимость качества прогноза от количества данных

Заключение

В представленной работе алгоритмы машинного обучения исследовались на применимость в качестве альтернативного инструмента для геологического моделирования. Модель гребневой регрессии в отличие от других моделей показала наиболее высокую точность при прогнозе распределения значений песчанистости в межскважинном пространстве. В работе также изучалась зависимость прогнозной способности модели от объема и пространственного распространения имеющейся информации. Показано, что даже при малом количестве имеющейся информации по площади месторождения получаемый прогноз является устойчивым и реалистичным. Следовательно, полученное решение применимо даже на самых ранних стадиях эксплуатации месторождения.

Полученное решение имеет высокий потенциал для дальнейшего совершенствования. В последующих исследованиях планируется провести анализ, включающий сравнение имеющегося алгоритма с более традиционными подходами к геологическому моделированию и межскважинной интерполяции, а также разработать на основе имеющейся методики новый подход к оценке геологических неопределенностей и анализу связанных с ними рисков.
Подводя итог, можно сделать вывод, что применимость методов машинного обучения для задач межскважинной интерполяции была доказана, что являлось основной целью данного исследования.

Список литературы

  1. Krizhevsky A., Sutskever I., Hinton G. ImageNet сlassification with deep convolutional neural networks, NIPS 2012, 2012. — http://www.image-net.org/challenges/LSVRC/2012/supervision.pdf.
  2. Song Y., Zhou Y., Han R. Neural networks for stock price prediction //Journal of Difference Equation and Applications. — 2018. — May. — Р. 1–14.
  3. Razzak I., Naz S., Zaib A. Deep learning for medical image processing: Overview, Challenges and Future, Classification in BioApps, 2017. — P. 323 — 350.
  4. Support vector machines for classification and mapping of reservoir data / M. Kanevski, A. Pozdnukhov, S. Canu, P. Wong // Soft computing for Reservoir Characterization and Modeling. — 2002. — v. 80. — Р. 531–558.
  5. Geomodelling of a fluvial system with semi-supervised support vector regression / v. Demyanov, A. Pozdnoukhov, M. Kanevski, M. Christie//VIII International Geostatistics Congress, 2008.
  6. Vapnik v. , Statistical Learning Theory. — New York: Wiley, 1998.

References

  1. Krizhevsky A., Sutskever I., Hinton G., ImageNet classification with deep convolutional neural networks, NIPS 2012, 2012, URL: http://www.imagenet.org/challenges/LSVRC/2012/supervision.pdf
  2. Song Y., Zhou Y., Han R., Neural networks for stock price prediction, Journal of Difference Equations and Applications, 2018. May, pp. 1 — 14.
  3. Razzak I., Naz S., Zaib A., Deep learning for medical image processing: Overview, challenges and future, In: Classification in BioApps, 2017, pp. 323 — 350.
  4. Kanevski M., Pozdnukhov A., Canu S., Wong P., Support vector machines for classification and mapping of reservoir data, Soft computing for Reservoir Characterization and Modeling, Physica, Heidelberg, 2002, v. 80. — pp. 531 — 558.
  5. Demyanov v. , Pozdnoukhov A., Kanevski M., Christie M., Geomodelling of a fluvial system with semi-supervised support vector regression, Proceedings of VIII International Geostatistics Congress, 2008.
  6. Vapnik v. , Statistical Learning Theory, New York: Wiley, 1998.



Ссылка на статью в русскоязычных источниках:

Д.В. Егоров, Б.В. Белозеров. Анализ применимости алгоритмов машинного обучения для задач интерполяции и прогноза геологических свойств в межскважинном пространстве // PROНЕФТЬ. Профессионально о нефти. — 2018 — № 4(10). — С. 13-16.


The reference to this article in English is:

D.V. Egorov, B.V. Belozerov. Analysis of machine learning algorithms applicability for tasks of interpolation and geological properties forecasting within interwell space (In Russ.), PRONEFT''. Professional’no o nefti, 2018, no. 4(10), pp. 13-16.


Возврат к списку