Экспертный анализ геолого-физической информации по Приобскому и Муравленковскому месторождениям на основе моделей машинного обучения

Д.В. Егоров, Н.В. Буханов, О.Т. Осмоналиева, Б.В. Белозеров, Научно-Технический Центр «Газпром нефти» (ООО «Газпромнефть НТЦ»), А.А. Решитько, М.В. Голицына, А.С. Семенихин (ООО «Научно-технический центр ИБМ»)

Источник: Журнал «Нефтяное хозяйство»

Экспертное знание


Существующие в нефтегазовой отрасли задачи в основном имеют аналитические решения. Для решения этих задач часто недостаточно исходных данных и получить их сложно. На этапах поисково-оценочных работ и начальных стадиях разработки месторождений сейсмическая съемка редко покрывает весь регион, а информация по разведочным скважинам при достаточно низкой плотности разбуривания позволяет оценить только средние свойства пласта. Если предметная область (месторождение нефти и газа) описана фрагментарно, то требуется использовать большое число аналогий и полагаться на экспертизу опытных специалистов, которые участвовали в разработке множества месторождений в разных геологических условиях. В успешных примерах использования алгоритмов машинного обучения (распознавание изображений, оценка кредитного рейтинга, рекомендательные системы в розничных сетях) применяется так называемая «плоская» модель данных [1]. В ней содержится несколько тысяч раз
личных параметров-признаков, что позволяет использовать алгоритмы глубоких нейронных сетей (с большим числом нейронных слоев и нестандартной архитектурой) с объединением множества деревьев принятия решений в ансамбли. Такие алгоритмы дают очень хороший результат для плоской модели данных. Например, при распознавании изображений шлифов керна можно составить большой набор признаков и использовать искусственные нейронные сети для разделения зерен на классы, выделения различных видов пористости и текстур в шлифах [2].
Для геолого-геофизической информации с учетом ее специфики и разнородности подход на основе плоской модели в общем случае применим [3], но необходимо учитывать значительное влияние взаимосвязей между элементами данных. Авторами предлагается гибридный подход, в котором алгоритмы машинного обучения, работающие по принципу Black Box (без возможности интерпретации деталей внутреннего взаимодействия элементов системы), увеличивают точность прогноза за счет правильного использования экспертного знания.
Для Муравленковского месторождения применение подобного подхода, реализованного в виде иерархической классификации для литолого-фациального анализа, существенно повысило качество прогноза. На Приобском месторождении глубокие нейронные сети помогли обнаружить интервалы, перспективные с точки зрения получения притока, но не выделенные ранее специалистом-интерпретатором.

Седиментологическое зонирование

На Муравленковском месторождении основным объектом для исследования был выбран пласт БС11, точнее нефтенасыщенная линза C. Данный пласт является частью клиноформенного комплекса и пересекает три зоны осадконакопления: мелководную (ундаформа), континентального склона (клиноформа) и глубоководную (фондоформа).
На месторождении мелководно-морская обстановка характеризуется преобладанием песчаной разности (около 70 % общей толщины пласта, или 5–8 м), которая, вероятно, представлена подводными валами. Глин и карбонатизированных или уплотненных песчаников очень мало, и вряд ли они являются серьезным препятствием для фильтрации флюида.
Зона континентального склона является сложной системой переслаивания тонких интервалов, состоящих из чистого и карбонатизированного песчаника, а также из глин. Здесь нельзя выделить значительное преобладание конкретных литологических разностей, можно лишь отметить резкость переходов от одной разности к другой, что, вероятно, может свидетельствовать о накоплении осадка в высокоэнергетической обстановке.
Глубоководная зона приурочена к дистальной части отложений морского дна, образованных, скорее всего, в результате лавинообразного схода материала с континентального склона. Последовательность типичного разреза начинается с относительно маломощной линзы песчаника, которая резко перекрывается большим объемом глинистого материала. Количество песчанистой фракции составляет всего около 20 % (10 % карбонатизированной фракции). Преобладающее содержание глин значительно осложняет разработку данной зоны.
Пласт был выбран не только из-за сложной геологии, но и из-за имеющейся по нему необходимой априорной геологической информации. Использование подобной информации или экспертного мнения позволяет повысить качество классификации алгоритмов машинного обучения, а следовательно, точность прогноза. В данной статье в качестве подобной информации использовалась карта седиментологического зонирования (рис. 1), построенная геологом на основе его опыта и знаний. Подобные карты также могут быть построены методами машинного обучения [4]. В каждой из зон геологом были выделены три литофации: песчаник, карбонатизированный или уплотненный песчаник, глина. Таким образом, для всего пласта выделены девять различных разностей (по три в каждой зоне). Несмотря на то, что они имеют очень похожий отклик на каротажных кривых, по которым выполняется автоматическая интерпретация, их нельзя объединить в общие группы и рассматривать как один литотип.
1.png

Рис. 1. Карта седиментологического зонирования, использованная в качестве априорной геологической информации: 1, 3 – соответственно глубоководная и мелководная зона; 2 – континентальный склон

Использование априорной геологической информации позволяет разделить начальный набор данных на подмножества,
упростив задачу классификации для алгоритма и повысить точность его прогнозирования. Подобный подход назван иерархическим, он использует ансамбль классификаторов, в котором каждый алгоритм индивидуально «натренирован» и настроен на выделение фаций для определенного подмножества данных.
Полученные данные представляют собой четыре каротажные кривые и три соответствующие им варианта распределения литофаций (рис. 2), полученные геологом с помощью иерархического и стандартного подходов. Стандартный подход также может показать достаточно хорошие результаты, например, для мелководной зоны (см.рис. 2), но иногда его результаты полностью ошибочны. Полученные данные также сравнивались с математической точки зрения, для этого были построены диаграммы размахов для двух подходов (рис. 3). Из рис. 3 видно, что иерархический подход показывает не только более высокую медианную точность, но и меньшую вариацию этого значения, что также является значительным преимуществом данного подхода.

2.png
Рис. 2. Сравнение литофаций по зонам: мелководной (а), континентального склона (б) и глубоководной (в)

3.png
Рис. 3. Диаграммы размаха для иерархического (а) и стандартного (б) подходов

На последнем этапе разработанный алгоритм был применен ко всем скважинам с целью автоматического распределения фаций вдоль целевого интервала. Входной информацией являлись данные по более 700 скважинам, расположенным в разных частях месторождения. Этот этап был выполнен для доказательства и подтверждения применимости машинного обучения и, в частности, иерархического подхода к решению значимых практических задач.
Результаты автоматического распределения фаций были проанализированы. Каротажные кривые по скважинам сравнивались с кривыми, выбранными классификатором (рис.4). В большинстве случаев геолог был согласен с выбором, сделанным алгоритмом, за исключением некритических ошибок, которые, вероятно, вызваны шумами и могут быть исправлены пост-обработкой результатов. Например, задание минимальных толщин для каждой фации (что является экспертным мнением) может позволить исключить тонкие ошибочные прослои.

4.png
Рис. 4. Каротажные кривые по трем скважинам с литофациями глубоководной зоны (а), континентального склона (б) и мелководной зоны (в), распространенными с помощью иерархического подхода

Пропущенные продуктивные интервалы

При применении методов машинного обучения для интерпретации данных геофизических исследований скважин (ГИС) иногда результат математической модели не совпадает с результатами интерпретации данных ГИС (РИГИС) из контрольной выборки. Различают две ситуации для каждой отдельной точки глубины: ошибка первого рода, т.е. метка, например, тип насыщения, пористость, отсутствует в РИГИС, но присутствует в результатах интерпретации с помощью машинного обучения; ошибка второго рода, т.е. метка присутствует в РИГИС и отсутствует в результатах интерпретации модели. Первый случай также называют ложноположительным срабатыванием (FP), второй – ложноотрицательным срабатыванием (FN). Ошибки второго рода чаще указывают на некорректность работы алгоритма, которые необходимо устранять в процессе итеративной работы с алгоритмом машинного обучения. В то же время ошибки первого рода представляют интерес, так как являются источником потенциальных пропущенных интервалов, отсутствующих в РИГИС.
Таким образом, при разработке модели машинного обучения важно поддерживать правильный баланс между точностью автоинтерпретации и способностью модели выявлять пропущенные интервалы (т.е. число ложноположительных срабатываний). В обобщенном смысле модель машинного обучения представляет собой генерализованную модель знаний, применяемую для симуляции процессов интерпретации данных ГИС и использующую весь накопленный опыт.
Модель неявно содержит два вида информации, которые не могут быть разделены: петрофизическую модель и результат работы интерпретатора. Основным преимуществом данного подхода является сравнительная простота использования, однако он требует наличия достаточного числа проинтерпретированных объектов–аналогов, а также методологии их выявления. Этот подход подразумевает использование моделей типа black-box, что ограничивает возможность настройки моделей машинного обучения под вариативность петрофизических и геологических параметров и использовать в явном виде (в виде прямых петрофизических зависимостей, задаваемых специалистом) экспертное знание об имеющихся различиях между объектами, на которых проводилось обучение, и тестируемыми.
Существует несколько потенциальных бизнес-сценариев применения данного подхода на практике.
1. Выявление интервалов, пропущенных в результате неточностей, допущенных при интерпретации. Вэтом сценарии модель машинного обучения тренируется на наборе данных, проинтерпретированных на основе одной петрофизической модели, затем применяется для интерпретации того же или другого набора данных, ранее проинтерпретированных на основе той же петрофизической модели.
2. Выявление интервалов в ранее неинтерпретированных объектах (пластах, скважинах). В этом сценарии предполагается, что неинтерпретированные объекты представляют собой геологические и петрофизические аналоги других (проинтерпретированных) объектов. Вданном случе модель машинного обучения обучается на наборе данных объектов-аналогов и применяется для интерпретации ранее неинтерпретированных объектов.
Для практического тестирования разработанного алгоритма были использованы данные по Приобскому месторождению ПАО «Газпром нефть». Основными нефтегазоносными объектами являются неокомские отложения, в частности, пласты АС7–АС12. Их нефтеносность связана преимущественно с литологически экранированными ловушками, приуроченными к линзам коллекторов, полностью нефтенасыщенным и не имеющим водонефтяного контакта (ВНК). Исключения составляют пласты АС7 и АС9, в которых вскрыты частично нефтенасыщенные либо водонасыщенные линзы и наряду с литологически экранированными встречаются структурно-литологические залежи с ВНК. Разработанные алгоритмы были использованы для автоинтерпретации и поиска пропущенных интервалов в пластах АС10–АС12, так как они содержат 98 % нефти и охватывают большую часть площади месторождения.
На рис. 5 приведены примеры прогнозирования с применением модели для трех скважин. Модель представляет собой обученную рекуррентную нейронную сеть (RNN), прогноз построен на данных ГИС, которые не использовались при обучении сети. Примеры на рис. 5 показывают различные аспекты работы модели. Так, по скв. 24347 прогноз полностью совпал с РИГИС, для скв. 30777 характерно наличие ошибок как первого, так и второго родов.

5.png
Рис. 5. Примеры работы автоматической модели интерпретации для выделения пропущенных интервалов в скв. 24347 (а), 15890 (б) и 30777 (в) Приобского месторождения

Предварительный экспертный анализ пропущенных интервалов для случаев, аналогичных скв. 30777, показал, что разработанная модель позволяет выделить на 14 % больше дополнительных эффективных толщин, чем РИГИС, представленные экспертами. В дальнейшем планируется провести углубленное исследование выделенных дополнительных прослоев для более точной оценки эффективности работы модели знаний, реализованной с помощью методов машинного обучения.
Таким образом, приведенные примеры показывают важную роль использования экспертного знания в на стройке BlackBoxалгоритмов машинного обучения. Более широкое включение геологического контекста предполагает использование концептуальных карт геологического строения месторождений и проверку качества классификации по картам песчанистости. С другой стороны, использование петрофизической модели подразумевает применение зависимостей керн–ГИС, которые могут успешно моделироваться с помощью многомерной нелинейной регрессии сплайнов (MARS).
Важным направлением развития работы является не столько создание работающего статичного приложения по автоинтерпретации данных каротажа, сколько выработка подходов и удобной среды взаимодействия специалистов с экспертными системами нового поколения на основе машинного обучения. Постоянный обмен информацией, проверка результатов работы автоматизированных систем прогноза даст возможность накапливать экспертные знания и производственный опыт специалистов в виде формализованных либо неструктурированных правил работы алгоритмов.

Список литературы


1. WickhamH.Tidydata// TheJournalofStatisticalSoftware. –2014. –V. 59. –P. 10.
2. Borazjani O., Ghiasi-Freez J., Hatampour A. Two intelligent pattern recognition models for automatic identification of textural and pore space characteristics of the carbonate reservoir rocks using thin section images// Journal of Natural Gas Science and Engineering. –2016. –V. 35. –P. 944–955.
3. Hall M.,HallB.Distributed collaborative prediction: Results of the machine learning contest// The Leading Edge.– 2016. –V. 36. –№ 3. –P. 267–269.
4. TengelidiD.Fourier spectrums clustering for automated facies recognition of Field Y // 7thSaintPetersburgInternationalConferenceandExhibition, EAGE, 2016.

References

1. Wickham H., Tidy data, The Journal of Statistical Software, 2014, Issue 10.
2. Borazjani O., Ghiasi-Freez J., Hatampour A., Two intelligent pattern recognition models for automatic identification of textural and pore space characteristics of the carbonate reservoir rocks using thin section images, Journal of Natural Gas Science and Engineering, 2016, V. 35, Part A, pp. 944-955.
3. Hall M., Hall B., Distributed collaborative prediction: Results of the machine learning contest, The Leading Edge, 2016, V. 36 (3), pp. 267–269.
4. Tengelidi D. et al., Fourier spectrums clustering for automated facies recognition of Field Y, Proceedings of 7th EAGE Saint Petersburg International Conference and Exhibition, 2016, DOI: 10.3997/2214-4609.201600253.

Возврат к списку