ML Engineer (CV/ASR/NLP)


Инженер c большим опытом в международных нефтяных и нефтесервисных компаниях, сейчас активно развиваюсь в области AI, работаю с проектами в области Computer Vision, речевой аналиnики, NLP. Имею опыт применения алгоритмов классического Machine Learning и Computer Vision в нефтегазовой отрасли, в также опыт в заказной разработке продуктов в области видеоаналики в промышленной безопасности, чат-ассистентов для HR, речевой аналитики. В поиске новых возможностей для развития в проектах на стыке CV и NLP, интересна область разработки AI-агентов.

Опыт работы


AI ENGINEER

ROOTCODE **** | 2023.09 – настоящее время

Видеоаналитика в промышленной безопасности • Разработала пайплайн для разметки видео с использованием Zero-Shot подходов (CVAT, Roboflow, SAM2) • Аугментировала ограниченный датасет с использованием генеративных моделей • Обучила модели для реал-тайм сегментации жд вагонов и рельсов (Segformer, PID-net), реал- тайм детекции сотрудников и СИЗ (Yolov8) на жд станции, ускорила и оптимизировала инференс на onnruntime • Интергрировала алгоритм трекинга c ReID BoT-SORT и FaceID (SCRFD, ArcFace) для иденти- фикации сотрудников в рабочей зоне • Реализовала бизнес логику для задач промышленной безопасности и охраны труда на жд станции • Интергрировала модели и алгоритмы в продуктовую среду (Triton Inference Server, Onnxruntime), оптимизировала обработку потокового видео через Kafka

HR ассистент • Разработала приложениe для анализа и фильтрации резюме, составления вопросов для интервью, оценки соискателей (OpenAI API, Langchain, ChromaDB, SQLAlchemy, streamlit) • Разработала чат-бот для ответов на кадровые вопросы поддержки сотрудников (Ollama, Langchain, ChromaDB, SQLAlchemy, streamlit

Речевая аналитика в аптеке • Разработала сложные пайплайы адаптивной предобработки зашумленных диалогов с длинными интервалами тишины (Librosa, SoundFile, PyDub, Silero VAD) • Провела исследование по подбору оптимальной модели транскрибации аудио для русского языка • Разработала пайплайн постобработки транскрибированного текста с применением классических методов и LLM • Дообучила модель NER для извлечения фармацевтических терминов из транскрибации • Оптимизировала сокрости инфренса в 5 раз и нтергрировала модели и алгоритмы в продуктовую среду (Triton Inference Server, Faster Whisper), написала сервис потокой обработки через Kafka • Создала сервис по суммаризации и ответам на вопросы по содежанию аудио (Langchain, ollama, FastAPI)

ML ENGINEER

Antik Browser (Antidetect Browser) | 2022.11 – 2023.09

• Разработала пайплайн для иерахического матчинга категорий товаров с применением bi-encoders и cross-encoders и векторного поиска • Разработала алгоритмы для автоматического решения нескольких видов Captcha с использова- нием классического CV и обучения нейронных сетей (детекция и сегментация), оптимизировала инференс моделей для CPU устройства • Создала end-to-end решение для автоматического прохождения Captcha в браузере (pyppeteer, selenium) • Обучила модель обнаружения подмены browser canvas fingerprint • Разработала код для автоматического сбора данных с веб-сайтов (Web Scraping, pyppeteer, selenium)

NEW OPPORTUNITIES TEAM LEAD Salym Petroleum Development (Газпромнефть-Shell) | 2022.04 – 2022.11

• Контроль качества и построение 3D геологических моделей сложных нефтяных резервуаров с применением ML алгоритмов (Metric Learning при корреляции нефтеносных резервуаров, клас- сификация литотипов (SVM, XGBoost), стохастическое 3D моделирование в ПО Schlumberger Petrel)

• Интеграция геологической базы данных в процесс обновления геологической модели и пересчета запасов

SENIOR GEOLOGIST-GEOMODELER Repsol-Газпромнефть | 2015.10 – 2022.04

Интеграция геологической базы данных в процесс обновления геологической модели и пересчета запасов (PostgreSQL)

Обучила модель сегментации фото шлифов и РЭМ керна (минералогия, поровое пространство) с дальнейшей интеграцией в 3D геологическую модель месторождения • Оптимизировала эффективную проходку горизонтальных скважин при помощи алгоритмов ML (Metric Learning при корреляции опорных скважин, сегментация изображений скважинных плотностных и электрических имиджеров для выделения литотипов, детекция разломов) • Построила более 20 стохастических 3D геологических моделей сложных нефтяных резервуаров (выделение литотипов с использованием CatBoost, SVM) • Вероятностная оценка прогнозных запасов/ресурсов нефти и газа, геологоразведочные работы (детектировала аномалии и геологические тела с использованием алгоритмов DBSCAN, SVM)

GEOLOGIST-GEOMODELER Schlumberger | 2011.10 – 2015.10

• Построила 5 стохастических 3D геологических моделей нефтяных резервуаров с вероятностным подсчетом запасов для нефтедобывающих компаний (ПО Petrel) • Оптимизировала траектории сотней горизонтальных скважин на основании многовариантного расчета 3D геологических моделей • Создала скрипт на Python для оцифровки седиментологических планшетов скважин использования в петрофизическом ПО

Pet Projects


Сегментация и распознавание баркодов товаров на фотографиях * Сегментация, пайплайн обучения модели: Pytorch Lightning, ClearML GitHub Link * OCR, пайплайн обучения и инференса модели: Pytorch Lightning, ClearML GitHub Link * Сервис на FastAPI c CI/CD pipeline (flake8, pytest, ansible) GitHub Link

Мультилейбл классификация спутниковых снимков

Телеграмм-бот для ведения базы затрат: парсинг чеков с QR-кода

Competitions


Публикации


Контакты


(+7) 916 165 56 49 [email protected]

[https://github.com/JuliPolu](https://julipolus.notion.site/https-github-com-JuliPolu-0790545c20d943af8623796b769db743)

Ключевые навыки

Programming Languages: Python

Classical ML Tools: Numpy, Pandas, Scikit-learn, SciPy, CatBoost, LightGBM

DL Tools: Pytorch, Tensorflow, Huggingface, DALI, ONNX-runtime, OpenVINO, TensorRT

CV Tools: OpenCV, ultralitics, SMP, PID-Net, OpenMMLab, InsightFace, Kornia, ComfiUI, Florence2, Qwen-VL

NLP Tools: Hugging Face Transformers, sentence-transformers, LLMs API (Claude,OpenAI, Google), LangChain, LlamaIndex , Sentence-Transformers, Chroma, FAISS, Milvus

ASR Tools: Whisper, GigaAM, Librosa, SoundFile, PyDub, Silero VAD, Pyannote.audio

MLOps Tools: Triton Inference Server, ClearML, Docker, FastAPI, Kafka, Grafana, PostreSQL

Dev Tools: Git, Gitlab CI/CD, ansible, Dependency Injector, pytest, wemake(flake8), VSCode, Jupyter Notebook

Образование


HERIOT-WATT UNIVERSITY MSc in Reservoir Evaluation and Management 2009-2011

GEEKBRAINS Диплом о Профессиолнальной переподготовке по программе "Искусственный интеллект” 2022-2023


ML Курсы

DEEPSCHOOL

Ускорение Нейросетей 2025

Large Language Models 2024

Generative CV 2024 ****Computer Vision Rocket 2023

OTUS

MLOps 2025

Computer Vision 2024

HuggingFace AI Agents Course 2025

COURSERA Deep Learning Specialization (Andrew Ng) 2023

Languages


Russian - native English - C1 Spanish - B1