# Глоссарий

База данных с исходными объектами (source data store) - база данных, содержащая данные, выгруженные из внешнего источника, реализуется в виде document-oriented db или data lake;
База данных с признаками, используемыми для обучения моделей (feature store) - база данных, содержащая результаты извлечения признаков (feature extraction) из исходных данных, реализуется в виде document-oriented db или feature store;
База данных с результатами обучения моделей (model repo) - база данных, содержащая результаты обучения моделей (значения параметров и опционально спецификацию архитектуры), реализуется в виде document-oriented db или cloud object storage;
Внешний источник данных (data source) - сторонний сервис, из которого выгружаются данные для обучения и оценки моделей, например kaggle, imdb, etc;
Сервис выполнения workflow - сервис, реализующий возможность автоматизации обучения, оценки и использования моделей. Необходимо использовать Github Actions (opens new window) с github-hosted / self-hosted runner (opens new window) (self-hosted (opens new window) допускается только при развертывании с использованием локального сервиса развертывания);
Сервис развертывания - сервис, реализующий API для развертывания обученных моделей - может быть cloud-hosted или self-hosted.

Примечание

Сервис развертывания реализуется в виде HTTP-сервиса, принимающего запросы на развертывание модели. Может использоваться либо самостоятельно разработанный сервис, либо какой-либо существующий облачный сервис. Использование сервиса развертывания желательно, но не обязательно - в простейшем варианте модель может быть развернута внутри self-hosted runner в конце выполнения workflow