# Глоссарий
База данных с исходными объектами (source data store) - база данных, содержащая данные, выгруженные из внешнего источника, реализуется в виде document-oriented db
или data lake
;
База данных с признаками, используемыми для обучения моделей (feature store) - база данных, содержащая результаты извлечения признаков (feature extraction
) из исходных данных, реализуется в виде document-oriented db
или feature store
;
База данных с результатами обучения моделей (model repo) - база данных, содержащая результаты обучения моделей (значения параметров и опционально спецификацию архитектуры), реализуется в виде document-oriented db
или cloud object storage
;
Внешний источник данных (data source) - сторонний сервис, из которого выгружаются данные для обучения и оценки моделей, например kaggle
, imdb
, etc;
Сервис выполнения workflow - сервис, реализующий возможность автоматизации обучения, оценки и использования моделей. Необходимо использовать Github Actions (opens new window) с github-hosted / self-hosted runner (opens new window) (self-hosted (opens new window) допускается только при развертывании с использованием локального сервиса развертывания);
Сервис развертывания - сервис, реализующий API для развертывания обученных моделей - может быть cloud-hosted
или self-hosted
.
Примечание
Сервис развертывания реализуется в виде HTTP-сервиса, принимающего запросы на развертывание модели. Может использоваться либо самостоятельно разработанный сервис, либо какой-либо существующий облачный сервис. Использование сервиса развертывания желательно, но не обязательно - в простейшем варианте модель может быть развернута внутри self-hosted runner
в конце выполнения workflow