# 1. Определение границ проекта
Цель: Выполнить оценку эмоциональной окраски комментариев на Youtube. (повысить “точность” оценки эмоциональной окраски комментариев на Youtube).
Задачи:
- анализ существующих решений;
 - сбор данных и их обновление;
 - обучение и оценка моделей на исходном датасете;
 - выбор двух моделей с наибольшим значением точности;
 - оценка качества и скорости работы модели на новых комментариях путем A / B тестирования;
 - выбор и развертывание наилучшей модели;
 - оптимизация выбранной модели путем квантизации и дистилляции;
 - развертывание оптимизированной модели, количественная оценка эффекта оптимизации.
 
Датасет: текст и эмоциональная окраска 1000 комментариев на youtube (opens new window)
Проект: soy (opens new window)
Целесообразность использования датасета для решения поставленной задачи: по результатам векторизации отдельных слов текста комментариев и применения метода сокращения размерности на диаграмме отчетливо видны кластеры, задача разделения состоит в поиске оптимальной гиперплоскости (см. рис 2).