# 1. Определение границ проекта
Цель: Выполнить оценку эмоциональной окраски комментариев на Youtube. (повысить “точность” оценки эмоциональной окраски комментариев на Youtube).
Задачи:
- анализ существующих решений;
- сбор данных и их обновление;
- обучение и оценка моделей на исходном датасете;
- выбор двух моделей с наибольшим значением точности;
- оценка качества и скорости работы модели на новых комментариях путем A / B тестирования;
- выбор и развертывание наилучшей модели;
- оптимизация выбранной модели путем квантизации и дистилляции;
- развертывание оптимизированной модели, количественная оценка эффекта оптимизации.
Датасет: текст и эмоциональная окраска 1000 комментариев на youtube (opens new window)
Проект: soy (opens new window)
Целесообразность использования датасета для решения поставленной задачи: по результатам векторизации отдельных слов текста комментариев и применения метода сокращения размерности на диаграмме отчетливо видны кластеры, задача разделения состоит в поиске оптимальной гиперплоскости (см. рис 2).