# Fake News Detection
# Проект: Fake News Detection (opens new window)
# Цель
Повысить точность обнаружения фейковых новостей.
# Задачи
- [ ] Анализ существующих решений.
- [ ] Сбор данных и их обновление.
- [ ] Обучение модели на исходном датасете.
- [ ] Выбор оптимальной модели.
- [ ] Развертывание модели.
# Датасет (opens new window)
# Целесообразность
Использование датасета фейковых новостей может быть целесообразным в контексте разработки алгоритмов и моделей для автоматического выявления подобных новостей в социальных сетях и СМИ. Данный датасет позволит обучить модель отличать фейковые новости от настоящих, что может помочь бороться с дезинформацией и фейковой информацией. Обзор датасета (opens new window)
# Bag of words
Мешок слов — представление текста в виде массива, состоящего из отдельных слов и количества их использования. Применяется при анализе естественного языка и в составе алгоритмов компьютерного зрения.
# Target Balance
# Ложных данных: 23481 текстов
# Достоверных данных: 21417 текстов
# Категории: 'politicsNews', 'worldnews'
# Дата: 'April 1, 2016 ' - 'September 9, 2017 '
# Диаграммы
- Component diagram;
- Activity diagram;