# Fake News Detection


# Проект: Fake News Detection (opens new window)


# Цель

Повысить точность обнаружения фейковых новостей.

# Задачи


    • [ ] Анализ существующих решений.
    • [ ] Сбор данных и их обновление.
    • [ ] Обучение модели на исходном датасете.
    • [ ] Выбор оптимальной модели.
    • [ ] Развертывание модели.

# Датасет (opens new window)


# Целесообразность


Использование датасета фейковых новостей может быть целесообразным в контексте разработки алгоритмов и моделей для автоматического выявления подобных новостей в социальных сетях и СМИ. Данный датасет позволит обучить модель отличать фейковые новости от настоящих, что может помочь бороться с дезинформацией и фейковой информацией. Обзор датасета (opens new window)

# Bag of words


Мешок слов — представление текста в виде массива, состоящего из отдельных слов и количества их использования. Применяется при анализе естественного языка и в составе алгоритмов компьютерного зрения. Bag

# Target Balance


# Ложных данных: 23481 текстов

# Достоверных данных: 21417 текстов

# Категории: 'politicsNews', 'worldnews'

# Дата: 'April 1, 2016 ' - 'September 9, 2017 '

Target

# Диаграммы

  • Component diagram;
  • Activity diagram;

# Component diagram

Component diagram

# Activity diagram

Activity diagram