Подробное описание документа
Кузнецов Т. А.
Создание системы автоматической классификации текстовых отзывов на русском языке с помощью машинного обучения / Кузнецов Т. А., Гавриленков С. И. - DOI 10.18698/2541-8009-2022-5-794 // Политехнический молодежный журнал МГТУ им. Н. Э. Баумана. - 2022. - № 5. -
В современной высококонкурентной среде предприятия могут повысить свою гибкость и рентабельность благодаря проведению аналитических исследований текстовых отзывов потребителей. В рамках этих исследований одной из первоначальных задач является определение класса тональности текстового отзыва для понимания общей оценки продукта потребителем. В статье рассмотрена задача классификации текстовых отзывов по классам сентиментов с применением методов машинного обучения. В ходе решения изучены и применены методы векторизации текстовых данных. Проведен сравнительный анализ алгоритмов классификации по классам тональности: алгоритма случайного леса, метода опорных векторов, наивного байесовского классификатора. Выбран алгоритм, показывающий наилучшие показатели по метрикам оценки качества модели классификации. Получена подсистема классификации текстовых отзывов, автоматизирующая процесс анализа текстовых данных в рамках исследования продукции, производимой предприятием.