В двух своих предыдущих постах (это и это) я попытался провести анализ настроений в наборе данных об авиакомпании в Твиттере с помощью одного из классических методов машинного обучения: наивно-байесовских классификаторов. Для этого поста я сделал один классификатор с подходом глубокого обучения. Эта работа не будет плодотворной, это всего лишь способ немного поиграть с нейронными сетями.
Для этой работы я использовал Tensorflow и Keras для определения нейронной сети и новую Jupyter Lab для написания кода (я думаю, это действительно круто!). Если хотите, вы можете найти мою среду обработки данных со всем этим документированным материалом по этой ссылке.
Хорошо, теперь давайте поговорим о нейронной сети, используемой в этом посте, наиболее интересным слоем является слой LSTM. Если вы хотите узнать больше о LSTM, я предлагаю прочитать этот пост блога Кристофера Олаха. Уровни LSTM широко используются для языковой обработки, поэтому я использовал этот слой для своего анализа. Схема очень простой нейронной сети для этого примера, если следующее:
Вся записная книжка, используемая для этого анализа, находится внизу, и ее можно найти в моем профиле на github здесь. Каждый блок кода прокомментирован, поэтому я не хочу утомлять вас множеством слов, давайте поговорим о коде ...
Вывод
Чтобы обучить эту сеть, я использовал мою докеризованную среду обработки данных на своем ноутбуке без какого-либо графического процессора за несколько минут.
Как видно из графиков: «Потери при обучении и проверке» и «Точность обучения и проверки», 3-я эпоха является лучшей, прежде чем сеть начнет чрезмерно соответствовать данным.
Точность предсказания с помощью этой сети подскочила с 86% до 94% по сравнению с предыдущими наивно-байесовскими классификаторами с очень простой сетью и несколькими эпохами. Также повышена точность положительных твитов. Несмотря на повышение точности с помощью такой сети, я думаю, что точность может быть улучшена, и это цель моих следующих тестов.
Пожалуйста, не стесняйтесь комментировать и связываться со мной, чтобы обсудить этот пост! 🙂
Первоначально опубликовано на сайте devklaus.wordpress.com 11 марта 2018 г.