Как НЛП влияет на производительность вашего чат-бота с искусственным интеллектом

Взглянем на то, что происходит в мозгу этого загадочного чат-бота…

Всякий раз, когда появляются чат-боты с искусственным интеллектом, вы неизбежно услышите три золотых слова: обработка естественного языка (NLP). На первый взгляд слова кажутся очевидными: поскольку наши компьютеры говорят на довольно неестественном языке, состоящем из единиц и нулей, им придется выполнять некоторую обработку, чтобы понять нас.

Но есть ли разница между НЛП одной компании и другой? И как сегодняшнее состояние НЛП влияет на вашего чат-бота? Прежде чем мы углубимся в это, давайте сначала погрузимся в то, как все это началось.

Ранние годы

Интерес к НЛП и диалоговому ИИ возник еще до того, как большая часть мира увидела компьютер. В октябре 1950 года Алан Тьюринг предложил Игру в имитацию — игру, в которой три игрока (человек, машина и судья) общаются друг с другом, а конечной целью является ответ. простой вопрос: Может ли машина сойти за человека?

Хотя это не было очень весело как игра, она сделала разговорный ИИ славой как своего рода вызов для масс. В настоящее время игра в имитацию называется тестом Тьюринга;и действует как своего рода эталон, по которому можно измерить прогресс человечества в области технологий в целом: если машина может говорить как человек, то, возможно, мы достигли искусственного интеллекта.

Рождение чат-бота

Несмотря на раннее начало, пришлось долго ждать, пока мы не увидели первую программу, которая прошла тест Тьюринга: ELIZA Джозефа Вейценбаума; чат-бот, созданный в 1966 году. По иронии судьбы, создавая чат-бота, Вейценбаум хотел проиллюстрировать, что технология все еще очень примитивна (чат в основном основан на сопоставлении ключевых слов) и что они далеки от машинного интеллекта. .

Так насколько это было разумно? Я лично считаю, что это весьма впечатляет: несмотря на огромные ограничения как в аппаратном обеспечении, так и в данных, ELIZA все же удается придумать несколько захватывающих ответов. Конечно, вариант использования очень ограничен — и, возможно, это был скорее подвиг умной социальной инженерии, чем машинного интеллекта. Благодаря Норберту Ландштейнеру вы можете поболтать с ЭЛИЗОЙ и лично убедиться в ее умственных способностях.

НЛП, каким мы его знаем

Прошло много времени с 60-х, и подход к НЛП сильно изменился. Прошли времена основанных на правилах систем сопоставления ключевых слов. В наши дни все сводится к созданию языковых моделей. Ниже приведено упрощенное пошаговое описание того, как это делается.

Шаг 1: Получение словаря для вашего компьютера

Построение языковой модели сегодня начинается с создания как можно более широкого словаря — посредством процесса, который обычно включает поиск в Интернете огромных объемов данных. И когда я имею в виду огромный, я действительно имею в виду огромный — GPT-3, например, был обучен на 45 ТБ текстовых данных, полученных из различных источников данных, формируя общий словарь 400 миллиардов токенов (читай: слов).

Шаг 2: формирование контекстуального понимания

Недостаточно просто знать, что слова существуют: чтобы машина по-настоящему прочитала и поняла предложение, ей также необходимо иметь представление о контексте. Возьмем, к примеру, следующее предложение:

К тому времени, когда он пришел, она пообедала.

Чтобы машина понимала разницу между первым had (что означает уже) и вторым had (что означает съеденный), он должен знать немного больше, чем просто назначение токена.

Хотя есть много способов сделать это, наиболее популярным в наши дни, пожалуй, является использование Трансформеров: своего рода математическая магия, которая позволяет компьютерам понимать слова на основе слов, которые появляются вокруг. их. Результат? Машина с довольно хорошим пониманием того, как работает человеческий язык.

Шаг 3: Специализация проблемы

Теперь, когда у нас есть языковая часть, мы готовы использовать языковую модель для решения поставленной задачи — построения диалога. Введите переносное обучение — проверенную и проверенную идею о том, что вы можете добиться лучших результатов обучения, начав с модели, которая уже знает свое дело. Все, что осталось, — это взять вашу языковую модель и обучить ее новым данным, специфичным для предметной области, будь то намерения и сущности для вашего нового корпоративного чат-бота или чат-логи от умершего.

Качество языковой модели — это то, где поставщики НЛП могут немного отличаться, и если вы собираетесь использовать решение НЛП от одного из технологических гигантов (Google, Microsoft, IBM и т. д.), мы имеем в виду очень немного — если вы не работаете над периферией диалогового ИИ (в этом случае вам не следует искать решение для массового рынка), вы даже не заметите.

Проблемы в НЛП

Текущий подход к НЛП не обходится без собственного набора проблем, и если вы занимались разговорным ИИ, вы, вероятно, столкнулись с одной или двумя. Составление исчерпывающего списка способов улучшения НЛП сегодня было бы слишком большой задачей для одной статьи, но ниже мы приводим несколько крупных из них, которые наши нынешние подходы к НЛП, похоже, не приближают к решению.

Обращение к анафоре

Согласно определению Oxford Languages, анафора означает «использование слова, отсылающего к слову, использованному ранее в тексте или разговоре, во избежание повторения». Хотя мы, люди, можем легко устанавливать связи, когда слышим слова «она», «они» или «это», для наших компьютеров это не так просто. Даже несмотря на большие объемы данных, огромную вычислительную мощность и десятилетия за десятилетиями исследований НЛП, лучшие модели по-прежнему не дают результатов, демонстрирующих убедительное понимание этой концепции.

Предотвращение нездоровых предубеждений

С последними и лучшими моделями, получающими текст отовсюду (романы, исследовательские работы и грязныйболее широкий Интернет), становится все труднее фильтровать и защищать машины от присущих нам человеческих предубеждений. Хорошей иллюстрацией этого является Модель заполнения маски Берта на Huggingface, которая при постановке с подсказкой…

Он работает _____.

…предлагает предложения «плотник», «официант», «парикмахер», «механик»или «продавец», но для…

Она работает _____.

…предлагает слова «медсестра», «официантка», «горничная», «проститутка»или «повар».

Хотя мы все еще далеки от разумных машин, впервые придуманных Аланом Тьюрингом, мир НЛП развился далеко от того места, где он начинался. Сегодняшний диалоговый ИИ подает большие надежды, и при правильном сценарии использования чат-бот вполне может стать тем, что вам нужно для достижения ваших бизнес-целей.

Само собой разумеется, что ждать идеального нет смысла — лучшее время, чтобы начать строить и решать, — сегодня.

XIMNET — поставщик цифровых решений с двадцатилетней историей, специализирующийся на разработке веб-приложений, чат-ботах с искусственным интеллектом и системной интеграции.

XIMNET запускает совершенно новый способ создания чат-бота с искусственным интеллектом с помощью XYAN. Свяжитесь с нами, чтобы узнать больше.

Как НЛП влияет на производительность вашего чат-бота с искусственным интеллектом