Классификация чат-ботов

2020-12-22

(1) В соответствии с функциональной классификацией его можно разделить на: чат-робот с вопросами и ответами, чат-робот с задачами и небольшой чат-робот.

Технологии, используемые чат-ботами с разными функциями, также различаются. Например, при создании чат-ботов с вопросами и ответами нам необходимо извлечь фокусную лексику в вопросе для поиска в тройках или графах знаний, а для повышения точности поиска часто необходимо классифицировать вопросы и отношения. . Однако в случае небольших чат-ботов вы можете напрямую относиться к ним как к проблеме маркировки последовательностей, добавлять высококачественные данные в модель глубокого обучения для обучения и, наконец, получать целевую модель.

(2) В соответствии с классификацией режимов его можно разделить на режим поиска и генеративный режим.

а. Основываясь на модели поиска, он использует базу данных заранее определенных ответов и некоторые эвристические рассуждения для выбора подходящего ответа на основе входных данных и контекста. Другими словами, FAQ конструируется, пара вопрос-ответ сохраняется, а затем из FAQ методом поиска возвращается ответ на предложение. Эти системы не генерируют никакого нового текста, они просто выбирают ответ из фиксированного набора. Этот метод имеет очевидные преимущества и недостатки. Благодаря использованию репозиториев, созданных вручную, методы поиска не вызывают грамматических ошибок. Однако они могут быть не в состоянии справиться со сценариями без заранее определенных ответов. По той же причине эти модели не могут ссылаться на контекстную информацию об объектах, такую ​​как имена, упомянутые ранее.

б. Генеративная модель. Этот метод более трудный. Он не полагается на заранее определенные ответы и генерирует новые ответы с нуля. Генеративные модели обычно основаны на технологии машинного перевода, но вместо перевода с одного языка на другой они осуществляют «перевод» от ввода к выводу (ответу).

Модель seq2seq Этот метод имеет очевидные преимущества и недостатки. Он может ссылаться на объекты во входных данных, создавая впечатление, что вы разговариваете с кем-то. Однако эти модели сложно обучать, они могут содержать грамматические ошибки (особенно в длинных предложениях) и обычно требуют большого количества обучающих данных.

(3) В соответствии с классификацией поля его можно разделить на открытое поле и закрытое поле.

а. Чат-ботов в открытом поле сложнее достичь, поскольку у пользователей не обязательно есть четкие цели или намерения. Разговоры в социальных сетях, таких как Twitter и Reddit, обычно носят открытый характер — они могут говорить на любую тему в любом направлении. Бесчисленное количество тем и масштаб знаний, необходимых для получения разумных ответов, существенно затрудняют внедрение чат-ботов с открытым доменом. В то же время для этого также требуется открытая база знаний в качестве резерва знаний, что увеличивает сложность поиска информации.

б. Чат-бот в закрытом поле проще реализовать, а возможное пространство ввода и вывода ограничено, поскольку система пытается достичь очень конкретной цели. Техническая поддержка или консультанты по покупкам являются примерами проблем закрытого типа. Этим системам не нужно говорить о политике, им просто нужно максимально эффективно выполнять конкретные задачи. Конечно, пользователи по-прежнему могут общаться где угодно, но системе не обязательно иметь дело со всеми этими ситуациями — пользователи не ожидают этого.