Классификация чат-ботов
(1) В соответствии с функциональной классификацией его можно разделить на: чат-робот с вопросами и ответами, чат-робот с задачами и небольшой чат-робот.
Технологии, используемые чат-ботами с разными функциями, также различаются. Например, при создании чат-ботов с вопросами и ответами нам необходимо извлечь фокусную лексику в вопросе для поиска в тройках или графах знаний, а для повышения точности поиска часто необходимо классифицировать вопросы и отношения. . Однако в случае небольших чат-ботов вы можете напрямую относиться к ним как к проблеме маркировки последовательностей, добавлять высококачественные данные в модель глубокого обучения для обучения и, наконец, получать целевую модель.
(2) В соответствии с классификацией режимов его можно разделить на режим поиска и генеративный режим.
а. Основываясь на модели поиска, он использует базу данных заранее определенных ответов и некоторые эвристические рассуждения для выбора подходящего ответа на основе входных данных и контекста. Другими словами, FAQ конструируется, пара вопрос-ответ сохраняется, а затем из FAQ методом поиска возвращается ответ на предложение. Эти системы не генерируют никакого нового текста, они просто выбирают ответ из фиксированного набора. Этот метод имеет очевидные преимущества и недостатки. Благодаря использованию репозиториев, созданных вручную, методы поиска не вызывают грамматических ошибок. Однако они могут быть не в состоянии справиться со сценариями без заранее определенных ответов. По той же причине эти модели не могут ссылаться на контекстную информацию об объектах, такую как имена, упомянутые ранее.
б. Генеративная модель. Этот метод более трудный. Он не полагается на заранее определенные ответы и генерирует новые ответы с нуля. Генеративные модели обычно основаны на технологии машинного перевода, но вместо перевода с одного языка на другой они осуществляют «перевод» от ввода к выводу (ответу).
Модель seq2seq Этот метод имеет очевидные преимущества и недостатки. Он может ссылаться на объекты во входных данных, создавая впечатление, что вы разговариваете с кем-то. Однако эти модели сложно обучать, они могут содержать грамматические ошибки (особенно в длинных предложениях) и обычно требуют большого количества обучающих данных.
(3) В соответствии с классификацией поля его можно разделить на открытое поле и закрытое поле.
а. Чат-ботов в открытом поле сложнее достичь, поскольку у пользователей не обязательно есть четкие цели или намерения. Разговоры в социальных сетях, таких как Twitter и Reddit, обычно носят открытый характер — они могут говорить на любую тему в любом направлении. Бесчисленное количество тем и масштаб знаний, необходимых для получения разумных ответов, существенно затрудняют внедрение чат-ботов с открытым доменом. В то же время для этого также требуется открытая база знаний в качестве резерва знаний, что увеличивает сложность поиска информации.
б. Чат-бот в закрытом поле проще реализовать, а возможное пространство ввода и вывода ограничено, поскольку система пытается достичь очень конкретной цели. Техническая поддержка или консультанты по покупкам являются примерами проблем закрытого типа. Этим системам не нужно говорить о политике, им просто нужно максимально эффективно выполнять конкретные задачи. Конечно, пользователи по-прежнему могут общаться где угодно, но системе не обязательно иметь дело со всеми этими ситуациями — пользователи не ожидают этого.