Поиск аномалий в договорах

Задача

Автоматическое выделение аномалий в текстах загружаемых договоров.

Возможные типы аномалий:

  • фрагмент текста, который не наблюдался в аналогичных договорах, но наблюдается в предложенном договоре;
  • фрагмент текста, который часто наблюдается в аналогичных договорах, но в предложенном документе он отсутствует.

Исходные данные

Описание алгоритма

Поиск аномалий в договорах

Для решения поставленной задачи применяются методы машинного обучения.

Поскольку семантика каждой главы договора имеет свою уникальную специфику, алгоритмы работают с ними раздельно.

 

Поиск аномалий в договорах

Договоры могут быть разных видов. Все они сильно отличаются по содержанию, предмету договора, основным главам и др. Для оптимизации анализа каждого типа договора, была проведена работа по их классификации.

 

Поиск аномалий в договорах

Слова переводятся в вектора при помощи алгоритма Word2Vec.

Слова, которые являются изменяемыми договорах, но имеют одинаковый контекст, будут представлены в виде векторов с минимальным расстоянием между ними.

 

Поиск аномалий в договорах

Для сравнения предложений используются различные метрики расстояния между точками. Благодаря алгоритму нахождения расстояния между двумя векторами определяется мера схожести предложений.

Преимущества технологии

  • Использование технологии помогает уменьшить финансовые и репутационные риски (связанные с «закладками» в договорах) и значительно сократить трудозатраты.
  • Технология помогает менеджерам проводить внутренний аудит, оценивать проделанную сотрудниками работу. В дальнейшем это помогает предотвратить риски, вызванные человеческим факторов.
  • Сотрудники, работающие с договорами, получают инструмент, который помогает им заметить потенциально опасные параметры договора.
Узнать больше

Я ознакомлен(а) с условиями политики в отношении обработки персональных данных и даю согласие на обработку персональных данных