Descripción del proyecto:
Plazo de ejecución del proyecto del 01.01.2023 al 30.06.2024
Presupuesto total del proyecto: 440.073,00€. Importe financiado: 365.348,60€
Nuestro sistema de inteligencia artificial puede identificar automáticamente alrededor de 70 tipos diferentes de información en diversos documentos legales, con una precisión sin igual. Estos datos incluyen información sobre las partes involucradas, fechas, precios, duración, jurisdicción, ley aplicable, así como cláusulas y condiciones contractuales específicas, como penalizaciones, regímenes de cambio de control, derechos de tanteo y tracto, entre otros. Esto acelera y simplifica significativamente la revisión de contratos y documentos legales, permitiendo su clasificación para facilitar la toma de decisiones basada en esta información clave.
Por ejemplo, es posible identificar contratos firmados con una entidad específica, con un plazo restante superior a un periodo determinado, un precio mínimo y con obligaciones de no competencia asociadas a éstos.
Los modelos de inteligencia artificial que sustentan este sistema han sido entrenados por Bigle para ofrecer un alto rendimiento en la detección de estos datos en español, aunque también pueden trabajar en otros idiomas.
El objetivo del proyecto ha sido entrenar modelos de IA de tipo discriminativo* que sean capaces, especialmente en español pero también en otros idiomas como el inglés, de extraer 66 tipos de datos estructurados (es decir, aprovechables para fines como la generación de reportes, facilitar la búsqueda y clasificación de información, etc.) hallados en contratos. El tipo de dato para el que hemos entrenado los modelos lo hemos clasificado de dos formas:
Partes involucradas, fechas, precios, duración, juzgados y tribunales competentes, datos identificativos de partes, etc.
Existencia de cláusulas de no competencia, penalizaciones, regímenes de cambio de control, existencia de terceras partes beneficiarias del contrato, restricciones de precios, órdenes mínimas de compra, etc.
*Modelos discriminativos: a diferencia de los modelos generativos (los famosos LLMs), que se centran en generar contenido nuevo (i.e. combinaciones de palabras que den respuesta a un input o prompt formulado por un usuario), este tipo de modelo se centra en tareas de clasificación. En nuestro caso, procesar mediante técnicas de NLP (procesamiento del lenguaje natural) el texto de un contrato, para extraer datos concretos para los que el modelo ha sido entrenado.