10.18601/l6571959.n30.11
EL USO DE SISTEMAS INTELIGENTES (IA) EN EL REGISTRO DE LA PROPIEDAD INDUSTRIAL
USE OF INTELLIGENT SYSTEMS (AI) FOR IP REGISTER OFFICE
MAG. EMILIO GARCÍA RODRÍGUEZ*, PH.D. (C) DAVID DUQUE ARIAS**, PH.D. RUBÉN MANRIQUE*** Y MSC. FABIAN GIRALDO****
* Emilio García Rodríguez. Abogado de la Universidad Externado, Maestría en Derecho de la Empresa de la Universidad Pompeu Fabra. Profesor Universitario en Propiedad intelectual, Derecho de la Competencia y Negocios internacionales. Director de la Especialización en derecho de la Competencia de la Universidad Sergio Arboleda. Bogotá DC. (Colombia). Correo-e: emilio.garcia@eg-abogados.com.co.
** David Duque Arias. Ingeniero mecatrónico con Maestría en Automatización Industrial de la Universidad Nacional de Colombia y actualmente candidato a PhD en Morfología Matemática y Procesamiento de Imágenes en PSI. Research University, en Francia. Se desempeñó como docente de la Universidad Nacional de Colombia, en el departamento de Ingeniería Mecánica y Mecatrónica. Bogotá DC. (Colombia). Correo-e: daduquea@gmail.com
*** Rubén Manrique. Ingeniero electrónico con Maestría en Sistemas y Computación de la Universidad Nacional y PhD en Ingeniería de la Universidad de los Andes. Se desempeñó como docente investigador de la Universidad Sergio Arboleda. Actualmente apoya a la escuela de Ingeniería como docente cátedra de cursos relacionados a la Inteligencia Artificial. Bogotá DC. (Colombia). Correo-e: ruben.manrique@correo.usa.edu.co
*** Fabián Giraldo. Ingeniero de sistemas e informática con Maestría en Sistemas y computación de la Universidad Nacional de Colombia. Coordinador académico en la Decanatura de Innovación y Desarrollo Digital de la Universidad Sergio Arboleda. Bogotá DC. (Colombia). Correo-e: fabian.giraldo@gmail.com
Para citar el artículo: García Rodríguez, Emilio; Duque Arias, David; Manrique, Rubén y Giraldo, Fabián. "El uso de sistemas inteligentes (IA) en el registro de la propiedad industrial", en Revista de la propiedad inmaterial n.° 30, Universidad Externado de Colombia, julio 2020-diciembre 2020, pp. 295-326. DOI: https://doi.org/10.18601/l6571959.n30.11
Fecha de recepción: 7 de octubre de 2020. Fecha de aceptación: 6 de noviembre de 2020.
RESUMEN
El uso de sistemas inteligentes en el registro de la propiedad industrial por parte de la OMPI y oficinas nacionales competentes de diferentes países viene contribuyendo a la sustanciación de solicitudes, procesos de búsqueda y clasificación. Igualmente, existen desarrollos de empresas privadas que facilitan la gestión del registro y seguimiento a través de diferentes aplicaciones. En particular, nos referimos a la experiencia de la Superintendencia de Industria y Comercio de Colombia en el desarrollo de un sistema basado en IA, que permitirá a los usuarios tomar decisiones relacionadas con el registro, oposiciones, clasificación y sectorización de la solicitud basados en la Clasificación Internacional de Patentes (CIP).
Palabras clave: Inteligencia artificial; Registro de la Propiedad Industrial; Búsquedas automatizadas; Clasificación de marcas; Sectorización patentes.
ABSTRACT
The use of intelligent systems in the registration of industrial property by WIPO and competent national offices from different countries, with a view to facilitate the conduct of applications and the search and classification proceedings. There are also interesting developments by private companies which facilitate the management of the registry and monitoring through different applications, created from artificial intelligence algorithms. In particular, we refer to the experience of the Superintendency of Industry and Commerce of Colombia (SIC), in the development of a system based on AI, which allows users to make decisions related to the registration and eventual opposition to the registration of a trademark.
Keywords. Artificial Intelligence; Industrial Property Registration; Automated Searches; Trademark Classification; Patent Sectorization.
"La IA es una frontera digital nueva que tendrá
una profunda incidencia en el mundo"
Francis Gurry, Director General de la OMPI (2018).
INTRODUCCIÓN
La Inteligencia Artificial (IA) viene siendo utilizada por varias oficinas nacionales competentes para apoyar a usuarios en la búsqueda de antecedentes marcarios, clasificación de patentes, búsqueda de estado de la técnica, entre otras aplicaciones útiles, y tiene un enorme potencial en la gestión de registro de la propiedad industrial para apoyar el examen de las solicitudes mediante toma de decisiones automatizadas. En efecto, a través de sistemas de machine learning1 (aprendizaje automático) que aplican algoritmos a la información contenida en bases de datos, se logran obtener patrones y se infiere información para arrojar puntajes, clasificaciones o cálculos de riesgo que resultan útiles tanto para usuarios como examinadores.
La utilización de estos sistemas favorece no solo la eficiencia sino que mejora la calidad de las decisiones al permitir superar la subjetividad en los exámenes de registrabilidad, que se logra cuando se adelanta un proceso de entrenamiento adecuado que evite sesgos que influyen en la decisión propuesta, por dos aspectos: en primer lugar, por no tomar una muestra aleatoria estadísticamente válida y, en segundo lugar, porque se alimenta con un historial de decisiones anteriores que utilizan criterios que debieron ser revaluados.
Este artículo tiene como propósito analizar la manera en que ha contribuido la IA a la gestión de la propiedad industrial.
I. CONCEPTO DE INTELIGENCIA ARTIFICIAL
La Inteligencia Artificial (IA) es una disciplina de las ciencias informáticas cuyo objeto es elaborar máquinas y sistemas que puedan llevar a cabo tareas que requieren inteligencia humana, con una intervención humana limitada o nula. La OCDE ha adoptado la siguiente definición sobre IA:, "un sistema basado en la máquina que puede, para un determinado conjunto de objetivos definidos por humanos, hacer predicciones, recomendaciones o decisiones que influyen en entornos reales o virtuales"2.
El aprendizaje automático y el aprendizaje profundo son dos ramas de la IA3. Una de dichas técnicas de aprendizaje automático es el deep learning, que utiliza "redes neuronales" (Navas, 2017)4, a través de las cuales la máquina actúa como una red neuronal que imita el funcionamiento del cerebro, y otras técnicas son la ingeniería del conocimiento, sistemas basados en reglas, razonamiento basado en casos, sistemas expertos, técnicas de representación de conocimiento, procesamiento del lenguaje natural y minería de datos.
Así entendida, la inteligencia artificial (IA) está impulsando desarrollos en tecnología de todo orden: vehículos autónomos, diagnósticos médicos y manufactura avanzada, pronóstico del tiempo, rendimiento de los cultivos, detección de cáncer, productividad industrial, entre otros, cuyo crecimiento se impulsa gracias a la potencia de procesamiento computacional que permite detectar patrones entre millones de datos que con apoyo en la IA se relacionan para mejorar procesos, ingeniería del conocimiento, sistemas basados en reglas, razonamiento basado en casos, sistemas expertos, técnicas de representación de conocimiento, procesamiento del lenguaje natural y minería de datos
II. LA TECNOLOGÍA UTILIZADA
El algoritmo constituye una secuencia de operaciones lógicas que se traducen en instrucciones para que un sistema adopte decisiones automáticamente5 utilizando como insumo importantes volúmenes de datos (Big Data) que sirven en este caso para proponer soluciones a decisiones administrativas y en el ámbito privado para variados fines; a modo de ejemplo, que los usuarios de un servicio de registro de la propiedad industrial puedan adoptar decisiones relativas a trámites que adelantan6. Los resultados que se obtengan se basan en entradas de datos y parámetros inferidos de una muestra independiente de datos, generando como ventajas su fiabilidad y precisión, ya que efectúan la toma de decisiones pertinente sin ambigüedades.
Una de las técnicas de aprendizaje automático es el deep learning (aprendizaje profundo) (LeCun, 2015) que utiliza redes neuronales7 y tiene como objetivo imitar el principio de funcionamiento de un cerebro humano compuesto por millones de neuronas. El objetivo principal consiste en entrenar un modelo matemático lo suficientemente complejo y con un volumen de información elevado, de modo que sea capaz de resolver tareas complejas a partir del mismo principio de funcionamiento de una red de neuronas biológica, en el que cada neurona es experta en una tarea muy específica.
Este tipo de modelo matemático utilizado para representar el comportamiento de las neuronas biológicas es conocido como redes neuronales artificiales o, simplemente, redes neuronales. Aunque el concepto fue desarrollado desde la década de 1960 (Ivakhnenkom 1970), solo fue hasta los 2000 en que fueron finalmente utilizadas gracias al elevado desarrollo a nivel de hardware que permitió reducir el tiempo de cálculo de las operaciones matemáticas en los computadores.
El principio de funcionamiento de las redes de neuronas artificiales está fundamentado en la capacidad de cada neurona para "aprender" a activarse, o no, a partir de las entradas que recibe, o estímulos. La salida de cada neurona puede estar conectada a otras neuronas, de modo que la activación de una neurona afecta directamente la información que reciben las neuronas que le siguen. Lo anterior implica que el proceso de aprendizaje de una red de neuronas para ejecutar operaciones complejas, tales como la detección de objetos o el reconocimiento de texto, requieren de modelos compuestos por miles de millones de parámetros, volúmenes de información muy elevados y recursos de cómputo potentes, que permitan entrenar correctamente los modelos.
III. LA IA Y SU APLICACIÓN EN LA GESTIÓN DE REGISTROS DE LA PI
En el mundo se presentan cada año aproximadamente 3,2 millones de solicitudes de patente, 7 millones de solicitudes de registro de marca y 1 millón de solicitudes de registro de diseños industriales, lo que supera en gran medida la capacidad del recurso humano disponible en las oficinas competentes para el registro de la propiedad industrial, según datos de la OMPI.
Consciente del desafío que ello implica, la OMPI desarrolló una herramienta basada en inteligencia artificial para buscar imágenes de marcas (WIPO Brand Image Search), incorporada a la Base Mundial de Datos sobre Marcas de la organización y elaboró una herramienta avanzada de traducción automática neuronal que lleva el nombre de WIPO Translate, que se comparte con 14 organizaciones intergubernamentales y diversas oficinas de patentes de todo el mundo y presentó en mayo de 2018 una herramienta que utiliza tecnología de redes neuronales para la clasificación automática de patentes en el marco del sistema de la Clasificación Internacional de Patentes (CIP), conocida como IPCCAT-neural, que viene siendo perfeccionada utilizando información actualizada contenida en las patentes para facilitar el acceso y las búsquedas sobre el estado de la técnica por parte de los examinadores.
En el tema de marcas, el algoritmo de similitud de imagen basado en IA de la OMPI se puede utilizar con diversos criterios de búsqueda; a manera de ejemplo, limitando la lista de resultados a un determinado conjunto de territorios o a una o varias partes de la Clasificación Marcaria Internacional de Niza, de manera que los usuarios pueden buscar una imagen compleja o compuesta obteniendo imágenes similares con resultados más pertinentes.
Igualmente, diversas oficinas de PI del mundo han desarrollado y empleado otras aplicaciones de IA8. Por su parte, varias empresas privadas, como Clarivate, han desarrollado plataformas como CompuMark, que permite la búsqueda de marcas en varios países del mundo en forma simultánea, así como Corsearch con su herramienta TrademarkNow permite búsquedas de marcas y ofrece servicios para empresas, bufetes de abogados o agencias de marcas procedimientos de observación u oposición.
En este contexto, la IA se presenta entonces como un elemento importante en la gestión de la propiedad industrial tanto privada como pública para facilitar la búsqueda de antecedentes marcarios, facilitar el examen de patentes e incluso ampliar su uso en la búsqueda y comparación de secuencias genéticas relacionadas con determinadas solicitudes de patentes como lo señala igualmente el director de la OMPI.
IV. UN CASO DE ESTUDIO: EL DESARROLLO BASADO EN IA PARA LA SIC
A finales del año 2019, el gobierno colombiano aprobó la Política Nacional para la Transformación Digital e IA, cuyo objetivo, de acuerdo con el MinTIC, es promover el uso estratégico de tecnologías digitales en los sectores público y privado. Esta política busca crear alianzas internacionales para la innovación, el diseño y ejecución de iniciativas que fomenten el emprendimiento y la transformación digital. Sus prioridades son la creación de un mercado de IA en el país y la atracción de talento internacional9.
Conforme a los lineamientos generales y las políticas de Gobierno Digital recogidas en el Decreto n.° 1078 de 2015 y en el Decreto n.° 1008 de 2018, a través de los cuales se promueve el uso y aprovechamiento de las tecnologías de la información y las comunicaciones, la Superintendencia de Industria y Comercio identificó la necesidad de contar con nuevas herramientas inteligentes para dar soluciones a procesos repetitivos, disposición de datos de calidad, estructurados y obtener rendimiento de dichos datos para la toma de decisiones de calidad en tiempo real, aplicando sistemas de tecnología de la información que copien comportamientos humanos que permitan aprender y resolver problemas de manera ágil y eficaz, evitando errores y obtener resultados predictivos y estandarizados para mejorar los indicadores claves.
En este contexto, la SIC suscribió con la Universidad Sergio Arboleda un Convenio de Cooperación para desarrollar un sistema inteligente que permita a los titulares o solicitantes de signos distintivos tomar decisiones informadas sobre solicitudes de registro, a través de búsquedas de información contenida en las Gacetas de Propiedad Industrial activas, para analizar si un signo distintivo puede estar incurso en alguna de las causales de irregistrabilidad contenidas en el artículo 136 de la Decisión 486 de la Comunidad Andina, al compararlo con posibles marcas similares. De igual manera, un sistema inteligente con la capacidad de realizar procesos de clasificación automática de patentes. A continuación, se realiza el proceso de descripción de ambos sistemas.
I. CONSIG (Sistema desarrollado para la SIC)
Solución propuesta
Se desarrolló una herramienta denominada CONSIG para la evaluar si un signo distintivo puede estar incurso en alguna de las causales de irregistrabilidad. La evaluación se realiza mediante el análisis de la marca desde dos perspectivas: a nivel gráfico y a nivel de texto. En ambos casos, se utilizan técnicas de Aprendizaje Automático y modelos de Aprendizaje Profundo, los cuales ejecutan un análisis complementario 100% automático.
Algunos de los trabajos previos que se han desarrollado en el área de Content Based Image Retrieval (Rehman, 2012) ejecutan el análisis a partir de características hand-crafted, tales como eigenvectores, colores, texturas y gradientes. Sin embargo, luego de los resultados obtenidos a partir de 2010 en diferentes áreas del conocimiento con metodologías basadas en modelos de Aprendizaje Profundo (Lecun, 2015), se ha demostrado que la representación de los datos mediante enfoques jerárquicos permite obtener resultados notablemente mejores que los obtenidos con las características de bajo nivel, como lo son las hand-crafted. Adicionalmente, una de las principales ventajas de los modelos Deep es que pueden ser adaptados para ser utilizados en aplicaciones similares a las que inicialmente fueron concebidos. Por ejemplo, un modelo entrenado con millones de imágenes para detectar la presencia de peatones en fotografías puede ser adaptado para aprender a detectar el logo dentro de una imagen, como se realizó en la solución desarrollada. Esta técnica se denomina Transfer Learning (Torrey, 2010) y ha demostrado buenos resultados en un amplio número de aplicaciones que requieren modelos de aprendizaje profundo.
Como se describe en los siguientes apartados, la herramienta desarrollada integra múltiples conceptos y modelos estadísticos en diferentes etapas del proceso de evaluación de similitud: análisis espectral, identificación de la región de interés, análisis de características jerárquicas, análisis fonético y léxico. Lo anterior permite que la respuesta retornada al usuario esté compuesta por análisis interpretables. Esto último es en general uno de los principales problemas que limita el uso de modelos de Aprendizaje Profundo (Gao, 2018) en aplicaciones industriales.
Descripción de la solución
El análisis de la similitud es realizado entre una marca cargada por el usuario, a través de un interfaz gráfico y un conjunto de marcas ya registradas en la base de datos de la SIC. La respuesta para el usuario es un conjunto de scores entre 0% y 100%, que indican el grado de similitud entre la imagen de entrada y cada una de las marcas activas, siendo 0% nada parecido y 100%, idéntico. Cabe resaltar que el score total está compuesto por varios análisis independientes con el objetivo de incrementar la robustez del algoritmo: color, formas, sintáctico y léxico.
El servicio IA desarrollado está compuesto por dos módulos principales: extracción de características y evaluación de similaridad, como se presenta en la Figura 1. Con el objetivo de reducir el tiempo de respuesta al usuario, la solución propuesta ejecuta el análisis de las marcas activas en la base de datos offline (mediante un job, como se explicará más adelante) y únicamente hace la extracción de características de la marca cargada por el usuario online.
A continuación, se describirán los dos módulos principales que componen CONSIG, teniendo en cuenta que la extracción de las características es una etapa que se ejecuta en dos momentos diferentes: el primero, con las marcas activas en la base dedatos y el segundo, con la nueva marca cargada por el usuario.
A. Extracción de características
El primer módulo del sistema IA extrae las características más relevantes de una marca a través del análisis independiente de color, forma y texto. El primero de estos análisis busca identificar la información espectral más importante que está contenida en una imagen, mediante la evaluación de los histogramas de color. Así mismo, incluye la identificación de los colores Pantone presentes, en caso de que la marca re ivindique un color. El segundo análisis fue desarrollado a través de un enfoque de Deep Learning (en adelante DL), con el objetivo de idenrificar la disiribución espacial de los diferentes componentes en la imagen, así como reconocer representacio nes más abstractas, imposibles de describir solo a partir de la información color. Finalmente, el tercer análisis implica extraer las características léxicas del texto ingresado por el usuario.
Es importante resaltar que la extracción de características de color y forma son calculadas para las marcas figurativas o mixtas, es decir, las que incluyen una imagen de la marca y las características del texto son extraídas para las marcas nominativas o mixtas, a partir de las palabras ingresadas por el usuario.
Características de color
Una imagen en el espacio de color RGB (Red, Green; Blue) está representada como la combinación de 3 imágenes, conocidas como canales, en escala de grises. Esto quiere decir que, para cada color existente, hay una combinación posible de los 3 colores primarios rojo, verde y ozul que lo representa fielmente. Cabe resaltar que cada uno de estos canales es completamente independiente de los otros dos.
Un histograma es una representación gráfica que permite representar la frecuencia de los colores en una imagen. Las características de color calculadas fueron extraídas de manera independiente por canal a partir de los histogramas. En la Figura 2 se presentan los histogramas extraídos para una imagen de la base de datos LLC (Large Scale Logo Dataset).
En esta imagen, por ejemplo, se puede observar un elevado número de pixeles con valores de intensidad alrededor 200 en el canal rojo y de alrededor de 140 en el canal azul. Esto se explica porque el color fucsia de la imagen se construye a partir de la combinación de rojo y azul. Por otra parte, se puede observar que el canal verde tiene la gran mayoría de pixeles con valores inferiores a 50. Esto indica que la imagen no tiene colores ni combinaciones que requieren del canal verde. Finalmente, se puede observar también que en todos los canales hay pixeles con valores cercanos a 255 (que es el valor máximo). Esto se explica porque el color blanco se construye en el espacio RGB como la combinación de 255 en todos los canales.
El cálculo de las características de color se realiza a partir de los histogramas por canal de cada imagen. Se tomaron los primeros tres momentos estadísticos por canal: media, desviación estándar y skew. De modo que en total se calcularon 9 características de color por imagen. Las características de color calculadas están basadas únicamente en la información espectral identificada a partir de los histogramas por canal. De manera experimental, así como en la bibliografía disponible, se encontró que los seres humanos utilizan este tipo de características para evaluar de manera rápida la similitud entre diferentes imágenes.
Por otra parte, se desarrolló un módulo para identificar los colores de la escala Pantone presentes en la imagen. La escala Pantone solid coated está compuesta por 1.860 colores RGB y es muy común en el ámbito del marketing y la impresión digital. Sin embargo, no puede ser directamente utilizada para la extracción de características debido a que el número total de colores en el espacio RGB es considerablemente más grande (2.553 = 16,7 millones). A partir de lo anterior, el módulo de análisis Pantone desarrollado identifica automáticamente los colores Pantone presentes en la imagen cargada por el usuario y, en caso de haberlos, los incluye en la respuesta que es retornada.
Características de forma
La extracción de características de forma está dividida en dos etapas DL: identificación automática de la región de interés y cálculo de características. Lo anterior, se realizó con el objetivo de obtener las características lo más discriminantes posibles a partir de la imagen de entrada.
Extracción de región de interés
La región de interés, también conocida como ROI (Region of Interest), es el área de la imagen que contiene suficiente información para identificar la imagen completa. En el caso particular de la evaluación de similitud de marcas, fue necesario agregar esta etapa debido a la falta de homogeneidad de las imágenes en la proporción del tamaño total. Particularmente, se encontraron un gran número de imágenes en las que el logo ocupaba una región muy pequeña del total, por lo que las técnicas clásicas de extracción de características lo suficientemente discriminantes. En la Figura 3 se presentan dos de las imágenes presentes en la base de datos que ocupan una región muy pequeña de la imagen.
La etapa de extracción de la ROI está fundamentada sobre una arquitectura DL conocida como Faster R-CNN (Ren et al., 2015), la cual permite identificar y clasificar automáticamente objetos en diferentes escenarios. Sin embargo, su funcionamiento no es el correcto para la detección de la ROI en imágenes tan particulares, como lo son las marcas.
Fue por esto que se llevó a cabo una etapa de entrenamiento utilizando imágenes de marcas disponibles en el dataset Flickr logos 27 (Kalantidis, 2011), compuesto por cerca de 5 mil imágenes. Una de las características más importantes de este dataset es que cuenta con las ROI de cada imagen ya etiquetadas. Esto último, permitió realizar lo que se conoce como transfer learning y lograr adaptar el modelo inicial de Faster R-CNN e identificar de manera confiable la región de interés en las imágenes de marcas.
Transfer learning
El transfer learning (Torrey, 2010) es una estrategia muy utilizada en Deep Learning que ha demostrado buenos resultados en múltiples aplicaciones, incluyendo el procesamiento de imágenes: detección de objetos, segmentación, clasificación, entre otras. La idea de base del transfer learning consiste en tomar un modelo DL desarrollado para una aplicación y adaptarlo a otra aplicación relacionada.
En el caso en particular del sistema CONSIG, la extracción de la región de interés consiste en la identificación del área de la imagen que con mayor probabilidad contiene el logo. Por ejemplo, en el caso de Faster RCNN, el modelo fue entrenado originalmente para identificar hasta 1.000 objetos diferentes en un amplio número de escenarios. Sin embargo, su funcionamiento no es el correcto al identificar la ubicación del logo. En la Figura 4 se presenta un ejemplo de las predicciones de la ROI, utilizando el modelo original de Faster RCNN.
Como se puede observar, las regiones que predice corresponden únicamente a BG (background o fondo) y no encuentra en ninguno de los casos, las regiones donde están localizados los logos. Es por esto que fue necesario adaptar el modelo para resolver el problema de identificación de la ROI en imágenes de marcas.
La adaptación del modelo inicial para que aprenda a resolver el problema de la identificación del logo depende en gran medida de disponer de un conjunto de imágenes de entrenamiento adecuado. Lo anterior implica tener una base de datos con imágenes de logos en los que se encuentren anotadas la ROI de cada imagen. Sin embargo, a pesar de disponer de miles de imágenes en la base de datos de la SIC, estas no fueron utilizadas en el entrenamiento porque no cuentan con las anotaciones que indiquen dónde se encuentra la ROI de cada marca.
Luego de realizar una revisión bibliográfica extensa, se identificó un dataset con imágenes de marcas con las ROI anotadas: Flickr 27 dataset. Sin embargo, la mayoría de las imágenes corresponden a fotos del mundo real en las que aparece un logo rodeado de otros objetos, como por ejemplo una valla publicitaria con texto y un logo de una marca de ropa. En la Figura 5 se presentan algunas de las imágenes disponibles en el dataset
Por esto, fue necesario seleccionar manualmente las imágenes con características similares a aquellas marcas registradas en la SIC para realizar el entrenamiento. El conjunto de marcas seleccionado está compuesto por 156 imágenes y en la Figura 6 sepresentan tres de las marcas seleccionadas de Flickr27-
El siguiente paso consistió en entrenar el modelo inicial de Faster RCNN con el conjunto de imágenes seleccionado y se dividió así: 70% para entrenamiento, 20% para validación y 10% para test. Después, se siguió una estrategia clásica para adaptar la red neuronal al problema de identificación de logos: "congelar" los pesos de las neuronas que codifican la imagen y únicamente actualizar los pesos de las últimas capas de decodificación. Se ejecutaron 20 épocas de entrenamiento yal final se tomó el modelo con mejor rendimiento en el conjunto de prueba.
Luego de obtener un modelo adaptado al problema de detección de logos, su funcionamiento fue evaluado en marcas de la SIC. En la figura 7 se presentan los resultados al predecir la ROI en algunas de las marcas registradas en la base de datos de la SIC en el año 2020.
Finalmente, gracias a la adaptación del modelo de Faster RCNN para la detección de los logos, se utiliza para la predicción de la ROI de las marcas tanto de las registradas, como para las imágenes que son cargadas por los usuarios. Cabe resaltar que, en caso de que el algoritmo no encuentre una ROI válida, se asigna como ROI la imagen completa. Esto último puede ocurrir cuando los logos ocupan toda la imagen, por ejemplo.
Extracción de características de forma
La extracción de las características de forma está fundamentada en un modelo DL denominado R-MAC (Regional Maximum Activation of Convolutions) (Tolias, 2016), el cual permite representar una imagen como un vector de n-elementos. Esta arquitectura ha sido implementada en diferentes escenarios de detección de objetos y ha demostrado ser lo suficientemente robusta para representar las características más importantes de una imagen.
En el caso de CONSIG, se adaptó el modelo de RMAC para representar cada imagen de entrada por un vector de 512 características, con valores decimales en el rango entre 0 y 1. Cabe resaltar que las características son extraídas únicamente en la ROI identificada en la sección anterior.
Características de texto
A nivel de las características del texto que compone una marca, extraemos como características las palabras que componen el texto y sus representaciones fonéticas.
Eliminamos de la representación textual de una marca todas aquellas palabras que carecen de valor dentro del análisis, como artículos, pronombres y preposiciones. Nuestro modelo acepta palabras tanto en español como en inglés, ya que estos dos lenguajes explican el 93% de las marcas existentes en la base de datos nacional. A partir de las palabras filtradas y su composición a nivel de caracteres, calcularemos la similitud léxica entre dos marcas, como se explicará en la siguiente sección.
Para cada palabra filtrada, además, construimos una representación que nos permitirá saber si estas palabras comparten pronunciaciones similares. Estas representaciones se logran aplicando algoritmos fonéticos que dividen de manera aproximada la palabra por el sonido que produce cada una de las sílabas que la componen e identifican incluso las sílabas de mayor peso tónico.
Para ser más precisos, cada uno de estos algoritmos crea una representación fonética específica de una sola palabra. Por lo general, dicha representación es una cadena de longitud fija o de longitud variable que consta solo de letras o una combinación de letras y dígitos. La estructura detallada de la representación depende del algoritmo. Si dos representaciones, calculadas con el mismo algoritmo, son similares, las dos palabras originales se pronuncian de la misma manera sin importar cómo se escriban o los caracteres que las componen. Esto ayuda a detectar palabras que suenan similares incluso si se escriben de manera diferente, sin importar si se hacen a propósito o por accidente.
Los algoritmos se diseñan con un determinado lenguaje o propósito en mente, y no encajan en los demás idiomas exactamente de la misma manera. El algoritmo original de Soundex (Pinto, 2012) se centra en el idioma inglés, mientras que Kölner Phonetik (Jokisch, 2017) se centra en el idioma alemán, que contiene diéresis y otros caracteres especiales. Dado que nuestro foco con marcas registradas en Colombia diseñamos algoritmos enfocados a español a partir de algunos existentes para inglés. Específicamente se usaron las versiones originales de los algoritmos Soundex y Metaphone y sus variantes para el lenguaje español. Las variantes fueron diseñadas específicamente para el sistema de IA de la SIC y contiene jerga e incluso regionalismos colombianos.
B. Cálculo de similitud
La evaluación de la similitud entre una marca cargada por un usuario y otro conjunto de marcas existente se realiza a partir de las características descritas en la sección anterior. Esto implica que el análisis de similitud se realiza desde tres ángulos diferentes y complementarios: color, forma y texto. Las primeras dos son exclusivas de imágenes y la tercera, únicamente en el texto. En consecuencia, el cálculo de la similitud se realiza desde las tres mismas perspectivas, y al final son integrados en un score total, el cual también es presentado al usuario.
Coseno como medida de similitud
En este punto del proceso, cada imagen, tanto las de la base de datos como la cargada por el usuario, se encuentra representada como dos vectores de características: el primero, que representa las características de color, de 9 elementos; y el segundo, de las características de forma, de 512 elementos. Lo anterior, implica que la evaluación de la similitud entre la marca cargada por el usuario y cada una de las marcas vigentes en la base de datos debe ser realizada mediante un cálculo de una métrica. Cabe resaltar que este cálculo se realiza entre cada vector de características de la imagen de entrada y los vectores de características de todas las imágenes vigentes en la base de datos.
Durante el desarrollo de CONSIG, se evaluaron varias métricas para calcular la similitud entre vectores de alta dimensión, tales como: distancia euclídea, distancia Mahalanobis, distancia Manhattan y el coseno. Los mejores resultados fueron obtenidos a través del coseno, el cual es calculado como el producto punto entre los dos vectores. En la Figura 8 se presenta un ejemplo de la similitud entre los vectores A y B a partir del coseno.
A partir de lo anterior, la evaluación de la similitud de los vectores de características (color y forma) de la imagen de entrada y los de las marcas activas en la base de datos, se realiza de manera independiente a partir del coseno. Esto quiere decir que tanto el vector de características de color como el vector de características de forma son comparados contra los vectores de las n imágenes activas. A partir de lo anterior si, por ejemplo, hay 10 marcas activas en la base de datos, en total se calcularán 20 valores de similitud: 10 para las características de color y 10 para las características de forma.
Con respecto a los valores retornados por el coseno, corresponde a valores decimales en el rango entre -1 y 1, en donde 1 implica total similitud y -1 es total disimilaridad. En el caso de CONSIG, se mapean los valores de coseno para retornar un valor decimal entre 0.0 y 1.0, en donde 0.0 es nada parecido y 1.0 es idéraico. El cálculo del coseno fue vectorizado con el objetivo de reducir el costo computacional de esta operación.
Similitud de contenido textual
Para marcas nominativas (i.e. puramente textuales) se implementaron en CONSIG modelos fonéticos que permiten establecer similitud por pronunciaciones equivalentes o cercanas y un modelo sintáctico/léxico que analiza el texto a nivel de caracteres y palabras.
Similitud sintáctica/léxica: la similitud entre componentes nominativos de marca es un análisis que requiere contemplar equivalencias no exactas. Así por ejemplo, palabras como Amor y @mor pueden tener una alta similitud aun cuando no existe un match exacto entre los caracteres/lexemas que las componen. La existencia de equivalencias formales a nivel de caracteres en los lenguajes hace necesario el uso de medidas de patrones aproximados.
Fuzzy string matching (FSM): es la técnica de encontrar cadenas que coincidan aproximadamente con un patrón (en lugar de exactamente) (Wu, 2016). En otras palabras, la concordancia de cadenas aproximadas es un tipo de búsqueda que encontrará coincidencias incluso cuando los usuarios escriban mal las palabras, ingresen palabras parciales, o existan equivalencias a nivel de caracteres. FSM ha sido ampliamente usado en interfaces de sistemas de búsqueda para identificar posibles errores ortográficos. Los buscadores Google, Bing y Yahoo lo usan, por ejemplo.
Nuestro enfoque FSM se basa en la aplicación de la distancia Levenshtein, que es una métrica para medir qué tan separadas están dos secuencias de caracteres. En otras palabras, mide la cantidad mínima de ediciones que debe realizar para cambiar una secuencia de una palabra por otra. Estas ediciones pueden ser inserciones, eliminaciones o sustituciones. El análisis incluye además un diccionario de equivalencias propias de los lexemas en lenguajes que usan el alfabeto latino. Para cada palabra filtrada en el proceso de extracción de características, aplicamos FSM para identificar su similaridad con palabras de otras marcas.
Similitud fonética: usando las representaciones fonéticas de los algoritmos especificados en la sección anterior y aplicando nuevamente la distancia Levenshtein, calculamos qué tan distantes o cercanas son las pronunciaciones de las palabras que componen las marcas. Si bien esta estrategia puede ser aplicada para lexemas en lenguajes que usan el alfabeto latino, pueden ser no tan fieles para lenguajes diferentes del inglés o español.
Integración de scores
Los valores calculados en la sección anterior indican la similitud entre la marca de entrada y cada una de las marcas vigentes a través de cuatro scores: color, forma, fonético y léxico. Los primeros dos indican la similitud a nivel de imagen y las últimas dos, a nivel textual. A partir de los requerimientos del proyecto, la evaluación de la similitud se realiza en función del tipo de marca ingresado por el usuario:
A partir de lo anterior, se observa que el cálculo del score total depende del tipo de marca ingresado por el usuario. Por esto, se definieron los siguientes valores para ponderar la incidencia de cada score individual:
Job de características
La solución propuesta para la evaluación de similitud de marcas tiene como principio la ejecución de los cálculos más costosos computacionalmente offline, es decir, en un instante de tiempo previo a que el usuario realice la solicitud. Se implementó un job para calcular las características de las marcas vigentes para un rango de fecha determinado. Esta operación está compuesta por:
Nueva evaluación de similitud
La evaluación de similitud de una marca cargada por el usuario se realiza con las características calculadas en el job. El proceso para evaluar la similitud de una nueva marca se realiza en dos etapas, como se presenta en la Figura 1. La primera es la extracción de las características según el tipo de marca seleccionada por el usuario. Y la segunda es la evaluación de similitud entre la marca del usuario y cada una de las marcas vigentes en la base de datos.
Como se presentó en la sección de Evaluacián de Similitud, al servicio IA culcula hasta cuatro scores, en función del tipo de marca ingresada por el usuario: nominativa, figurativa o mixta. Lo anterior implica que la salida del servicio IA es un conjunto de scores que indica la similitud entre la marca del usuario y las marcas vigentes en la base de datos. A continuación, se presenta un ejemplo de evaluación de similitud para una nueva marca.
En el caso de la Figura 9 se evalúa la similitud de una marca de tipo mixto (imagen y texto) con un nombre de marca red y un archivo de imagen ejemplo. jpeg. Se evaluará la similitud con las marcas con similitud entre 60% y 100% en las gacetas seleccionadas por el usuario (129, en este caso). En la Figura 10 se presenta un ejemplo de la respuesta retornada al usuario por parte del sistema.
Adicionalmente, y como se mencionó en secciones anteriores, la evaluación de la similitud está compuesta por el análisis desde 4 perspectivas: color, forma, sintaxis y fonética. En la Figura 11 se presenta un ejemplo de los scores para la marca ingresada por el usuario, que corresponde exactamente a la misma imagen, pero con diferente nombre.
De los resultados obtenidos en este ejemplo, se evidencia que la marca ingresada por el usuario presenta un score de similitud elevado en color y profundidad (forma), ya que corresponde a una marca ya registrada en la base de datos. Sin embargo, el nombre de la marca ingresada (red), no corresponde exactamente al nombre ya registrado pero si presenta cierto grado de similitud (léxico y fonético).
2. CLASEPA (Sistema de Clasificación de Patentes)
Las patentes proveen un exclusivo mecanismo para la protección legal de las invenciones e igualmente juegan un rol importante para registrar los avances y realizar procesos de difusión tecnológica. Al momento de realizar el proceso de registro de una invención en alguna oficina de patentes a lo largo del mundo, estas deben realizar una revisión con el fin de aceptarla o rechazarla y asignar la patente a una o varias categorías de acuerdo con el sistema estandarizado de clasificación internacional IPC (International Patent Classification) mantenido por la WIPO (World Intellectual Property Organization) (Gomez, 2012).
Para realizar el proceso de aceptación y categorización de una patente, examinadores con diferentes niveles de conocimiento deben hacer un proceso de clasificación de forma manual. Dependiendo de la taxonomía usada y el nivel de clasificación adoptado, una patente podría ser clasificada en una o más de los 70.000 diferentes subgrupos (nivel 5) existentes en IPC, lo cual hace que no sea un proceso sencillo.
Dado que una patente es un documento textual, CLASEPA, como lo denominaremos de ahora en adelante, consiste en un sistema de clasificación automática de texto en español, el cual tiene como objetivo asignar un documento a un conjunto de categorías existentes. Es decir, dada una patente el sistema tendrá la capacidad de asignarla a una categoría a nivel subclase respecto al sistema de clasificación internacional de patentes IPC. Para los procesos de entrenamiento se toma en consideración la información del título, resumen, descripción y reclamaciones (Gómez, 2012).
Para afrontar la solución al sistema de clasificación de patentes se toma la aproximación de utilizar un sistema de clasificación jerárquico plano (Hernández J., 2012), (D'hondt E. et al., 2017). Esta aproximación considera realizar el entrenamiento de un único clasificador multiclase.
En la Figura 12 se muestra cómo el clasificador omite la jerarquía y solo considera la información del último nivel. En el caso, el sistema de clasificación de patentes bajo este tipo consiste en entrenar un clasificador cuyas etiquetas de clase considera las subclases (A). Al momento de realizar un proceso de predicción o categorización de una nueva patente, el modelo pone a competir las diferentes categorías a nivel de subclase con el fin de presentar como resultado la o las que tenga una aproximación más cercana (B).
Para explicar más detalladamente el proceso de clasificación, considere que dada una patente debe clasificarla en las categorías A61K, B60R, C12N y H05K. Para tal caso, debe tener ejemplos de patentes para cada categoría que fueran previamente clasificadas. Esto con el fin de entrenar una herramienta de Inteligencia Artificial bajo un enfoque de aprendizaje supervisado que tenga la capacidad de aprender las características de las patentes de cada categoría.
Con un modelo de Inteligencia Artificial definido, nuevas patentes pueden ser clasifícadas de forma automática, es decir, podrá decidir en qué categoría (A61K, B60R, C12N y H05K) podrá ser ubicada con cierto porcentaje de probabilidad.
A continuación, se realiza una explicación detallada de los pasos requeridos para realizar el proceso de entrenamiento del clasificador (Figura 13).
Carga de información: esta, fase consiste en obtener patentes de diferentes fuentes de información con el fin de utilizarlas como ejemplos para los procesos de entrenamiento y prueba en el diseño del clasificador. Específicamente, se utilizó la infomación del repositorio depatentes disponibles en la base de datos de la Superintendencia de Industria y Comercio (SIC); también se utilizaron las patentes disponibles en la oficina española de patentes y marcas y, por último, con el fin de completar subclases en las cuales se tuviera un número reducido de ejemplos, se realizaron procesos de extracción de información desde el sistema de información Latipat-Espacenet.
Preprocesamiento: durante el trabajo se realizaron las siguientes tareas en las fases de preprocesamiento: normalización del texto (letras minúsculas, procesos de tokenización), eliminación de palabras con poco significado semántico (stopWords) y obtención de los sustantivos nominativos a partir de la utilización de técnicas de POS (Part Of Speech). Como resultado de la fase de preprocesamiento se obtiene una base de patentes normalizada y preparada para realizar las tareas de entrenamiento del sistema de clasificación. De la misma manera, para realizar la representación de los documentos se utilizó el esquema de representación vectorial y como estrategia ponderación se utilizó TF-IDF.
TF-IDF representa la frecuencia de palabras en el documento normalizada por la frecuencia de aparición de dicha palabra en una colección de documentos. En general, la importancia de una palabra clave depende de dos factores. La Frecuencia Relativa (TF) de aparición de la palabra clave en el documento, mientras que la Frecuencia de Documento (DF) mide el número de documentos que contienen la palabra. Si la frecuencia de una palabra clave es menor en todos los demás documentos que en el documento actual, esta palabra clave representa el documento actual mejor que otros documentos; por lo tanto, su poder discriminatorio es mucho mayor.
Modelo: el modelo construido para realizar los procesos de entrenamientos tiene como base modelos de regresión logística (Al-Tahraw, 2015). El modelo de regresión logística (LR) realiza la clasificación determinando el impacto de múltiples variables independientes (características) presentadas simultáneamente para predecir una de dos categorías (clasificación binaria). Para el caso de clasificación multiclase se usó la aproximación One vr Rest (OvR) (Rifkin, 2004).
Una vez que converge el algoritmo de optimización se calculan la precisión Top 1 y Top N. Donde N indica que las N categorías principales predichas por el clasificador se comparan con la clase principal de IPC en el cual se encuentra clasificada la patente en el proceso de pruebas. Si se encuentra coincidencia, la categorización se considera correcta. Los resultados obtenidos indican que se tiene una precisión del 78% para el caso del Top 1 y de un 88% para el Top 3.
En la Figura 14 se presenta la interfaz construida para realizar el proceso de clasificación. Específicamente, los examinadores pueden cargar documentos en formato pdf, doc y a través de procesos de OCR en caso de ser requerido extraer la información. Dicha información se envía al clasificador el cual predice: la sección, la clase y la subclase, así como el sector y subsector tecnológico al cual pertenece la patente (Figura 15).
V. ALGUNAS DE LAS REGLAS JURÍDICAS APLICABLES EN EL ENTRENAMIENTO O APRENDIZAJE DEL SISTEMA: EL CASO DE REGISTRO DE MARCAS
Tal como subyace a la explicación del acápite anterior, el desarrollo del sistema inteligente CONSIG y su entrenamiento parten de distinguir las marcas según el signo que las conforman, en marcas de texto (nominativas), formas (figurativas o mixtas) y el análisis de color cuando este ha sido reivindicado como una característica distintiva de la marca. En este contexto, el resultado obtenido (score) es el resultado de la aplicación de reglas jurídicas que permiten concluir si el signo analizado resulta suficientemente distintivo al no generar riesgo de confusión o asociación con otras marcas previamente registradas.
En efecto, conforme a la normativa Comunitaria Andina no es registrable un signo que no posea fuerza distintiva (extrínseca en este caso en el cual se compara con otros signos registrados) porque de permitirse su registro se atentaría contra el interés del titular de la marca anteriormente registrada y el de los consumidores que podrían incurrir en error al realizar la elección de los productos o servicios que desean adquirir10.
En consecuencia, constituyendo la identidad o semejanza de los signos el fundamento de la prohibición de registro, el análisis que realiza el sistema CONSIG se traduciría jurídicamente en determinar la presencia de uno de los siguientes supuestos: (i) que exista identidad entre los signos en disputa y también entre los productos o servicios distinguidos por ellos, (ii) o identidad entre los signos y semejanza entre los productos o servicios, (iii) o semejanza entre los signos e identidad entre los productos y servicios (iv) o semejanza entre aquellos y también semejanza entre estos11.
En efecto, la doctrina y la jurisprudencia diferencian la confusión directa, indirecta y el riesgo de asociación. La confusión directa se da por la presencia del mismo término en los signos distintivos comparados, induciendo al comprador a adquirir el producto de la marca solicitada creyendo que está comprando el que protege la marca registrada12, lo que de suyo implica también la existencia de un cierto nexo entre los productos o servicios13. En efecto, el principio de especialidad marcaria implicaría que, aun siendo las marcas iguales, si los productos o servicios protegidos son diferentes, ese riesgo de confusión no se presenta.
La confusión indirecta se configura cuando la marca solicitada reproduce parte de la marca registrada con elementos adicionales que no le otorgan mayor diferenciación14, dado que la presencia del mismo término en los signos distintivos comparados causa una idea de asociación entre los productos que se distinguen con una y otra marca, ya que el signo solicitado al reproducir en parte a la marca registrada15 genera que el consumidor o adquirente de los productos distinguidos con una marca confunda el origen empresarial de los mismos, es decir, los asocie por su procedencia o nacimiento, creyendo erróneamente que cierto producto proviene de una empresa, cuando ello no es así.
En conclusión, las reglas aplicables al entrenamiento o aprendizaje del desarrollo CONSIG mediante IA, pasan por dos aspectos: de un lado, determinar aquellas reglas relativas a establecer la identidad o semejanza de los signos comparados según su naturaleza (nominativos, mixtos o figurativos y de color) y, de otro lado, establecer el riesgo de confusión o asociación entre los productos o servicios que protege, para lo cual se utilizan los denominados criterios de conexidad competitiva, con lo cual pasamos a desarrollar las dos doctrinas aplicables a la determinación de esos dos aspectos.
A. La doctrina de la similitud o semejanza entre dos signos
Por el primer aspecto, las reglas para establecer la identidad o semejanza de los signos denominativos se parten de los siguientes cuatro principios básicos:
Para determinar la identidad o el grado de semejanza entre los signos siguiendo las reglas antes mencionadas, deben tenerse en cuenta aspectos de orden gramatical o léxicas, fonéticas y conceptuales (marcas nominativas) y visuales (para las marcas figurativas o mixtas)17.
Queda visto que el sistema CONSIG, para el caso de marcas nominativas, analiza la similitud léxica y las representaciones fonéticas.
Por su parte, en cuanto a las marcas compuestas por elementos denominativos y figurativos (mixtas), las reglas indican que se deben analizar como una unidad en la cual el elemento denominativo de la marca mixta suele ser el más característico o determinante, teniendo en cuenta la fuerza expresiva propia de las palabras; lo que no obsta para que en algunos casos se le reconozca prioridad al elemento gráfico, teniendo en cuenta su tamaño, color y colocación, que en un momento dado pueden ser definitivos. "El elemento gráfico suele ser de mayor importancia cuando es figurativo o evocador de conceptos, que cuando consiste simplemente en un dibujo abstracto"18.
Ahora bien, si el elemento determinante en un signo mixto es el denominativo y en el otro el gráfico, en principio, no habría riesgo de confusión. Si, por el contrario, en ambos signos mixtos el elemento determinante resulta ser el gráfico, el cotejo habrá que hacerse a partir de los rasgos, dibujos e imágenes de cada uno de ellos, o del concepto que evoca en cada caso este elemento (…)"19.
Si las marcas comparadas tienen ambos elementos figurativos se requiere de un examen más elaborado, ya que, en este caso, debe ofrecerse protección tanto al aspecto gráfico, como al ideológico. En el análisis deberá efectuarse una comparación gráfica y conceptual, ya que la posibilidad de confusión puede generarse no solamente en la identidad de los trazos del dibujo o similitud de ellos, sino también en la idea o concepto que la marca figurativa suscite en la mente de quien la observe. Para determinar la existencia de confundibilidad en esta clase de marcas, la Jurisprudencia del Tribunal Andino ha expresado que entre los dos elementos de la marca gráfica figurativa -el trazado y el concepto-, la parte conceptual o ideológica suele prevalecer; por lo que, a pesar de que puedan existir diferencias en los rasgos, en su conjunto pueden suscitar una misma idea o concepto e incurrir en el riesgo de confusión.
La doctrina agrega que, en el caso de marcas figurativas, el riesgo de confusión puede darse no solamente por la presencia de identidad o semejanza gráfica de las marcas, sino por razón de identidad o semejanza de los conceptos que ellas evocan20.
La semejanza de las marcas de forma en el plano gráfico deberá efectuarse de acuerdo con los criterios establecidos para comparar las marcas puramente gráficas21, que en el caso de CONSIG parte de un entrenamiento utilizando imágenes disponibles en la base de datos. No sobra señalar que, si la comparación de las marcas figurativas arroja un saldo negativo, ello no permite concluir, sin más, que no existe riesgo de confusión entre marcas figurativas comparadas, porque el riesgo de confusión puede existir cuando los signos gráficamente dispares evocan, sin embargo, el mismo concepto concreto22.
Por otro lado, debe tenerse en cuenta también que, en cuanto a la similitud gráfica de las marcas, la doctrina tiende a dar importancia a la idea o impresión que ellas puedan despertar en el consumidor, más que a la forma particular que ellas puedan tener, de manera que es importante que el usuario que recibe un score o resultado del sistema tenga en cuenta estos elementos.
B. La doctrina del riesgo de confusión o asociación por la similitud de productos o servicios
Por otro aspecto, se encuentran las reglas de conexidad de productos o servicios que se aplican para establecer el riesgo de confusión o asociación. En una primera etapa, el TJCA consideraba criterios como los canales de comercialización, finalidades y características de los productos23.
No obstante, hoy esas reglas se han precisado a propósito de la IPIOO - 100 -2019 del Tribunal de Justicia de la Comunidad Andina y dividido en dos grupos: por una parte, se establecen tres criterios sustanciales para determinar conexión, vinculación o relación competitiva a saber: i. sustituibilidad, ii. complementariedad y iii. razonabilidad, y, por otro lado, criterios subsidiarios analizados a la luz de los anteriores, tales como la identidad de clases, canales de distribución, medios publicitarios, finalidad o identidad de género, que por sí solos son insuficientes para el análisis24.
Los criterios principales se explican en los siguientes términos:
Por otra parte, existen criterios subsidiarios para determinar conexión competitiva25 que se consideran por sí mismos insuficientes para acreditar relación, vinculación o conexión entre productos y/o servicios, habida cuenta de que estos necesariamente tienen que ser analizados a la luz de cualquiera de los tres criterios sustanciales principales antes referidos, a saber:
CONCLUSIONES
Fortalecer las capacidades de las oficinas de propiedad industrial en materia de IA es un reto fundamental para superar las dificultades asociadas al bajo número de profesionales con la formación requerida y con el volumen de registros que deben analizar. En este contexto, tanto la OMPI como oficinas nacionales competentes han entendido que el uso de tecnologías y desarrollos en la gestión de la propiedad industrial es una herramienta poderosa y útil para auxiliar en sus funciones misionales.
Dichos sistemas de IA dependen por supuesto de los datos (y de los algoritmos) y en el mundo de la PI se acepta de manera generalizada una política de acceso abierto a la información relacionada con las solicitudes de registro para patentes, marcas y diseños. Teniendo en cuenta lo anterior, la OMPI ha desarrollado sistemas de búsqueda de información que faciliten una interoperabilidad funcional a través de la cooperación multilateral de las diferentes oficinas nacionales, en beneficio de los usuarios del sistema.
Los desarrollos privados en la materia, así como las aplicaciones basadas en IA por parte de la OMPI y algunas oficinas nacionales competentes en la gestión de registro de la PI, han beneficiado no solo la agilidad de los trámites a su cargo, minimizando la subjetividad del examinador en las decisiones y auxiliando a los interesados para utilizar la información disponible en las bases de datos en forma eficiente.
Colombia no se ha quedado atrás en estos retos y la Superintendencia de Industria y Comercio tiene aplicaciones basadas en IA, ofreciendo servicios a sus usuarios para la búsqueda de antecedentes marcarios y clasificación de patentes, desarrollados a través de convenios de cooperación con una universidad pionera en el país.
El sistema de evaluación de similitud de marcas desarrollado (CONSIG) evalúa desde diferentes perspectivas el grado de semejanza entre la marca cargada por el usuario frente a todas las marcas activas a la fecha de la consulta. Lo anterior permite comprender la similitud existente entre las marcas e identificar posibles escenarios de plagio de la propiedad intelectual. Cabe resaltar que el algoritmo desarrollado funciona de manera automática y es capaz de evaluar la similitud con tiempos de procesamiento entre 10 y 20 segundos.
Poder realizar procesos de predicción automática de la categoría de una patente entre 628 subclases, aproximadamente, permite agilizar el trabajo desarrollado por los examinadores por varias razones: se indica la categoría principal a la cual podría pertenecer y brinda adicionalmente un top N de posibles categorías. Lo anterior es relevante, dado que una patente puede ser asignada a varias subclases al mismo tiempo. A pesar de que se tienen resultados con una precisión competitiva (88%) con respecto a las soluciones existentes, actualmente se están adelantando procesos de refinamiento de los datos de entrenamiento con el fin de incluir documentos procesados a partir de la aplicación de técnicas de OCR (Reconocimiento óptico de caracteres) con el fin de tener más información para realizar los procesos de entrenamiento.
La extensión del proceso de clasificación de patentes a nivel subgrupo (Nivel 5 IPC) es un requerimiento fundamental para los examinadores. Por ende, se está realizando la extensión mediante la utilización de sistemas jerárquicos locales o top-down encadenado, en el cual primero se predice la subclase y, posteriormente, se invoca un clasificador local por nodo padre para predecir el subgrupo al cual podría pertenecer. Los resultados parciales indican que es una solución prometedora, dado que se tiene para los niveles inferiores precisión hasta del 90%. Actualmente se está trabajando en completar subgrupos en los cuales se tiene ausencia de datos, con el fin de aumentar la cobertura del clasificador.
NOTAS
1 Machine learning es el estudio de algoritmos y modelos estadísticos utilizados por sistemas computacionales para llevar a cabo una tarea específica de forma efectiva sin instrucciones explícitas, apoyándose en patrones e inferencias.
2 Estado de la Técnica en el uso de tecnologías emergentes en el sector público. OCDE. 2019.
3 Ob, cit. supra, p. 4.
4 Navas Navarro, S., "Derecho e inteligencia artificial desde el diseño", en Navas Navarro, Susana (coord.), Inteligencia artificial: tecnología, derecho, Valencia, Tirant Lo Blanch, 2017, p. 52.
5 Moschovakis, Y., "What is an algorithm?", en Engquist, B., & Schmid, W. (Eds.) Mathematics Unlimited - 2001 and beyond, Part II, Springer, 2001, pp. 919-936; Buss, S., Alexander, S., Pillay, A., & Shore, R., "The Prospects for Mathematical Logic in the Twenty-First Century", en The Bulletin of Symbolic Logic, 7, 2, 2001, pp. 169-196; Blass, A., & Gurevich, Y., "Algorithms: A Quest for Absolute Definitions", p. Bulletin of the European Association for Theoretical Computer Science, 81, 2003, pp. 195-225; Gurevich, Y., "What is an Algorithm? (Revised)", en A. Olszewski et al. (Eds.) Church's Thesis: Logic, Mind and Nature, Copernicus Center Press, 2014, pp. 1-15.
6 De La Sierra, S., "Inteligencia artificial y justicia administrativa: una aproximación desde la teoría del control de la administración pública", en Revista General de Derecho Administrativo, 53, 2020, pp. 1-19.
7 Navas Navarro, S., "Derecho e inteligencia artificial desde el diseño", en Navas Navarro, Susana (coord.), Inteligencia artificial: tecnología, derecho, Valencia, Tirant Lo Blanch, 2017, p. 52.
8 Diálogo de la OMPI sobre propiedad intelectual (PI) e inteligencia artificial (IA). WIPO/IP/AI/2/GE/20/1. 21 de mayo de 2020.
9 BID, "La inteligencia artificial al servicio del bien social en América Latina y el Caribe", 2020.
10 Tribunal de Justicia de la Comunidad Andina, Proceso 30-IP-2011. Marca: U.S. Polo ASSN since 1989, 18 de mayo de 2011.
11 Proceso 82-IP-2002, de 29 de enero de 2003, TJCA.
12 Superintendencia de Industria y Comercio. Delegatura de Propiedad Industrial. Resolución n.° 02047, 30 de enero de 2004.
13 Proceso 109-IP-2002, 1 de abril de 2003, TJCA.
14 Proceso 13-IP-2011. TJCA.
15 Proceso 7-IP-98 de 7 de abril de 1998, marca Palma Frit: "(…) se deben distinguir dos clases de confusión: la directa y la indirecta. (…) "Por la segunda, el consumidor cree que el producto o servicio que está adquiriendo o solicitando pertenece a una misma línea de productos o servicios de una empresa o persona distinta de quien realmente los ofrece en el mercado".
16 Proceso 56 -IP-2011,1 de septiembre de 2011. TJCA.
17 Proceso 113-IP-2007. TJCA.
18 Proceso 26-IP-98, 24 de febrero de 1999) y Proceso N° I29-IP-2004. 17 de noviembre de 2004,
19 Proceso 52-IP-2011, 1 de septiembre de 2011. TJCA.
20 Fernández-Novoa, Carlos, Fundamentos Derecho de Marcas, Editorial Montecorvo, 1984, p. 227.
21 Proceso 52-IP-2011, marca Benzaclin, 1 de septiembre de 2011. TJCA
22 Proceso 4-IP-1997, marca Katts, 20 de enero de 1998. TJCA.
23 Ob. cit, supra, Fernández Novoa, pp. 362,363 y 364.
24 Proceso n.° 236-IP-2017 del 7 de septiembre de 2018. TJCA.
25 Proceso n.° 236-IP-2017 del 7 de septiembre de 2018.
REFERENCIAS
1. Legislación citada
Organización Mundial del Comercio. Acuerdo sobre los Aspectos de los Derechos de Propiedad Intelectual relacionados con el Comercio. Disponible en: https://www.wto.org/spanish/docs_s/legal_s/legal_s.htm#TRIPS.
Decisión Andina 486 de 2000. Disponible en: www.comunidadandina.org
2. Jurisprudencia e Interpretaciones Prejudiciales citadas
Tribunal de Justicia de la Comunidad Andina
Proceso 4-IP-1997, 20 de enero de 1998.
Proceso 7-IP-98, 7 de abril de 1998.
Proceso 26-IP-98, 24 de febrero de 1999.
Proceso 82-IP-2002, 29 de enero de 2003.
Proceso 109-IP-2002, 1 de abril de 2003.
Proceso 113-IP-2007.
Proceso 56-IP-2011, 1 de septiembre de 2011.
Proceso 30-IP-2011, 18 de mayo de 2011.
Proceso 52-IP-2011, 1 de septiembre de 2011.
Proceso 236-IP-2017 del 7 de septiembre de 2018.
Proceso IP-100 - 100 - 2019.
3. Doctrina
Al-Tahraw Mayy. "Arabic Text Categorization Using Logistic Regression", in I.J. Intelligent Systems and Applications, volumen 06, 2015. pp. 71-78.
Buss, S.; Alexander, S.; Pillay, A. & Shore, R., "The Prospects for Mathematical Logic in the Twenty-First Century", in The Bulletin of Symbolic Logic, 7, 2, 2001, pp. 169-196. [consultado el 28/02/2020].
D'hondt, Eva; Verberne, Suzan; Oostdijk, Nelleke & Boves, Lou. "Patent Classification on Subgroup Level Using Balanced Winnow", en Current Challenges in Patent Information Retrieval Springer Berlin Heidelberg, volume 37, 2017. pp. 299-324.
Fernández-Novoa, Carlos, Fundamentos Derecho de Marcas, Editorial Montecorvo, 1984.
Gao, Ji; Lanchantin, Jack; Soffa, Mary Lou et al. "Black-box generation of adversarial text sequences to evade deep learning classifiers", in: 2018 ieee Security and Privacy Workshops (SPW). ieee, 2018. pp. 50-56.
Gómez Juan & Moens Marie-Francine. A Survey of Automated Hierarchical Classification of Patents, Professional Search in the Modern World: COST Action IC 1002 on Multilingual and Multifaceted Interactive Information Access, Springer International Publishing, volume 8830, 2014. pp. 215-249.
Guadamuz González, A., "Patentabilidad del software: nuevas cuestiones jurídicas", en Revista de la OMPI, 6, 2008, [en línea], disponible en: http://www.wipo.int/wipo_magazine/es/2008/06/ [consultado el 19/02/2020].
Gurevich, Y., "What is an Algorithm? (Revised)," en A. Olszewski et al. (Eds.) Church's Thesis: Logic, Mind and Nature, Copernicus Center Press, 2014, pp. 1-15.
Hernández Julio. Clasificación Jerárquica Multidimensional. Instituto Nacional de Astrofísica, Óptica y Electrónica inaoe, 2012. pp 1-96
Ivakhnenko, A. G. "Identification of the mathematical model of a complex system by the self-organization method", in Theoretical Systems Ecology, Advances and Case Studies, 1970.
Kalantidis, Yannis et al. "Scalable triangulation-based logo recognition", in Proceedings of the 1st ACM International Conference on Multimedia Retrieval. 2011, pp. 1-7.
Lecun, Yann; Bengio, Yoshua & Hinton, Geoffrey, "Deep learning", in Nature, 2015, vol. 521, n.° 7553, p. 436-444.
Moschovakis, Y., "What is an algorithm?", in Engquist, B., & Schmid, W (Eds.) Mathematics Unlimited - 2001 and beyond, Part II, Springer, 2001, pp. 919-936.
Navas Navarro, S., "Derecho e inteligencia artificial desde el diseño", en Navas Navarro, Susana (coord.), Inteligencia artificial: tecnología, derecho, Valencia, Tirant Lo Blanch, 2017, pp. 23-72.
Navas Navarro, S., "Obras generadas por algoritmos. En torno a su posible protección jurídica", en Revista de Derecho Civil, vol. V, núm. 2018, pp. 273-291.
Navas Navarro, S., "Creación Original e Inteligencia Artificial" en Navas Navarro, Susana (Dir.), Nuevos desafíos para el Derecho de Autor. Robótica, Inteligencia Artificial, Tecnología, Madrid, Reus, 2019, pp. 27-45.
O'Neil, C., Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy, New York, Crown, 2016.
Otero González, L. & Durán Santomil, P., "Fintech, blockchain y big data", en García Novoa, César y Santiago Iglesias, Diana (Dir.), 4ª Revolución industrial: impacto de la automatización y la Inteligencia artificial en la Sociedad y la economía digital, Pamplona, Thomson Reuters Aranzadi, 2018, pp. 81-113.
Pérez Sanz, C., "Aspectos legales del Big Data", en Indice: Revista de Estadística y Sociedad, 68, 2016, pp. 18-21.
Rehman, Mehwish; Iqbal, Muhammad; Sharif, Muhammad et al. "Content based image retrieval: survey", in World Applied Sciences Journal, 2012, vol. 19, n.° 3, pp. 404-412.
Ren, S. et al. "Faster R-CNN: Towards real-time object detection with region proposal networks", en Advances in neural information processing systems, 2015. pp. 91-99.
Rifkin Ryan & Klautau Aldebaro, "In Defense of One-Vs-All Classification", in Journal of Machine Learning Research, vol 5, 2004. pp. 101-141.
Tolias, Giorgos; Sicre, Ronan & Jégou, Hervé "Particular object retrieval with integral max-pooling of cnn activations", in arXiv preprint arXiv:1511.05879, 2015.
Torrey, Lisa & Shavlik, Jude. "Transfer learning", in Handbook of research on machine learning applications and trends: algorithms, methods, and techniques, IGI global, 2010, pp. 242-264.
Pinto, D.; Vilariño, D.; Alemán, Y.; Gómez, H.; Loya, N. & Jiménez-Salazar, H. "The Soundex Phonetic Algorithm Revisited for SMS Text Representation", in: Sojka, P; Horák, A.; Kopeček, I. & Pala, K. (eds) Text, Speech and Dialogue. TSD 2012. Lecture Notes in Computer Science, vol 7499. Springer, Berlin, Heidelberg.
Jokisch, Oliver & Hain, Horst-Udo, A Trainable Method for the Phonetic Similarity Search in German Proper Names. 46-55. 10.1007/978-3-319-66429-3_4, 2017.
Wu, W., "A Method for Fuzzy String Matching," International Computer Symposium (ICS), Chiayi, 2016, pp. 380-383, DOI: 10.1109/ICS.2016.0083.