jueves, agosto 31, 2006

De la Web Semántica a la Ontología Decisional (1ª parte)

El auge de estudios que se están produciendo entorno a la Web Semántica está disparando hacia la madurez a la Ingeniería Ontológica a pasos agigantados y en el camino se están sembrando una gran cantidad de conceptos que nos pueden servir para definir una nueva forma de entender los sistemas decisionales.

Así que pensando que cualquier analogía es buena, me lancé a leer mas sobre el tema, de entre los articulos que he ido hojeando, dos son los que mas idea me han ido dando y que por suerte os podeis descargar desde la web de Novatica. Novática: revista creada en 1975 por ATI (Asociación de Técnicos de Informática)

Son estos:


  1. La Web Semántica: fundamentos y breve "estado del arte" , Luis Sánchez Fernández, Norberto Fernández García [resumen][contenido completo en formato PDF - 285 KB]
  2. Recuperación de información en la Web Semántica . David Vallet Weadon, Miriam Fernández Sánchez, Pablo Castells Azpilicueta [resumen][contenido completo en formato PDF - 340 KB]
Si os gusta el tema os recomiendo que os los leais detenidamente y los complementeis con los articulos que Javier Urrutia esta publicando recientemente en su blog con respecto a la aplicacion empresarial de ontologias

El primer paso que tenemos que dar para pasar de la sintaxis a la semántica es dotar a los usuarios de un vocabulario común en el que todos utilicemos las misma palabras con los mismos significados semánticos, eso o bien pedirle peras al olmo. Cualquier de las dos nos vale como utopía.

Representación gráfica de las busquedas en google, proyecto OPTE http://opte.org


Eso es imposible y ademas no deseable, para obtener un sistema decisional orientado hacia la semántica, lo primero que debemos pedirle es precisamente que los diferentes tipos de usuarios utilicen su propio vocabulario con sus propias connotaciones de negocio.

Como en la web semántica este requisito es idéntico, la W3C ha creado un lenguaje para representar (y anotar) conocimiento en la web, es el RDF (Resource Description Framework) pensado para anotar documentos web y xml.

Ahora bien, yo me pregunto: ¿como trabajan la mayoria de los Suites de Business Intelligence actualmente? ... pues en entorno web. Todos los informes generados son presentados a través de un navegador, ¿que pasaría si los propios usuarios pudieran dotar de anotaciones que aportasen significado a estos informes?. Y no solo eso, ¿qué pasa con todos esos informes que circulan en documentos word, powerpoints y excel por las empresas (a veces el 80% de la información de caracter analítico y decisional) que pueden ser exportados a xml?. ¿Qué pasaría si el MS Office (por decir uno) te dotase de la capacidad de hacer anotaciones semánticas en tus presentaciones de resultados?. Como veis la capacidad de dotar de semántica a todos nuestros actuales sistemas de análisis esta a punto de ser realidad aprovechándonos de la web semántica.
Existen algunas herramientas que estan saliendo que facilitan la anotación manual (por ejemplo SHOE KnowledgeAnnotator ), pero.... ¿me sirve de algo?. Si tengo que ir informe por informe anotando manualmente, posiblemente me canse o las anotaciones sean de menor valor o rutinarias. Para ello existen sistemas de anotación semiautomáticos como puede ser PANKOW que exploran el documento buscando referencias a conceptos descritos en ontologías.

Con lo que llegamos a mi primera conclusión: La anotación semántica decisional debe tener un caracter semi-automático

Vale, ya tengo anotados todos mis informes y análisis, pero para anotarlos necesito hacer referencia implícita o explícitamente a una ontología, quiera yo o no quiera, y esa ontología si quiero hacer algo con ella debo procesarla y compartirla con el resto de usuarios de mi organización.
Aunque parezca una perogrullada, para tener una ontología debo especificarla antes, pero ¿como las especifico?, yo nunca he creado ninguna y las que utilizo están implitas en mi cerebro, ¿que tengo que poner? ¿por donde empiezo?. No os preocupeis, por suerte hay gente muy lista en todo el mundo y algunos de ellos estan pensando en una metodología para el desarrollo de ontologías. Una de las inciativas mas conocidas es METHONTOLOGY . La siguiente pregunta que me viene a la cabeza es ¿será una metodología ágil o el armatoste de siempre?. La respuesta es.....que es el armatoste de siempre, es del año 1997 y el ciclo que proponen no es que sea demasiado ágil. Así que seguiré buscando por si hay alguna.
http://rhizomik.net/~roberto/thesis/figures/MethontologyLifeCycle.pdf
Con lo que llegamos a mi segunda conclusión: Necesitamos de una metodología agil para crear ontologías decisionales que puedan ser aplicables al negocio
Tambien necesitaremos herramientas de creación de ontologías decisionales, pero con el tiempo estarán integrads dentro de las suites de BI, Por ahora existen varias en el desarrollo, pero quizás la que esta teniendo mas éxito es Protegé realizado en la Universidad de Stanford
Pero sigamos explorando las caracteristicas que podemos aprovechar de la Web Semántica.
En un sistema decisional, un grupo de usuarios, posiblemente del mismo departamento, deberán compartir una ontología común, pero el resto de usuarios de otros departamentos posiblemente tengan las suyas. El concepto Margen para un departamento es posible que sea diferente del que tiene otro, por ejemplo si incluimos o no incluimos los abonos o los impuestos, pero en el informe se utiliza la misma palabra y cada uno entiende el concepto según su ontología.
Obviamente, si no queremos nichos de información aislados y pequeños Reinos de Taifas Reinos de Taifas , estas ontologías deben poder relacionarse. para ello nace una linea de investigación llamada onthology mapping que trata de resolver el problema de detectar qué dos conceptos definidos en dos ontologías se relacionan entre si de alguna manera o si son el mismo concepto.
Con lo que llegamos a mi tercera conclusión: Necesitamos mapear las diferentes ontologías decisionales, no solo por departamentos sino también por tipología de decisión (operacional, táctica, estratégica) aunque esto último es mas una intuición que una conclusión sólida.
Y como se me esta haciendo muy largo, dejaré para otro el siguiente post los motores de inferencia y las reglas decisionales.

10 comentarios:

malonecab dijo...

Mucha información :)

me lo leeré todo tranquilamente en casa. La ontología es un campo muy interesante y novedoso.

Javier Urrutia dijo...

Hola Jorge, agradesco tu mencion a mi blog y los temas comunes, y por cierto execelente tu articulo. Algunas ideas al respecto:

Creo muy interesante pensar en un enfoque futuro semantico a sistemas desicionales. Si bien es cierto la tecnologia semantica se encuentra un tanto inmadura hoy en dia, el desarrollo de los ultimos años, sobre todo apoyado en el uso de Logicas Descriptivas, a acelerado mucho esta tecnologia. Y creo por este lado vendran las proximas mejoras a la misma.

Con respecto a los vacabularios comunes, que mencionas en tu articulo creo tambien que en un futuro esta puede ser salvada en base a tecnicas hibridas de Lenguaje Natural y Ontologias basadas en bases de datos.

Tambien creo que el tema del mapeo, podria ser resuelto en base a soluciones recursivas de ontologias. Esto es, Ontologias que permitan definir mapeos a otras Ontologias. Claro la idea es puramente teorica y es probable que no funcione.

Al final creo que los temas semanticos son el proximo paso de salto, en las tecnologias informaticas y por supuesto en los sistemas desicionales tendran su impacto. No obstante existen y existiran otras tecnolofias comunes sobre las cuales este ambito y otros se desarrollen.

Por cierto este fin de semana seguire con mis post (mucho trabajo).

Saludos Cordiales
Javier Urrutia
htt://MisBytes.wordpress.com

Jorge Fernández González dijo...

manolecab tiene razón, me ha quedado un poco largo, pero espero que no me haya quedado muy espeso.

Jorge Fernández González dijo...

Javier.
Me apunto lo de la Lógicas Descriptivas como posible variable de la solución.
Lo el lenguaje natural ya me parece menos factible, se llevan muchos años de investigación y los progresos son a paso de tortuga, así que no cuento demasiado con ello.
No trabajes demasiado el fin de semana

Javier Urrutia dijo...

Jorge.
Comparto contigo que el lenguaje natural y su tecnologia avanza lento, efectivamente no ha crecido como lo pronosticado en la decada anterior. A ver si alguien creativo le da un empujon.
No obstante no pierdo las esperanzas al respecto. (Es lo ultimo que se pierde).

Tratare de hacer caso a tu recomendacion de fin de semana :)

Saludos.
Javier Urrutia
http://MisBytes.wordpress.com

Jorge Fernández González dijo...

He corregido algunos links que no funcionaban, espero que ahora esten todos.

Mauricio Puentes dijo...

me ha gustado mucho el articulo, actualmente estoy trabajando en un proyecto de investigacion en ingenieria ontologica en la UFPS de Cucuta, Colombia; seria de gran ayuda q pudieras colaborarme con contenidos acerca de Ontologias en las empresas, y todo lo referente a la creacion de ontologias.
CONTACTO: mauro260@hotmail.com
gracias.

Inty dijo...

Saludos Jorge:
He leído las dos partes de tu artículo, que considero oportuno, además de bien estructurado. Creo haber entendido del análisis del segundo, que en escenarios estratégicos, por el alto número de reglas que pueden generarse, las ontologías se harían muy "pesadas" y los problemas de escalabilidad de los razonadores hacen impracticable su uso.

Usted deja abierta la posibilidad de su uso en escenarios táctico y operativos. La incertidumbre, por los largos períodos de tiempo que involucran las decisiones estratégicas, es uno de los factores que hacen crecer el número de reglas. Sin embargo, en el escenario operativo, la realidad no es muy diferente puesto que las altas tasas de cambio pueden provocar una situación parecida, ¿ha considerado esto usted?

La escalabilidad de los razonadores
¿Se refiere a los problemas de eficiencia de los lenguajes de consultas? Estos lenguajes están en crecimiento, ¿podría esto afectar la veracidad de sus afirmaciones?

He usado Protégé y en efecto, es una excelente herramienta para desarrollar ontologías. Hay otras como SWOOP pero en lo que todos los autores (desde Gruber hasta Guarino) parecen estar de acuerdo es que es mejor desarrollar ontologías sobre conceptualizaciones conocidas y aceptadas que el proceso contrario. De manera que una ontología decisional para la organización debe, no creo sea posible saltar este paso, "integrar" las conceptualizaciones que ya existen en la organización. Este proceso puede describirse como usted acertadamente dice mediante un "armatoste" en cuanto a las metodologías a usar.

Saludos y muchas gracias por sus post.

Jorge Fernández González dijo...

Pues tienes razón, no habia pensado en entornos operacionales altamente cambiantes, allí nos encontrariamos con un problema semejante al estrategico. Dandole una vuelta mas, en empresas en que la estrategia no sea "demasiado" importante, en monopolios o empresas basadas puramente en control de costes como puede ser una cementera con bajos niveles de necesidad de información, nos podemos encontran que las ontologias decisionales seria aplicable mas facilmente a los niveles estratégicos.

En cuanto a la escalabilidad yo creo que es problema puramente coyuntural y que con el tiempo esto cambiara y muchas de las reflexiones de estos dos post dejaran de tener sentido, pero de momento es lo que hay y mucho me temo que la situacion seguirá así algunos añitos mas.

Excelente reflexión, Gracias por la ayuda

Inty dijo...

Escalabilidad...
Los interesados pueden ver http://jena.sourceforge.net/sparql2sql/ parece ser interesante para mejorar el rendimiento de las inferencias, usando Jena, cuando los modelos están en bases de datos (este para MySQL).

Más de lo mismo en http://jena.sourceforge.net/sparql2sql/

Saludos a todos, el debate sigue abierto