https://doi.org/10.22463/2011642X.2094
Recibido: 25 de agosto 2016 - Aprobado: 07 de diciembre 2016
Forma de citar:
Rosado Gómez, A. "Consolidación de indicadores institucionales utilizando bodega de datos", Ingenio, vol.11, no. 1, pp. 53-63, 2016.
Las instituciones de educación superior en Colombia, deben reportar sus indicadores de desempeño a diferentes entidades estatales de vigilancia y control;esta obligación produce que las universidades tengan que almacenar y gestionar la información que producen y que es debe ser reportada. Generalmente los procesos administrativos y académicos, van acompañados de un sistema de información que está alineado con las necesidades de los usuarios finales y permiten tenerlos datos actualizados y disponibles, para ser consultados en cualquier momento y responder preguntas de un proceso en específico.Esta clase de sistemas dificulta el análisis estratégico de la información para la toma de decisiones,al carecer de consolidación de datos con otras fuentes que permitan evaluar los resultados organizacionales,desde diferentes puntos de vista.Esta investigación muestra la aplicación de la inteligencia de negocios en la construcción de una bodega de datos que integre la información institucional que se reporta y soporte la toma decisiones de la Universidad Francisco de Paula Santander Ocaña.
Palabras clave:Bodega de datos,herramienta OLAP,indicadores de gestión, inteligencia de negocios.
Higher education institutions in Colombia must report their performance indicators to different state entities of surveillance and control;This obligation means that universities must store and manage the information they produce and that it must be reported.Generally administrative and academic processes are accompanied by an information system that is aligned with the needs of the end users and allow to have the data updated and available,to be consulted at any time and to answer questions of a specific process. This kind of systems makes difficult the strategic analysis of information for decision making,lacking data consolidation with other sources that allow the evaluation of organizational results from different points of view.This research shows the application of business intelligence in the construction of a data warehouse that integrates the institutional information that is reported and supports the decision making of the Universidad Francisco de Paula Santander Ocaña.
Keywords:Data warehouse, business intelligence ,management indicators, OLAP tool.
As instituições de ensino superior na Colômbia devem relatar seus indicadores de desempenho a diferentes órgãos estaduais de vigilância e controle; Essa obrigação significa que as universidades devem armazenar e gerenciar as informações que produzem e o que deve ser relatado. Geralmente, os processos administrativos e acadêmicos são acompanhados por um sistema de informação alinhado com as necessidades dos usuários finais e permite que os dados sejam atualizados e disponibilizados, possam ser consultados a qualquer momento e esclarecer dúvidas sobre um determinado processo.Essa classe de sistemas dificulta a análise estratégica da informação para a tomada de decisão, pois carece de consolidação dos dados com outras fontes que permitem avaliar os resultados organizacionais sob diferentes pontos de vista. Esta pesquisa mostra a aplicação da inteligência de negócios na construção de um data warehouse que integra a informação institucional que é reportada e apóia a tomada de decisão da Universidade Francisco de Paula Santander Ocaña.
Palavras-chave: Data warehouse, ferramenta OLAP, indicadores de gestão, business intelligence.
La información que reportan las universidades,está estructurada de manera diversa y depende de la entidad a la cual va dirigida, incidiendo en cómo se organice y que se especifica.Por otra parte los formatos en los cuales se debe enviar los reportes, están definidos en archivos de hoja de cálculo, procesador de palabras y sistemas de información.La responsabilidad de consolidar,validar y suministrar estos datos recae sobre diferentes dependencias dentro de la organización;esto produce que la instituciónno sea consolidada desde el punto de vista de sus indicadores como una unidad generadora de datos valiosos que permitan integrar las cifras institucionales en función de soportar la toma de decisiones (Rosado & Rico, 2010). Por otra parte desde el punto de vista del estado,se busca unificar y garantizar la trazabilidad de la información, combinando la información académica con otra información gubernamental,para que se fortalezcan los proyectos trasversales del gobierno y permitan a diferentes actores interesados en la educación tomar las decisiones orientadas al crecimiento y mejoramiento de la calidad de este sector (MEN, 2012).
La Universidad Francisco de Paula Santander Ocaña,como una institución de educación superior debe periódicamente generar y enviar a los diferentes organismos estatales los reportes solicitados y con la estructura exigida por estos.Esta actividad se cumple en los tiempos y con las características exigidas;sin embargo,la forma en que se hace puede ser susceptible de mejora,desde el punto de vista de Curto (2010),menciona como una estrategia de Inteligencia de Negocios (BI, Business Intelligence) dentro de una organización, puede mitigar los problemas generados por las malas prácticas, es de esta forma que la División de Sistemas, no tendría que estar preguntando las características de los informes que necesitan las dependencias; reduciendo la generación de reportes diarios basados en los criterios cambiantes de los usuarios. Por otro lado se organizaría la forma en que se consolida,valida y almacena la información,permitiendo disminuir los tiempos en la generación y entrega de los reportes a los responsables de garantizar su calidad y disponibilidad, mejorando la credibilidad en la calidad de la información.Generalmente la forma de verificar el desempeño organizacional se utilizan los Indicadores de gestión,los cuales contienen el resultado cuantificado de una actividad o proceso y que muestra el desempeño en diferentes periodos de tiempo (Hernandez Orallo,Ramirez Quintana, & Ramirez Ferri, 2004).Estos indicadores son importantes porque se constituyen en una herramienta de planeación que permite visualizar, evaluar el desempeño y establecer estudios comparativos de los valores actuales con respecto a los ideales o por otro lado haceruna proyección de los valores futuros (Lopez, 2011).
Implantar una solución de BI,permite aportar información actualizada y veraz,en diferente niveles de agrupación, permitiendo tener una trazabilidad de la gestión que puede ser consolidada en métricas e indicadores clave de rendimiento (Curto Díaz, 2010).Por esta razón esta investigación intenta responder la complejidad que tiene poner en marcha un proyecto de inteligencia de negocios, particularmente una bodega de datos (DW, Data Warehouse),como estrategia de integración de la información institucional generada en la Universidad Francisco de Paula Santander Ocaña.
Compresión del negocio: Para delimitar el alcance del proyecto y de la información que albergaría el DW, fue necesario adelantar un inventario de indicadores en donde se buscada determinar cuanta esla información que debe reportar la universidad y a quienes se les reporta.Adicionalmente establecer las fuentes de información y la forma en que cada unidad almacena y consulta sus datos.
Como fuentes de datos,se identificaron,el sistema de información académico (SIA), el sistema de información financiero (SIF), sitemas de información de biblioteca (SIB), el sistema de información documental (SID), el sistemas de información de bienestar y iferentes archivos en formato digital que contienen los reportes generados por las dependencias que integran la universidad. Algunos de esos reportes contienen datos proporcionados por los sistemas de información y por la captura complementaria que realiza la dependencia; como resultado de esta investigación se estableció que alrededor de un 70% de los reportes e indicadores que debe elaborar la institución son generados por sus sistemas de información,quedando un 30% restante gestionado particularmente con recursos tecnológicos limitados por alguna dependencia.Este panorama es lo que Hribar (2010),clasifica como fase dos, dentro de un modelo de madurez de BI (BIMM,Business Intelligence Maturity Model); esto indica que los datos son utilizados solo en algunos casos y por algunas personas para la toma de decisiones y no existe una solución BI que estructure los reportes que se necesitan, además estos análisis se hacen a partir de datos que son extraídos desde aplicaciones y analizados en hojas de cálculo.
Comprensión de los datos: Para comprender mejor los datos, fue necesario establecer una serie de características comunes entre los reportes e indicadores que se analizaron, esta organización permite proyectar algunos valores en común entre la información reportada, adicionalmente ayuda a cuantificar las coincidencias en cuanto a la periodicidad,el tipo de documento y la entidad a la cual se reporta. En la tabla 1, se muestra la cantidad de documentos reportados por periodos de tiempo,siendo la periodicidad mínima de un mes,otra categoría que se encontró en el comportamiento de estos documentos es la de esporádico, la cual incluye a todas aquellas solicitudes que se hacen de forma inesperada y con atributos y consolidados diferentes.
Además del tiempo en que se reporta la información, el tipo de documento que se genera es diferente dependiendo a la dependencia o entidad del estado al que vaya dirigido.La tabla 2, muestra la clasificación de los documentos según su tipo. Dentro de las categorías mostradas, llama la atención la de aplicativos externos, la cual consiste en diligenciar formularios en sistemas de información proporcionados por los organismos de vigilancia y control del estado.Por otro lado existen documentos que contienen consolidados pero que no corresponden con ninguna de las categorías establecidas; son nuevos documentos generados a partir de otros con un análisis y criterio de consolidación hecho de forma manual por un humano.
Una de las características que le proporciona valor a la información reportada, es la entidad que hace la solicitud; es diferente entregar información a una dependencia de la universidad que reportarla a una entidad de vigilancia y control del estado.La tabla 3, muestra cómo están dividas las frecuencias dependiendo del tipo de entidad,las entidades internas demandan mayor cantidad de documentos que las externas,una de las razones de este hallazgo, consiste en que la universidad está certificada en la norma ISO 9001 y para dar cumplimiento al requisito de medición,análisis y mejora debe definir herramientas de gestión (indicadores) que permitan evaluar el logro de los objetivos en términos de (eficacia, eficiencia y efectividad) a nivel de dependencias y procesos.
Dentro de los documentos que se analizaron, se encontró una diversidad en el formato del archivo que los contiene; existían hojas de cálculo, documento portable,procesador de texto y capturas de pantalla de aplicativos.Otro aspecto diferenciador fue la estructura del documento;no todos fueron tablas con filas de valores,algunos eran documentos que mezclaban textos, imágenes y cifras ilustrativas, otro tipo tenia textos y cifras o textos e imágenes.
Preparación de datos: Una vez se establecieron los documentos que son reportados por la universidad,se procedió a revisar su contenido interno,en total se encontraron 5529 atributos,de los cuales 1694, son únicos; este hallazgo sugirió que la información se repite en los diferentes tipos de documentos.Latabla 4, muestra algunos de los atributos con las frecuencias más altas,como se puede observar en los nombres, estos atributos corresponden a los indicadores que se reportan al sistema de gestión de la calidad (SIG).
Una vez los datos fueron seleccionados, validados,limpiados y transformados, se procedió a definir las dimensiones que almacenarían los atributos que soportarían las necesidades de información para la toma de decisiones que la universidad requería.La información se estructuro en cuatro Datamart; permitiendo una alienación entre la información y los reportes,indicadores e informes que debe rendir la institución y que basándose en un enfoque por procesos que propone el sistema de gestión de la calidad (SIG),se encontró que la información que la universidad debe reportar se genera dentro de un proceso misional y dos proceso de apoyo.A continuación se mencionan cada uno de los Datamart.
Proceso académico:contiene la estructura adecuada para hacer análisis de los estudiantes,desde el momento en que este ingresa a su programa académico, desarrolla todos los créditos establecidos a través de los semestres (matricula, docente y notas) hasta convertirse en un egresado.Este Datamart, también almacena a los desertores o aquellos estudiantes que no terminaron su plan de estudios.
Proceso investigativo:aunque dentro del enfoque por procesos,la investigación y extensión de la universidad hacen parte del proceso de gestión académica:fue necesario establecer una estructura especial que contenga los datos relacionados con la producción científica, incluyendo sus recursos,inversión, investigadores,grupos de investigación y la clasificación y producción de estos.
Proceso administrativo y financiero: consolida la información correspondiente con la administración de los recursos financieros,la infraestructura física y los ingresos y egresos económicos generados por las actividades propias de la universidad, esta estructura permite analizar el comportamiento de las finanzas institucionales con el fin de establecer una relación entre la inversión realizada y los resultados generados.
Compresión del negocio:Para delimitar el alcance del proyecto y de la información que albergaría el DW, fue necesario adelantar un inventario de indicadores en donde se buscada determinar cuanta es la información que debe reportar la universidad y a quienes se les reporta.Adicionalmente establecer las fuentes de información y la forma en que cada unidad almacena y consulta sus datos.
Como fuentes de datos,se identificaron,el sistema de información académico (SIA), el sistema de información financiero (SIF), sistemas de información de biblioteca (SIB), el sistema de información documental (SID), el sistemas de información de bienestar y diferentesarchivos en formato digital que contienen los reportes generados por las dependencias que integran la universidad. Algunos de esos reportes contienen datos proporcionados por los sistemas de información y por la captura complementaria que realiza la dependencia; como resultado de esta investigación se estableció que alrededor de un 70% de los reportes e indicadores que debe elaborar la institución son generados por sus sistemas de información,quedando un 30% restante gestionado particularmente con recursos tecnológicos limitados por alguna dependencia.Este panorama es lo que Hribar (2010),clasifica como fase dos, dentro de un modelo de madurez de BI (BIMM, Business Intelligence Maturity Model); esto indica que los datos son utilizados solo en algunos casos y por algunas personas para la toma de decisiones y no existe una solución BI que estructure los reportes que se necesitan,además estos análisis se hacen a partir de datos que son extraídos desde aplicaciones y analizados en hojas de cálculo.
Comprensión de los datos:Para comprender mejor los datos, fue necesario establecer una serie de características comunes entre los reportes e indicadores que se analizaron, esta organización permite proyectar algunos valores en común entre la información reportada, adicionalmente ayuda a cuantificar las coincidencias en cuanto a la periodicidad,el tipo de documento y la entidad a la cual se reporta. En la tabla 1, se muestra la cantidad de documentos reportados por periodos de tiempo, siendo la periodicidad mínimade un mes, otra categoría que se encontró en el comportamiento de estos documentos es la de esporádico,la cual incluye a todas aquellas solicitudes que se hacen de forma inesperada y con atributos y consolidados diferentes.
Además del tiempo en que se reporta la información,el tipo de documento que se genera es diferente dependiendo a la dependencia o entidad del estado al que vaya dirigido.La tabla 2, muestra la clasificación de los documentos según su tipo. Dentro de las categorías mostradas, llama la atención la de aplicativos externos, la cual consiste en diligenciar formularios en sistemas de información proporcionados por los organismos de vigilancia y control del estado.Por otro lado existen documentos que contienen consolidados pero que no corresponden con ninguna de las categorías establecidas; son nuevos documentos generados a partir de otros con un análisis y criterio de consolidación hecho de forma manual por un humano.
Una de las características que le proporciona valor a la información reportada,es la entidad que hace la solicitud;es diferente entregar información a una dependencia de la universidad que reportarla a una entidad de vigilancia y control del estado. La tabla 3, muestra cómo están dividas las frecuencias dependiendo del tipo de entidad,las entidades internas demandan mayor cantidad de documentos que las externas, una de las razones de este hallazgo, consiste en que la universidad está certificada en la norma ISO 9001 y para dar cumplimiento al requisito de medición,análisis y mejora debe definir herramientas de gestión (indicadores) que permitan evaluar el logro de los objetivos en términos de (eficacia, eficiencia y efectividad) a nivel de dependencias y procesos.
Dentro de los documentos que se analizaron,se encontró una diversidad en el formato del archivo que los contiene;existían hojas de cálculo,documento portable, procesador de texto y capturas de pantalla de aplicativos. Otro aspecto diferenciador fue la estructura del documento;no todos fueron tablas con filas de valores, algunos eran documentos que mezclaban textos,imágenes y cifras ilustrativas,otro tipo tenia textos y cifras o textos e imágenes.
Preparación de datos:Una vez se establecieron los documentos que son reportados por la universidad,se procedió a revisar su contenido interno, en total se encontraron 5529 atributos,de los cuales 1694, son únicos; este hallazgo sugirió que la información se repite en los diferentes tipos de documentos.Latabla 4, muestra algunos de los atributos con las frecuencias más altas,como se puede observar en los nombres, estos atributos corresponden a los indicadores que se reportan al sistema de gestión de la calidad (SIG).
Una vez los datos fueron seleccionados,validados, limpiados y transformados, se procedió a definir las dimensiones que almacenarían los atributos que soportarían las necesidades de información para la toma de decisiones que la universidad requería.La información se estructuro en cuatro Datamart;permitiendo una alienación entre la información y los reportes,indicadores e informes que debe rendir la institución y que basándose en un enfoque por procesos que propone el sistema de gestión de la calidad (SIG), se encontró que la información que la universidad debe reportar se genera dentro de un proceso misional y dos proceso de apoyo. A continuación se mencionan cada uno de los Datamart.
Proceso académico:contiene la estructura adecuada para hacer análisis de los estudiantes, desde el momento en que este ingresa a su programa académico, desarrolla todos los créditos establecidos a través de los semestres (matricula,docente y notas) hasta convertirse en un egresado.Este Datamart, también almacena a los desertores o aquellos estudiantes que no terminaron su plan de estudios.
Proceso investigativo: aunque dentro del enfoque por procesos,la investigación y extensión de la universidad hacen parte del proceso de gestión académica: fue necesario establecer una estructura especial que contenga los datos relacionados con la producción científica, incluyendo sus recursos, inversión, investigadores, grupos de investigación y la clasificación y producción de estos.
Proceso administrativo y financiero:consolida la información correspondiente con la administración de los recursos financieros,la infraestructura física y los ingresos y egresos económicos generados por las actividades propias de la universidad,esta estructura permite analizar el comportamiento de las finanzas institucionales con el fin de establecer una relación entre la inversión realizada y los resultados generados.
Proceso del talento humano, permite hacer el análisis de la permanencia y evolución de los funcionarios de la universidad, estructurando su ocupación,preparación, conocimiento, tipo de vinculación, reconocimientos,tanto a nivel directivo, administrativo y docente.Este Datamart,integra, los datos que permiten medir la competencia del personal con que cuenta la institución,con el fin de hacer una asignación asertiva de responsabilidades y establecer las capacidades y limitaciones del recurso humano.
Indudablemente,las prácticas docentes son las que inciden en las aptitudes y actitudes, habilidades y destrezas que los estudiantes desarrollen y les permite aprender significativamente no para hoy,sino para la vida profesional y personal; por lo que las estrategias educativas deben estar ajustadas a los estilos de aprendizaje y a los marcos de reconceptualización que la educación y el contexto de hoy exige.
Se hace indispensable pues iniciar un proceso de formación y autoformación por parte de los docentes queayude a transformarlos, lo cual no es fácil, ya que esto exige involucrar una serie de cambios en los diseños curriculares, en el diseño de la institución como eje fundamental del proceso, modos de evaluar la docencia y al docente, por lo que este proceso implica que la Institución trace un plan de mejoramiento institucional y docente a largo y corto plazo.
De igual manera,es importante que el docente realice un autoexamen en cuanto a los siguientes criterios:Formación personal, teórica, disciplinar, investigativa, promulgación de valores,para con ello establecer de qué forma ha sido su formación, y por ende la que él imparte a sus estudiantes:si es artesanal donde un aprendizaje servía para toda la vida; personalista la cual centra la atención sobre la persona con todos sus condicionantes y posibilidades, es decir, la formación deja de ser un proceso de enseñar,para pasar al autodescubrimiento personal,el tomar conciencia de sí mismo, se trata del desarrollo total de la personalidad y no de conductas específicas; academicista el cual tiene como objetivo fundamental de formación la trasferencia de conocimientos científicos y culturales; técnica en la cual el docente domina las aplicaciones del conocimiento científico producido por otros y luego las aplica; o si bien en de orientación práctica la fundamentación es que la enseñanza actividad compleja se desarrolla en escenarios singulares, claramente determinada por el contexto; orientación social-reconstruccionista, que pone de relieve el carácter crítico de la enseñanza entendida como una actividad social saturada de opciones de carácter ético, en la que los valores que presiden su intencionalidad deben traducirse en principios de procedimiento que rijan y se realicen a lo largo de todos los procesos de enseñanza y aprendizaje.
Es posible,entonces,que la formación docente esté mediada de manera evidente por uno de los modelos anunciados anteriormente;o que tenga elementos de uno u otro, queda entonces para la reflexión personal determinar cómo puedo identificar el modelo de formación docente para con ello relacionarlo con el modelo establecido por la Universidad y de esta manera alinearse con el mismo, pues fundamentar que exista articulación entre las prácticas pedagógicas y los modelos pedagógicos Universitarios, que en este caso particular el modelo de la Universidad Francisco de Paula Santander Ocaña.La construcción de una solución de inteligencia de negocios, permite que la institución cuente con un repositorio central queintegre la información que se genera en los procesos académicos y financieros y que debe estar disponible tanto para la toma de decisiones como para los reportes que se deben rendir a las entidades de vigilancia y control del estado.
El DW, generado permite el análisis estratégico de la información institucional al consolidar los datos que generan los procesos de la universidad y que registran en diferentes fuentes y formatos.Con esta solución,además de cumplir con los compromisos estatales, permite conocer en cualquier momento la situación académica y financiera de la universidad,convirtiéndose en una herramienta de análisis sobre la efectividad de las políticas que se aplican.
Agradecimientos al equipo de trabajo del proyecto GENSIS del Departamento de Sistemas e Informática de la Universidad Francisco de Paula Santander Ocaña,por toda la información que pusieron a disposición de esta investigación.
Anjana Gosain,H.(2015).Literature Review of Data Model Quality Metrics of Data Warehouse.International Conference on Computer, Communication and Convergence (ICCC 2015) (págs.236-243). Bhubaneswar: Procedia Computer Science 48.
Bustamante, A., Galvis,E., & Gómez,L.(2012).Técnicas De Modelado Para Procesos de Extración Transformación y Carga:una Revisión Crítica.EATIS'12 (págs. 23-25). Valencia: ACM.
Chapman,P.,Clinton,J.,Kerber, R.,Khabaza,T.,Reinartz,T.,Shearer, C., & Wirth, R. (Agosto de 2000).CRISP-DM 1.0 Step-by-step data mining guide.
Curto Díaz, J.(2010).Introducción al Business Intelligence. Barcelona: Editorial UOC.
Hernandez Orallo,J.,Ramirez Quintana, M. J., & Ramirez Ferri, C. (2004). Introducción a la Mineria de Datos. Madrid: Pearson Educación S.A.
Hribar,I. (2010).Overview of Business Intelligence Maturity Models.Management, 47-67.
Inmon,B., & Krishnan, K. (2011).Building the Unstructured Data Warehouse: Architecture, Analysis,andDesign.Nueva Jersey: Technics Publications.
Jarke,M.,Lenzerini,M.,Vassiliou, Y., & Vassiliadis,P.(2013).Fundamentals of Data Warehouses. Berlin: Springer Science & Business Media.
Kimball, R., & Ross, M. (2013). The Data Warehouse Toolkit:The Definitive Guide to Dimensional Modeling. Indianapolis: John Wiley & Sons, Inc.
Lopez, F. (2011).Indicadores de Gestión.Bogotá:INCONTEC.
MEN.(2012). Publicaciones Educación Superior. Obtenido de Ministerio de Educación Nacional: http://www.mineducacion.gov.co/1621/articles-293647_archivo_pdf_plansectorial.pdf
Piatetsky, G. (2007). Data Mining / Analytic Tools Used Poll. Recuperado el 20 de Agosto de 2015, de http://www.kdnuggets.com/polls/2007/data_mining_methodology.htm
Rodríguez Rodríguez, J. E.(2010).Fundamentos de minería de datos (Primera edición ed.). (U. D. Caldas, Ed.)Bogota, Colombia:Universidad Distrital Francisco José de Caldas.
Rosado, A., & Rico,D.(2010). Inteligencia de negocios: Estado del arte. Scientia et Technica, 321-326.
Serrano, R. (2003).Introducción al análisis de datos experimentales: tratamiento de datos en bioensayos.Castellón de la Plana:Publicacions de la Universitat Jaume I.
Sharma, N., Bajpai, A., & Litoriya, R.(Mayo de 2012).Comparison the various clustering algorithms of weka. International Journal of Emerging Technology and Advanced Engineering, 2(5), 73-80.
Silvers, F. (2008).Building and Maintaining a Data Warehouse.Boca Raton: CRC Press.
Simitsisa,A., & Vassiliadis, P. (2008).A method for the mapping of conceptual designs to logical blueprints for ETL processes. Decision Support Systems, 22-40.
* Magister. Correo: aarosadog@ufpso.edu.co