La explosión de datos es hoy una característica global omnipresente y representa un reto que impulsa hacia nuevos enfoques tecnológicos, y es que el volumen de datos que tienen que gestionar las organizaciones crece exponencialmente, los analistas hablan de tasas de crecimiento de 125%. Pero también aumenta la necesidad de optimizar el acceso a la información; cada vez más los usuarios requieren acceder a los datos en tiempo real para generar información estratégica al instante, impulsados por la necesidad de desarrollar prácticas comerciales más ágiles.
Para hacer frente a esta demanda la tecnología de la información requiere de nuevas estrategias: ¿estamos frente a un cambio de paradigma? Analistas como Andrew Brust, experto en nuevas tecnologías de la consultora neoyorquina Twentysix, considera que “el mercado de BI ha alcanzado un nivel de madurez y un crecimiento lo suficiente como para que depositar la explotación del negocio de soluciones de BI de mayor valor en terceras partes haya llegado a convertirse en algo inaceptable.”
Los proveedores de sistemas manejadores de bases de datos parecen avisados, al menos así lo han asumido Sybase y Microsoft. La primera lanzó hace más de un año una solución (Dynamic Operational Date Store) cuya propuesta principal es que divorcia el tratamiento de los datos de las limitaciones de los sistemas tradicionales OLTP, y da acceso a los datos operativos críticos a un número cada vez más grande de usuarios. Promete proteger la inversión existente y pregona escalabilidad sin paralelo y agilidad para responder con rapidez a un entorno competitivo cambiante.
Microsoft incorporó hace casi un año herramientas de BI a su sistema de bases de datos SQL Server 2005, para dar un tratamiento inteligente a la información y promete BI de punta a punta. Su propuesta es llevar inteligencia de negocios al escritorio de todos los usuarios finales, lo que marca una diferencia con los sistemas tradicionales que solo llevan BI a las gerencias estratégicas de las empresas. MS se ha enfilado por esta vía y se prepara para lanzar a mediados del próximo año Office PerformancePoint Server 2007, un sistema integrado de BI que mejoraría las capacidades de análisis y reporting de SQL Server 2005 y presentaría la información a través del nuevo Office 2007.
Por otra parte, Oracle se mantiene apegada a las reglamentaciones que exigen a las empresas mantener estrechos controles en cuanto a quien puede acceder a cierta información. Sin embargo, para mejorar el acceso a la información empresarial, acaba de anunciar un motor de búsqueda integral y autónomo (Oracle Secure Enterprise Search 10g) que promete resultados de búsqueda de alta calidad desde distintas fuentes de datos de las empresas, entre ellas bases de datos, sistemas de archivos, sistemas de gestión de contenido empresarial, portales, sistemas de mensajes de correo electrónico y aplicaciones empresariales. Eso si para usuarios autorizados, por lo que ofrece una integración directa con los sistemas de autenticación de múltiples usuarios, un repositorio consolidado para almacenar el índice de búsqueda y una interfaz de programación segura utilizada para personalizar las capacidades de búsqueda y los resultados de alta calidad.
Mientras IBM recién culmina su proyecto “Viper” y libera finalmente DB2 9 que transforma la estática tecnología tradicional de base de datos en un servidor de datos interactivos con capacidad de administrar todo tipo de información: documentos, audio, videos, imágenes, páginas web y transacciones XML con firma electrónica.
AG/PC World Venezuela
Gestión oportuna de la información
El hombre logró vencer las limitaciones de su memoria a través de diversos medios en los que ha almacenado la información a través de la historia hasta llegar hoy a los más modernos sistemas. Pasó de lo físico a lo digital, y ello implica un crecimiento exponencial ¿pero está haciendo un uso efectivo de esa información?
La información se han vuelto cada día más abundante y con el tiempo también se ha hecho menos manejable por las grandes cantidades en que se produce. Para el año 2000 se estimaba que la información se duplicaba cada 20 meses; hoy se estima que se triplica cada 18 meses.
Empresas e instituciones tienen claro que las tecnologías de información son recursos críticos para desplegar sus acciones y conseguir sus objetivos. Para ello requieren llegar de manera legítima al consumidor, al ciudadano, a la persona con características bien determinadas, conocer sus preferencias y saber si han cumplido con sus obligaciones. Han tenido que aprender a conocerlos, construir los datos, almacenar información, hacer registros y a crear perfiles. Han recurrido a herramientas tecnológicas que permiten el tratamiento de grandes volúmenes de información.
Pero surge una duda porque todavía en la práctica hay incongruencias en el manejo poco efectivo en la gestión de la información. ¿Se está haciendo uso efectivo de esa información resgistrada y almacenada? Para responder a esta pregunta consultamos a algunos de los más importantes proveedores de tecnologías de bases de datos.
Explosión de datos y la individualización del servicio
Para Magdalena de Luca, presidenta ejecutiva de Corporación Sybven, cada día las empresas y el Estado obtienen más información y se hacen de más medios para almacenarla. Gastan ingentes recursos en personal para poder captarlas y se han planteado el tema como prioridad con la intención de conocer mejor a sus clientes y ciudadanos. “La tendencia es obtener mayor cantidad de datos con la intención de segmentarlos y han invertido millones de dólares en ello y lo siguen haciendo para obtenerlos y almacenarlos”, explicó de Luca.
Señala la ejecutiva que los intereses y las intenciones del mercado y desde luego de la empresa y otras instituciones públicas han cambiado. Antes, explica, era suficiente con obtener datos como el nombre y el número de cédula y “actualmente las instituciones quieren saber de todo porque será la mejor manera de conocer a la persona que se tiene enfrente, porque es la única manera de personalizar un servicio al cliente o de simplemente ver con cuántas obligaciones el individuo le ha pagado al fisco nacional”.
La información no es oportuna
Para de Luca a pesar de las grandes inversiones los recursos no se emplean de manera eficiente la información que se está manejando no es aprovechada porque con frecuencia ésta sigue teniendo un procesamiento de varios días y no está disponible cuando es requerida, e inclusive sucede que una vez dispuesta ya no está vigente.
Estos retrasos en el procesamiento de la información genera incluso discordancia en los objetivos de negocio y lleva a acciones contradictorias como se observa en este ejemplo que a propósito trae a colación la alta ejecutiva: “En ocasiones entidades financieras en plena campaña de crecimiento de sus servicios de créditos de consumo contactan a sus clientes para ofrecerle nuevos servicios, pero resulta que estos mismos clientes habían caído en mora, tal vez hacía una semana o menos. Pero, en lugar de estar haciendo gestiones de cobranza para revertir la mora, los ejecutivos de telemercadeo de la entidad financiera están ofreciendo nuevos productos a alguien que presumiblemente no los puede pagar”:
Asegura de Luca que esto ocurre porque la información no es oportuna, porque los recursos que se están utilizando no son los adecuados y las razones que señala, entre otras, es que los repositorios en donde se encuentran guardados los datos no están en línea y/o el personal no tiene acceso a toda la información del cliente.
Explosión de datos
Para la corporación Sybven es crítico el manejo de tres características que considera fundamentales en la gestión de la información por lo cual señala que no es suficiente con que las instituciones cuenten con buenos sistemas de almacenamiento sino que también es indispensable contar con buenos sistemas de gestión y disponibilidad la información. Las propuestas de Sybven parten de la idea de que la competitividad actualmente debe estar orientada a la personalización del servicio y para ello las instituciones deben llegarle a los individuos como personas y no como masa.
“Se requiere de sistemas transaccionales que puedan estar replicando aquellos datos que puedan ser interesantes, es decir, que aquellos datos que se ingresan o evento que ocurre, se registre y se haga disponible. Es la única manera de poder llegar al cliente con lo que él necesita. Así, cuando el cliente decida hacer alguna operación, el personal pueda utilizar esa oportunidad con la información completa, y con el récord que incluya el último evento, para ofrecer soluciones adecuadas al perfil del cliente antes que éste pregunte por servicios”.
De Luca destaca que la mejor manera de atender el cliente es que él perciba que su banco, su operadora de celular o su empresa de seguros sepa quién es él. Considera esto tan importante en el manejo de las relaciones con los clientes que comenta admirada: En cuántas oportunidades una persona sale de un banco y no ha llegado a su la casa u oficina cuando ya la están llamando para decirle que la gestión que acaba de realizar no puede ejecutarse porque antes debe resolver cuestiones pendientes sobre su crédito hipotecario o sobre el del automóvil.
Qué está haciendo Sybase y la Corporación Sybven
Conscientes de las fallas y experiencia del mercado se han propuesto en trabajar en una propuesta denominada Dynamic Operational Data Store (DODS) que se basa en la replicación de datos para que haya continuidad operativa del negocio. “Hacemos una evaluación de lo que empresa tiene y ofrecemos una solución que se ajuste, que sea barata en términos de inversión y el gasto sea razonable no en función sustituir lo que ya se tiene, sino en agregar las funcionalidades que consideramos críticas para asegurar la disponibilidad”.
De Luca da cuenta de que todavía hay empresas en Venezuela que trabajan sobre el concepto de Data Warehouse”. Esto no es malo, el problema está es que es una agregación de máquinas y recursos de almacenamiento que está muy bien para la data histórica, pero no permite la disponibilidad en línea de la información para tomar decisiones en el momento adecuado. Es importante tener los datos disponibles para, a partir de ellos, inferir comportamientos y ejecutar campañas”.
Administración y creación del conocimiento
Adriana Mitrovich, gerente de gestión de información SSA de IBM de Venezuela, explica que la empresa construye sobre el tema de bases de datos y manejadores una metodología que eleva las soluciones de bases de datos a otro nivel diferente y los arropa bajo un concepto integral en el que las mismas son un compronente engranado pero que por sí solos no permiten que información crítica se mantenga disponible en tiempo real para tomar decisiones de manera correcta para mantener cualquier ventaja sobre otro operador en u determinado mercado.
IBM tiene disponible dos líneas de productos o marcas para el manejo de bases de datos, el DB2 y e Informix. Esta última es una solución que la empresa comercializa y su demanda es preferida para el manejo masivo de operaciones transaccionales y aunque asegura que es una solución transparente y sencilla de operar -por sus capacidades de autoadministración, su preferencia por parte de las empresas se debe más bien a una relación histórica.
Para su línea de DB2 tiene versión gratuita denominada DB2 Express C, que aunque su alcance no es mayor, tiene utilidad para aquellos desarrollares que trabajen en plataformas pequeñas ya que posee ciertas limitaciones por procesadores y restricciones de componentes para disponibilidad, además un soporte por grupos de usuarios.
Como punto fuerte, adicionalmente a diversos componentes y ediciones, IBM se acentúa actualmente en su producto DB2 DWE (Data Warehouse Edition) para áreas de desarrollo más compleja y críticas de negocios y con soporte post venta. Es la versión que se paga para la gestión de datos para aplicaciones de negocios tanto de los proveedores principales (Core Aplications) de la industria como de proveedores menores de software (Independent Software Vendor).
Para la especialista el cambio de una versión gratuita a la de gestores más completos dependerá de la evolución de la complejidad de los negocios y de los requerimientos de plataformas para soluciones críticas.
Nueva liberación con aplicaciones SAP
Actualmente hay una edición beta de la próxima versión de DB2 que se comienza a manejar para este mes de julio y cuyo nombre código es Viper. Es una versión que ha desarrollado IBM para aplicaciones empresariales SAP entre cuyas carcaterísticas más resaltantes se encuentran la gestión relacional en arquitecturas XML, manejo de documentos de la misma naturaleza, disminución en 50% de los tiempos de programación en lenguaje XML y tiene propiedades de compresión de datos para manejar de manera más eficiente la capacidad del disco duro. Actualmente IBM realiza esfuerzos de mercadeo sobre la base instalada en el mercado venezolano con una agresiva oferta para la adopción temprana de este producto.
“No es un secreto que para los gerentes de tecnología que los dos últimos años sus esfuerzos se centran en mejorar los procesos y poner disponible la información”, asegura Mitrovich. “La gente pasa más tiempo en la búsqueda del dato que en la toma de decisiones y nosotros nos estamos concentrando en ello”.
En IBM el desarrollo de sus bases de datos se hace recogiendo las necesidades de dos frentes: de cara al administrador de plataformas, que es quien batalla día a día con la herramienta; con ello recogen sus inquietudes y conocen necesidades para volcarlas en los en los procesos de investigación y desarrollo. De cara a los proveedores de aplicaciones (CRM y ERP) que entregan sus productos con motores de bases de datos en licencias OEM incorporadas para fortalecer sus funcionalidades de cara al usuario final que interactúa con la aplicación.
Business Intelligence
Para IBM el problema de disponibilidad de la información está en los silos de almacenamiento de información que no están integrados y se encuentran en plataformas diferentes. El reto es cómo integrarla y la repuesta está en el Business Intelligence o Inteligencia de Negocios que es conjunto de herramientas y estrategias enfocadas en la administración y creación de conocimiento mediante el análisis de datos existentes en la empresa. “Hay empresas que están adoptando el tema con mayor o menor prioridad, pero no es sencillo porque tenemos años almacenando información y no han reconocido que es hora de usarla”.
La información puede residir en varias fuentes porque se procesa en tiempos diferentes, por operadores diferentes y con aplicaciones diferentes. “Son las aplicaciones de inteligencia de negocios, en sentido amplío, que incluyen la consultoría y mejores prácticas, las que permiten unificar los datos”.
IBM afirma que adicionalmente a los problemas de cantidad, o altos volúmenes de datos, en la industria se asume que la calidad de la data anualmente es 20% menos confiable.
Continuidad de datos y alta disponibilidad
Oracle posee una de los desarrollos en materia de base de datos más extensos del mercado. Fue la primera empresa que desarrolló las bases de datos relacionales y ha impulsado, con el resto de la industria, un concepto basado en el ciclo de vida de la información, el cual parte de sacar patrones importantes que permitan crear prioridades de acceso y disponibilidad de la información por uso y desuso de ciertos datos.
Por ejemplo, señala Jonh Nariño, especialista de soluciones de Bases de Datos de Oracle Venezuela, que por el uso frecuente del número de teléfono o los campos de cédula de identidad, estos sean los que se encuentran en el tope de una aplicación porque muestran mayor frecuencia de consulta en una plataforma en empresa de telefonía móvil. Este tipo de comportamiento es detectado por la aplicación para facilitar el trabajo y que el resto de los datos pasen a otro extremo de la aplicación gracias a las labores del manejador.
La oferta de Oracle para el mercado venezolano comprende básicamente 4 ediciones de manejadores de bases de datos: Oracle Database XE, de reciente liberación, es una versión gratis bastante limitada y cuya finalidad es para el mundo académico o estudiantes que se estén formando. La versión Standard One, después de la versión libre es la más económica y dirigida a empresas muy pequeñas porque soporta hasta 2 procesadores; la versión propiamente Standard que es la más adecuada para las pymes porque soporta 4 procesadores y remonta a la anterior en cuestión de valor; y la Enterprise Edtion destinada a manejar más de 4 procesadores e incorpora todas las funcionalidades.
Una de las ventajas competitivas que señala la empresa sobre sus manejadores de bases de datos es que son multiplataforma, se adapta a la necesidad del sistema y su capacidad para el manejo de grandes volúmenes de datos. Para Oracle más que un concepto global del manejo del dato, la importancia del ciclo de gestión de información empieza en el buen registro y la construcción de la base de datos. “Si el manejador no me ofrece las bondades de seguridad, manipulación de datos y almacenamiento, de nada me valdrá tener herramientas más sofiscaticadas de análisis de negocios”.
“Ser multiplataforma nos brinda la libertad de no estar casado con uno u otro sistema, podemos trabajar con todos como Unix, Linux o Windows, por nombrar algunos, y ofrecer la que más se ajusta a un hardware IBM, Dell, HP. Tenemos las herramientas y las opciones que pueden complementar cualquier sistema instalado, bien materia de seguridad, paticionamiento, reportes. Algunos de los otros fabricantes están amarrados a sus plataformas”.
Cuando existen problemas con la disponibilidad de la información puede deberse a muchas razones que pueden ir desde el tema de indisposición del hardware, recursos limitados, fallas en el sistema operativo y hasta la caída de la aplicación de gestión de la información; pero cuando se trata de este última, un buen manejador de bases de datos, explica Nariño, debe ser robusto y capaz de manejar grandes volúmnes de datos y no importa si cae en un determinado momento, porque efectivamente puede ocurrir, la importancia está en la rapidez de su recuperación que, dependiendo del tipo de industria a la que pertenezca la empresa, será más o menos relevante en los objetivos del negocio.
“No es lo mismo que no haya sistema de gestión en una cadena de farmacias, con un nivel moderado de transacción, que en cualquiera de las plataformas de las empresas de telefonía móvil en Venezuela que operan bajo el concepto masivo de transacción”.
Grid computing
Todas versiones de recientes de manejadores de base de datos de Oracle están orientados hacia la arquitectura de grid computing que busca la virtualización de los sistemas y reordenación y disposición de los recursos para darle utilidad a los que no se están ocupando en determinados momentos.
“Los sistemas antes no estaban diseñados para ser utilizados en toda su capacidad, por eso cada servidor contenía una aplicación y con cada nueva aplicación se adquiría un nuevo servidor”. Explica el ejecutivo que aunque el esquema de algunas arquitecturas sigue siendo así, gracias este nuevo concepto de redistribución de las cargas, se pueden mudar aplicaciones a servidores con capacidad ociosa.
Con el aprovisionamiento de recursos bajo el esquema de grip computing el manejador de base de datos podrá gestionar más o menos cargas, según la hora o momentos transaccionales pico, y balancear el trabajo en cada servidor en donde se haya cargado el manejador.