Por Alejandro Bianchi, Presidente de Liveware –organización ganadora del Premio Sadosky- Mención Especial a la Calidad 2017. Reconocimiento otorgado por la Industria del Software (CESSI).
La demanda actual de aplicaciones basadas en Big Data – que dentro de dos años se estima que su negocio será mayor a 200 billones de dólares a nivel global – está y seguirá creciendo en función a las necesidades de las organizaciones de poder tomar decisiones más acertadas y en tiempo real, con el objetivo de responder a las necesidades de sus clientes con nuevos productos y servicios. Pero el desarrollo de soluciones basadas en esta tecnología es un mundo nuevo y que está en constante evolución en todo Latinoamérica, por lo que podría decirse que son, todavía, inestables. Esta inestabilidad se traduce en un conjunto de riesgos técnicos, (performance, por ejemplo), que atentan contra el cumplimiento de costos, calidad y cronogramas de los proyectos de Big Data. Si quisiéramos instanciar estos riesgos la lista incluiría:
- Las cinco V de Big Data: Volumen, variedad, velocidad, veracidad y valor, son aspectos que deben ser explícitamente considerados en el diseño de las soluciones. Muchas empresas se centran en dar a entender que lo único que importa es el valor, pero esta “V” sin las otra cuatro es solo una quimera.
- Cambios de paradigma (tales como Data Lake, Polyglot Persistence, Lambda Architecture, etc.): Los esfuerzos primarios han estado focalizados en codificar el desarrollo de tradicionales sistemas de datos, pero ahora se está focalizando en la selección y orquestación de tecnologías para sistemas basados en Big Data.
- La proliferación y la dificultad para seleccionar la tecnología adecuada: Existen más de 150 productos, solo en el mundo de bases de datos NoSQL, tecnologías abiertas y propietarias, tales como Hadoop, MapReduce, Spark, etc. representan un desafío al momento de definir una solución.
- La velocidad de los cambios tecnológicos: Mientras los sistemas tradiciones se focalizan en el almacenamiento en bases de datos; los sistemas basados en Big Data se focalizan en el procesamiento, uso y movimiento de los datos, lo cual para muchos arquitectos conlleva la gestión de los datos a un nuevo territorio, tal como NoSQL, NewSQL y a la utilización de tácticas y patrones asociados al procesamiento distribuido
- La corta historia del desarrollo de sistemas basados en Big Data: Existen muchas tecnologías, incluso familias de ellas, y la comunidad no ha acumulado suficiente experiencia que pueda traducirse en patrones robustos y bien probados.
- Complejas integraciones entre nuevos sistemas y ambientes legados: Muchos sistemas basados en Big Data necesitan integrarse con sistemas legados, generando riesgos relacionados con propiedades emergentes de dicha integración.
En este sentido el desarrollo de este tipo de aplicaciones se debe sustentar en la combinación de prácticas basadas en diseño y evaluación de arquitecturas y el desarrollo basado en prototipos. Las prácticas mencionadas deben estar inmersas en un ciclo de vida que asegure agilidad, integración y entrega continua.
Un análisis de la firma Frost & Sullivan determinó que el mercado de Big Data y Analítica (BDA) en América Latina generó ingresos por 2.9 mil millones en 2017 y se espera que llegue a 8.5 mil millones para 2023, a una tasa de crecimiento compuesta anual de 19.2 por ciento. Brasil se encuentra a la delantera en Latinoamérica, cuenta con 46.7% de las ventas totales. Le sigue México con 26.7%; Colombia 7.9%; Chile 6.9%; Argentina 5.6%; y Perú 2.4%. Se advierte mayor madurez por parte de las organizaciones con relación a la importancia de los datos, que incrementan la productividad, lealtad del cliente e Internet e IoT (Internet de las Cosas) son factores que están animando el desarrollo de este sector en la región.
En Argentina la adopción por parte de las compañías de este tipo de tecnologías, se encuentra en diferentes estadios, algunos en la etapa de entendimiento de la necesidad de Big Data, otros en la etapa de experimentación a partir de proyectos piloto con foco en los clientes o por ejemplo, para fortalecer los análisis de riesgo a partir de la utilización de máquinas de aprendizaje y otros ya están con implantaciones concretas vinculadas con soporte al cliente. De todas maneras, no hay una aplicación masiva de Big Data a los niveles de BI.
A nivel regional la Comisión Económica para América Latina y el Caribe (Cepal), organismo dependiente de la Organización de las Naciones Unidas responsable de promover el desarrollo económico y social de la región, realiza diversas gestiones e impulsa la analítica de grandes datos para el desarrollo sostenible, con el objetivo de mejorar las capacidades nacionales para medir la economía digital en la región. Recientemente Colombia dio un gran paso, al ser uno de los primeros países en América Latina en adoptar una política para Big Data, donde el Gobierno nacional aprobó el Conpes 3920, que define la política para el país en materia de explotación de datos.
En algunas ocasiones la falta de impulso a adoptar esta tecnología se debe a la confusión acerca de lo que significa Big Data, Analytics, BI y las tecnologías relacionadas. Un primer paso que todo CIOs debería dar es informarse de esta tecnología más allá de las propuestas, (abundantes), que proveen los vendors especializados de manera de poder entender bien el alcance de la tecnología y sus beneficios y a partir de este punto, trabajar en la mejor opción tecnológica que se adapte a su contexto. Otro factor importante es la falta de gobierno de datos dentro de las organizaciones: se pueden tener claros los objetivos, los beneficios y aún la tecnología, pero si no hay un adecuado gobierno sobre las fuentes de datos críticas de la organización, Big Data será un esfuerzo muy costoso y de pocos beneficios.
En resumen, será oportuno comprender que una organización gestionada por datos e información, esté en el país que esté, deberá accionar en consecuencia para que lo que Big Data aporte sea visto como un valor que torne a la empresa más competitiva, disminuyendo los riesgos mencionados que puedan llegar a existir.