SlideShare una empresa de Scribd logo
1 de 18
Descargar para leer sin conexión
Big Data en el Entorno
Bancario
Martín Cabrera
Technology Director
Everis, an NTT DATA Company
@dmcabrera
martin.cabrera.aguilar@everis.com
Enteprise Data
Warehouse
Cubos
Sistemas
Transaccionales
(OLTP)
Integración y
Consolidación
Operaciones y
Analítica
Arquitectura de Datos Tradicional
CRM
ERP
Web
Channel
Call
Center
ETL
Datamart
Datamart
ETL
Reportes Operativos y
Analíticos
CRM
ERP
Modelamiento y
minería de datos
ETL
Auditoría
Gaps de la Arquitectura de Datos Tradicional
• Soporte de volúmenes de datos limitado a
nivel de los sistemas OLTP
• Integración y consolidación compleja a
través de procesos ETL
• Excesiva normalización y rigidez a nivel de
los esquemas de datos
• No es compatible con la carga de fuentes de
datos no estructuradas
• No soporta naturalmente la implementación
de real-time analytics
• Capacidad de escalamiento y elasticidad
limitados y de alto costo
• Pensada principalmente para el mundo on-
premise, lo que dificulta su extensión hacia
el Cloud
30%
50%
20%
Workloads
ETL
Operaciones
Analíticos
No esta preparada para la
Transformación Digital
Arquitectura de Datos Moderna
Hadoop Distributed File System (HDFS)
Otro
EDW
DM
DM
Data Access APIs
OLTP OLTP OLTP
Workload Interactivo Workload Real-time Workload Batch Workload Analítico
Fuentes de Datos No Estructuradas
Documentos y
Correos
Web Logs &
Click Streams
Social
Networks
Cloud-based
Services
Sensors Data
Geo-location
Data
¿Cómo resuelve los gaps la Arquitectura de Datos Moderna?
• Eliminando la separación conceptual y física de
los datos OLTP y los datos Analíticos a partir de
una Arquitectura de Datos unificada
• Eliminando las clásicas limitaciones de manejo
de volúmenes de información restringidos
• Soportando bajo una misma plataforma todos
los workloads requeridos actualmente,
Interactivo, Real-time, Batch y Analítico
• Integrándose con los activos de datos existentes
como el EDW, los DataMarts y las bases de
datos OLTP más las fuentes de datos no
estructuradas.
• Generando la figura de un Enterprise Data Lake
disponible para toda la corporación.
• Siendo compatible con arquitecturas de tipo
Cloud-Híbrida
20%
40%
40%
Workloads
ETL
Operaciones
Analíticos
Siendo un habilitador
fundamental para la
implementación de
productos y servicios
digitales
Resumen Comparativo
• Volúmenes de datos limitados y
capacidad de escalamiento vertical.
• Separación conceptual y física de datos
OLTP y datos analíticos
rellenorellenorellen.o
• Excesiva normalización y rigidez a nivel de
los esquemas de datos.
• Limitaciones importantes para resolver
workloads de Real-time analytics
rellenorellenorelleno
• No preparada para soportar el desarrollo
de productos y servicios digitales
• Pensada principalmente para el mundo
on-premise.
Arquitectura de Datos Tradicional
• Volúmenes de datos ilimitados con
capacidad de escalamiento horizontal.
• Arquitectura de datos Unificada que
integra fuentes de datos estructuradas y
no estructuradas.
• Esquemas flexibles diseñados para
cambiar frecuentemente.
• Diseñada para soportar cualquier tipo de
workload, Interactivo, Real-time, Batch y
Analítico.
• Fundamental para la implementación de
productos y servicios digitales
• Compatible con cualquier arquitectura
Cloud (privada, pública, híbrida).
Arquitectura de Datos Moderna
Web/Móvil
Sucursales
Callcente
r
ETL
Enteprise Data
Warehouse
Inteligencia
de Clientes
Modelos
Predictivos
Campañas Push
Modelos Riesgo
Reportes
Pérdida de Información
al momento de
transformar los datos
Existen datos que no
estamos procesando (ej:
logs)
No soporta la
implementación de
servicios de Real-Time
Analytics
Capacidad Analítica
limitada a los datos
disponibles
Baja capacidad de
impulsar la práctica
de Data Discovery
Escenario actual en la Banca
Riesgo
Canales
Operacione
s
Carga incremental (en near-real-
time) de todas las fuentes de
información relevantes.
Carga de fuentes no estructuradas
como logs, correos e información de
redes sociales.
Escenario futuro (Big Data)
Real-time
Analytics API
Campañas
Real-time
Data Insight
Discovery
Logs
Logs
Logs
Big Data
Enterprise Platform
(Data Lake)
EL
ETL
Web/Móvil
Sucursales
Callcente
r
ETL
Enteprise Data
Warehouse
Modelos
Predictivos
Campañas Push
Modelos Riesgo
Reportes
Data
Scientists
Capacidad analítica potenciada por
nuevas fuentes de información
Soporta la implementación de
servicios real-time y la práctica de
Discovery de datos
Machine Learning
based models
Inteligenci
a de
Clientes
Riesgo
Canales
Operacione
s
¿Cuáles serían los casos de uso
más comunes de Big Data en la
Banca y la arquitectura sugerida?
Enterprise Data Warehouse offloading
Enterprise Data
Warehouse
OLTP
ETL
1
2
Movemos información de
menor valor y/o histórica
desde el EDW a Hadoop
ocupando Sqoop
También podemos
replicar la información en
Hadoop para derivar
carga de explotación
Equipos
Explotació
n
3
4
Los equipos explotan la
información con las
mismas herramientas
que ocupan
actualmente.
Enterprise Data Lake
Enterprise Data
Warehouse
(EDW)
ETL
1
Equipos
Explotació
n
3
4
OLTP
OLTP
Las bases de datos
OLTP más
importantes se
cargan as-is en
Hadoop en
modalidad Batch
ETL
2
El EDW puede ser
cargado desde el
Data Lake en
Hadoop a través de
procesos ETL
Enterprise Data Lake + Nuevas Fuentes
Enterprise Data
Warehouse
(EDW)
ETL
1
Equipos
Explotación
4
5
OLTP
El Data Lake
incorpora fuentes
de datos No
Estructuradas en
modalidad Batch
ETL
3
Logs
OLTP
Logs
2
Data
Scientists
Data Insight
Discovery
(Aster Data)
Advanced
Analytics
(Mahout, R)
Cognitive
Analytics
(IBM Watson)
Near-Real-Time Data Ingestion
Enterprise Data
Warehouse (EDW)
Equipos
Explotació
n
4
5
OLTP
Los agentes de Flume
hacen streaming de la
información generada
ETL
3
Logs
OLTP
Logs
Flume
Agent
Flume
Agent
Flume
Agent
Los Interceptors de Flume
permiten enriquecer la
ingesta de datos para
finalmente guardarla en
HDFS (Hadoop)
1
2
Data
Scientists
Data Insight
Discovery
(Aster Data)
Advanced
Analytics
(Mahout, R)
Cognitive
Analytics
(IBM Watson)
Real-Time Analytics con HBase
OLTP
Logs
OLTP
Logs
Flume
Agent
Flume
Agent
Flume
Agent
En el proceso de ingesta de
datos, se guarda
información en HBase que
posteriormente servirá
como input para los
servicios Real-Time (ej: el
consumo acumulado diario
por rubro de un cliente con
tarjeta de crédito).
1
Real-Time
Analytics
Services API
2
3 El servicio real-time (expuesto como
API) es consumido por ejemplo por
la aplicación móvil cada vez que el
cliente realiza un pago con tarjeta.
Con la estructura clave-valor en
HBase, el servicio puede advertir al
cliente de un consumo excesivo en
su tarjeta e inclusive compararlo con
meses y años anteriores.
Real-Time Analytics con HBase+Spark
OLTP
Logs
OLTP
Logs
Flume
Agent
Flume
Agent
Flume
Agent
1
Real-Time
Analytics
Services API
3
Spark permite crear un
Resilient Distributed Dataset
(RDD) a partir de datos en
HDFS, HBase, etc.
Su capacidad de representar
los datos en memoria y de
procesar los mismos de
manera distribuida, permite
crear servicios de real-time
analytics avanzados que
requieran procesar grandes
volúmenes de datos.
2
Ejemplo Digital Journey soportado por BigData
Web
Red Social
El usuario se
conecta a
www.banco.cl
La aplicación le
indica que se
registre con sus
credenciales de
Twitter /
Facebook o
Linkedin
El usuario selecciona
Linkedin y la
aplicación solicita
permisos para
acceder a su perfil y
su lista de contactos
La aplicación le
muestra sus datos, le
solicita que ingrese su
número de móvil, una
clave segura y le envía
por SMS un código de
enrolamiento para su
dispositivo.
Móvil
El usuario recibe el
código de
enrolamiento para
confirmar su regsitro
El usuario confirma su registro y ya es
“Cliente Registrado”. La aplicación le da
la Bienvenida y la indica que 36 de sus
contactos en Linkedin ya son clientes
del Banco y que 22 de ellos tienen Cta
Cte y Tarjeta de Crédito, mientras que
18 tienen productos de inversión,
invitándolo a contratar dichos
productos
Email
El cliente recibe un correo de
bienvenida, con la misma
información de sus contactos que
está viendo en la aplicación web y
con la invitación a seguir
explorando los productos del
Banco
Resumiendo
• Los Bancos (y todos los negocios digitales) necesitan una
Arquitectura de Datos Moderna que soporte el
procesamiento de grandes volúmenes de información
(Big Data).
• El foco inicial debe estar puesto en la implementación de
una Plataforma de Big Data Corporativa, tanto para fines
analíticos como operativos.
• Los casos de uso más implementados son:
• Database offloading
• Enterprise Data Lake
• Near-Real-Time Data Ingestion
• Real-Time Analytics
Big Data en el Entorno
Bancario
Martín Cabrera
Technology Director
Everis, an NTT DATA Company
@dmcabrera
martin.cabrera.aguilar@everis.com

Más contenido relacionado

La actualidad más candente

Capítulo 3 Sistemas de información, organizaciones y estrategia
Capítulo 3 Sistemas de información, organizaciones y estrategia Capítulo 3 Sistemas de información, organizaciones y estrategia
Capítulo 3 Sistemas de información, organizaciones y estrategia wendy lopez
 
RWDG Slides: Build an Effective Data Governance Framework
RWDG Slides: Build an Effective Data Governance FrameworkRWDG Slides: Build an Effective Data Governance Framework
RWDG Slides: Build an Effective Data Governance FrameworkDATAVERSITY
 
Free Training: How to Build a Lakehouse
Free Training: How to Build a LakehouseFree Training: How to Build a Lakehouse
Free Training: How to Build a LakehouseDatabricks
 
"MDM: Cómo adquirir y retener más clientes" Master Data Management
"MDM: Cómo adquirir y retener más clientes" Master Data Management"MDM: Cómo adquirir y retener más clientes" Master Data Management
"MDM: Cómo adquirir y retener más clientes" Master Data ManagementPowerData
 
Introducción a Business Intelligence
Introducción a Business IntelligenceIntroducción a Business Intelligence
Introducción a Business IntelligenceJuan Azcurra
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocioslobi7o
 
Implementacion de business intelligence
Implementacion de business intelligenceImplementacion de business intelligence
Implementacion de business intelligenceFernando Lopez Ignacio
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasJoseph Lopez
 
Matriz bus y dimensiones
Matriz bus y dimensionesMatriz bus y dimensiones
Matriz bus y dimensionesMiguel Orquera
 
The Importance of Metadata
The Importance of MetadataThe Importance of Metadata
The Importance of MetadataDATAVERSITY
 
Building a Logical Data Fabric using Data Virtualization (ASEAN)
Building a Logical Data Fabric using Data Virtualization (ASEAN)Building a Logical Data Fabric using Data Virtualization (ASEAN)
Building a Logical Data Fabric using Data Virtualization (ASEAN)Denodo
 
Patrones de Arquitectura para Big Data en AWS
Patrones de Arquitectura para Big Data en AWSPatrones de Arquitectura para Big Data en AWS
Patrones de Arquitectura para Big Data en AWSAmazon Web Services LATAM
 
Inteligencia de Negocios BI
Inteligencia de Negocios BIInteligencia de Negocios BI
Inteligencia de Negocios BIfabian fernandez
 
Changing the game with cloud dw
Changing the game with cloud dwChanging the game with cloud dw
Changing the game with cloud dwelephantscale
 
Análisis estratégico de Starbucks
Análisis estratégico de StarbucksAnálisis estratégico de Starbucks
Análisis estratégico de StarbucksLuigui Meza Galdos
 
6 Steps to Become a Data-Driven Company
6 Steps to Become a Data-Driven Company6 Steps to Become a Data-Driven Company
6 Steps to Become a Data-Driven CompanyBrainSell Technologies
 
Smart Data Strategy EN (1).pdf
Smart Data Strategy EN (1).pdfSmart Data Strategy EN (1).pdf
Smart Data Strategy EN (1).pdfaminnezarat
 
Open Source ETL vs Commercial ETL
Open Source ETL vs Commercial ETLOpen Source ETL vs Commercial ETL
Open Source ETL vs Commercial ETLJonathan Levin
 

La actualidad más candente (20)

Capítulo 3 Sistemas de información, organizaciones y estrategia
Capítulo 3 Sistemas de información, organizaciones y estrategia Capítulo 3 Sistemas de información, organizaciones y estrategia
Capítulo 3 Sistemas de información, organizaciones y estrategia
 
RWDG Slides: Build an Effective Data Governance Framework
RWDG Slides: Build an Effective Data Governance FrameworkRWDG Slides: Build an Effective Data Governance Framework
RWDG Slides: Build an Effective Data Governance Framework
 
Free Training: How to Build a Lakehouse
Free Training: How to Build a LakehouseFree Training: How to Build a Lakehouse
Free Training: How to Build a Lakehouse
 
"MDM: Cómo adquirir y retener más clientes" Master Data Management
"MDM: Cómo adquirir y retener más clientes" Master Data Management"MDM: Cómo adquirir y retener más clientes" Master Data Management
"MDM: Cómo adquirir y retener más clientes" Master Data Management
 
Introducción a Business Intelligence
Introducción a Business IntelligenceIntroducción a Business Intelligence
Introducción a Business Intelligence
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Implementacion de business intelligence
Implementacion de business intelligenceImplementacion de business intelligence
Implementacion de business intelligence
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 
Matriz bus y dimensiones
Matriz bus y dimensionesMatriz bus y dimensiones
Matriz bus y dimensiones
 
The Importance of Metadata
The Importance of MetadataThe Importance of Metadata
The Importance of Metadata
 
Building a Logical Data Fabric using Data Virtualization (ASEAN)
Building a Logical Data Fabric using Data Virtualization (ASEAN)Building a Logical Data Fabric using Data Virtualization (ASEAN)
Building a Logical Data Fabric using Data Virtualization (ASEAN)
 
Patrones de Arquitectura para Big Data en AWS
Patrones de Arquitectura para Big Data en AWSPatrones de Arquitectura para Big Data en AWS
Patrones de Arquitectura para Big Data en AWS
 
Inteligencia de Negocios BI
Inteligencia de Negocios BIInteligencia de Negocios BI
Inteligencia de Negocios BI
 
Changing the game with cloud dw
Changing the game with cloud dwChanging the game with cloud dw
Changing the game with cloud dw
 
Análisis estratégico de Starbucks
Análisis estratégico de StarbucksAnálisis estratégico de Starbucks
Análisis estratégico de Starbucks
 
Data mart
Data martData mart
Data mart
 
6 Steps to Become a Data-Driven Company
6 Steps to Become a Data-Driven Company6 Steps to Become a Data-Driven Company
6 Steps to Become a Data-Driven Company
 
Smart Data Strategy EN (1).pdf
Smart Data Strategy EN (1).pdfSmart Data Strategy EN (1).pdf
Smart Data Strategy EN (1).pdf
 
Los Sistemas De Informacion
Los Sistemas De InformacionLos Sistemas De Informacion
Los Sistemas De Informacion
 
Open Source ETL vs Commercial ETL
Open Source ETL vs Commercial ETLOpen Source ETL vs Commercial ETL
Open Source ETL vs Commercial ETL
 

Similar a Big Data en el entorno Bancario

3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datosIT-NOVA
 
Integración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoIntegración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoDatalytics
 
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptxJASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptxIT-NOVA
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouseguest10616d
 
Oracle, Informix
Oracle, InformixOracle, Informix
Oracle, Informixallison tl
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informeCarlosTenelema1
 
Oracle data integrator (odi)
Oracle data integrator (odi)Oracle data integrator (odi)
Oracle data integrator (odi)Leonel Ibarra
 
Autoservicio BI
Autoservicio BI Autoservicio BI
Autoservicio BI NexTReT
 
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric LógicoMejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric LógicoDenodo
 
Comparativa herramientas ETL
Comparativa herramientas ETLComparativa herramientas ETL
Comparativa herramientas ETLJorge Bustillos
 
Mejorar la toma de decisiones y reducir costes con el Logical Data Warehouse ...
Mejorar la toma de decisiones y reducir costes con el Logical Data Warehouse ...Mejorar la toma de decisiones y reducir costes con el Logical Data Warehouse ...
Mejorar la toma de decisiones y reducir costes con el Logical Data Warehouse ...Denodo
 

Similar a Big Data en el entorno Bancario (20)

Querona
QueronaQuerona
Querona
 
BI - Componentes de BI.pptx
BI - Componentes de BI.pptxBI - Componentes de BI.pptx
BI - Componentes de BI.pptx
 
3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos3 formas disponibilizar y acceder rápidamente a tus datos
3 formas disponibilizar y acceder rápidamente a tus datos
 
Integración de Datos sin límites con Pentaho
Integración de Datos sin límites con PentahoIntegración de Datos sin límites con Pentaho
Integración de Datos sin límites con Pentaho
 
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptxJASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
JASPERSOFT REPORTERÍA INTEGRADA IT-NOVA.pptx
 
Capitulo 2 introducción al business intelligence
Capitulo 2   introducción al business intelligenceCapitulo 2   introducción al business intelligence
Capitulo 2 introducción al business intelligence
 
Data mart
Data martData mart
Data mart
 
Que Es Un Data Warehouse
Que Es Un Data WarehouseQue Es Un Data Warehouse
Que Es Un Data Warehouse
 
Oracle
OracleOracle
Oracle
 
PPTS establecida para los manuales del DAT New.ppt
PPTS establecida para los manuales del DAT New.pptPPTS establecida para los manuales del DAT New.ppt
PPTS establecida para los manuales del DAT New.ppt
 
ALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptxALMACEN DE DATOS.pptx
ALMACEN DE DATOS.pptx
 
Business Analytics 101
Business Analytics 101Business Analytics 101
Business Analytics 101
 
Oracle, Informix
Oracle, InformixOracle, Informix
Oracle, Informix
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
 
CASO PRACTICO 2.pptx
CASO PRACTICO 2.pptxCASO PRACTICO 2.pptx
CASO PRACTICO 2.pptx
 
Oracle data integrator (odi)
Oracle data integrator (odi)Oracle data integrator (odi)
Oracle data integrator (odi)
 
Autoservicio BI
Autoservicio BI Autoservicio BI
Autoservicio BI
 
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric LógicoMejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
Mejora el Rendimiento y la Gobernanza de tus Datos con un Data Fabric Lógico
 
Comparativa herramientas ETL
Comparativa herramientas ETLComparativa herramientas ETL
Comparativa herramientas ETL
 
Mejorar la toma de decisiones y reducir costes con el Logical Data Warehouse ...
Mejorar la toma de decisiones y reducir costes con el Logical Data Warehouse ...Mejorar la toma de decisiones y reducir costes con el Logical Data Warehouse ...
Mejorar la toma de decisiones y reducir costes con el Logical Data Warehouse ...
 

Último

Trabajo de tecnología liceo departamental
Trabajo de tecnología liceo departamentalTrabajo de tecnología liceo departamental
Trabajo de tecnología liceo departamentalEmanuelCastro64
 
La electricidad y la electronica.10-7.pdf
La electricidad y la electronica.10-7.pdfLa electricidad y la electronica.10-7.pdf
La electricidad y la electronica.10-7.pdfcristianrb0324
 
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptxHugoGutierrez99
 
Slideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan GerenciaSlideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan Gerenciacubillannoly
 
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024u20211198540
 
TinkerCAD y figuras en 3D. Uso del programa TinkerCAD para crear fuguras.
TinkerCAD y figuras en 3D. Uso del programa TinkerCAD para crear fuguras.TinkerCAD y figuras en 3D. Uso del programa TinkerCAD para crear fuguras.
TinkerCAD y figuras en 3D. Uso del programa TinkerCAD para crear fuguras.radatoro1
 
ORIENTACIONES DE INFORMÁTICA-2024.pdf-guia
ORIENTACIONES DE INFORMÁTICA-2024.pdf-guiaORIENTACIONES DE INFORMÁTICA-2024.pdf-guia
ORIENTACIONES DE INFORMÁTICA-2024.pdf-guiaYeimys Ch
 
Trabajo de tecnología primer periodo 2024
Trabajo de tecnología primer periodo 2024Trabajo de tecnología primer periodo 2024
Trabajo de tecnología primer periodo 2024anasofiarodriguezcru
 
TENDENCIAS DE IA Inteligencia artificial generativa.pdf
TENDENCIAS DE IA Inteligencia artificial generativa.pdfTENDENCIAS DE IA Inteligencia artificial generativa.pdf
TENDENCIAS DE IA Inteligencia artificial generativa.pdfJoseAlejandroPerezBa
 
Trabajo de Tecnología .pdfywhwhejsjsjsjsjsk
Trabajo de Tecnología .pdfywhwhejsjsjsjsjskTrabajo de Tecnología .pdfywhwhejsjsjsjsjsk
Trabajo de Tecnología .pdfywhwhejsjsjsjsjskbydaniela5
 
certificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfcertificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfFernandoOblitasVivan
 
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdfBetianaJuarez1
 
Nomisam: Base de Datos para Gestión de Nómina
Nomisam: Base de Datos para Gestión de NóminaNomisam: Base de Datos para Gestión de Nómina
Nomisam: Base de Datos para Gestión de Nóminacuellosameidy
 
Herramientas que posibilitan la información y la investigación.pdf
Herramientas que posibilitan la información y la investigación.pdfHerramientas que posibilitan la información y la investigación.pdf
Herramientas que posibilitan la información y la investigación.pdfKarinaCambero3
 
TECNOLOGIA 11-4.8888888888888888888888888
TECNOLOGIA 11-4.8888888888888888888888888TECNOLOGIA 11-4.8888888888888888888888888
TECNOLOGIA 11-4.8888888888888888888888888ElianaValencia28
 
Trabajando con Formasy Smart art en power Point
Trabajando con Formasy Smart art en power PointTrabajando con Formasy Smart art en power Point
Trabajando con Formasy Smart art en power PointValerioIvanDePazLoja
 
CommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 TestcontainersCommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 TestcontainersIván López Martín
 
Clasificación de Conjuntos de Datos Desequilibrados.pptx
Clasificación de Conjuntos de Datos Desequilibrados.pptxClasificación de Conjuntos de Datos Desequilibrados.pptx
Clasificación de Conjuntos de Datos Desequilibrados.pptxCarolina Bujaico
 
tecnologiaactividad11-240323205859-a9b9b9bc.pdf
tecnologiaactividad11-240323205859-a9b9b9bc.pdftecnologiaactividad11-240323205859-a9b9b9bc.pdf
tecnologiaactividad11-240323205859-a9b9b9bc.pdflauralizcano0319
 
Actividades de computación para alumnos de preescolar
Actividades de computación para alumnos de preescolarActividades de computación para alumnos de preescolar
Actividades de computación para alumnos de preescolar24roberto21
 

Último (20)

Trabajo de tecnología liceo departamental
Trabajo de tecnología liceo departamentalTrabajo de tecnología liceo departamental
Trabajo de tecnología liceo departamental
 
La electricidad y la electronica.10-7.pdf
La electricidad y la electronica.10-7.pdfLa electricidad y la electronica.10-7.pdf
La electricidad y la electronica.10-7.pdf
 
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
#Tare10ProgramacionWeb2024aaaaaaaaaaaa.pptx
 
Slideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan GerenciaSlideshare y Scribd - Noli Cubillan Gerencia
Slideshare y Scribd - Noli Cubillan Gerencia
 
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
Inteligencia Artificial. Matheo Hernandez Serrano USCO 2024
 
TinkerCAD y figuras en 3D. Uso del programa TinkerCAD para crear fuguras.
TinkerCAD y figuras en 3D. Uso del programa TinkerCAD para crear fuguras.TinkerCAD y figuras en 3D. Uso del programa TinkerCAD para crear fuguras.
TinkerCAD y figuras en 3D. Uso del programa TinkerCAD para crear fuguras.
 
ORIENTACIONES DE INFORMÁTICA-2024.pdf-guia
ORIENTACIONES DE INFORMÁTICA-2024.pdf-guiaORIENTACIONES DE INFORMÁTICA-2024.pdf-guia
ORIENTACIONES DE INFORMÁTICA-2024.pdf-guia
 
Trabajo de tecnología primer periodo 2024
Trabajo de tecnología primer periodo 2024Trabajo de tecnología primer periodo 2024
Trabajo de tecnología primer periodo 2024
 
TENDENCIAS DE IA Inteligencia artificial generativa.pdf
TENDENCIAS DE IA Inteligencia artificial generativa.pdfTENDENCIAS DE IA Inteligencia artificial generativa.pdf
TENDENCIAS DE IA Inteligencia artificial generativa.pdf
 
Trabajo de Tecnología .pdfywhwhejsjsjsjsjsk
Trabajo de Tecnología .pdfywhwhejsjsjsjsjskTrabajo de Tecnología .pdfywhwhejsjsjsjsjsk
Trabajo de Tecnología .pdfywhwhejsjsjsjsjsk
 
certificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdfcertificado de oracle academy cetrificado.pdf
certificado de oracle academy cetrificado.pdf
 
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
_Planificacion Anual NTICX 2024.SEC.21.4.1.docx.pdf
 
Nomisam: Base de Datos para Gestión de Nómina
Nomisam: Base de Datos para Gestión de NóminaNomisam: Base de Datos para Gestión de Nómina
Nomisam: Base de Datos para Gestión de Nómina
 
Herramientas que posibilitan la información y la investigación.pdf
Herramientas que posibilitan la información y la investigación.pdfHerramientas que posibilitan la información y la investigación.pdf
Herramientas que posibilitan la información y la investigación.pdf
 
TECNOLOGIA 11-4.8888888888888888888888888
TECNOLOGIA 11-4.8888888888888888888888888TECNOLOGIA 11-4.8888888888888888888888888
TECNOLOGIA 11-4.8888888888888888888888888
 
Trabajando con Formasy Smart art en power Point
Trabajando con Formasy Smart art en power PointTrabajando con Formasy Smart art en power Point
Trabajando con Formasy Smart art en power Point
 
CommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 TestcontainersCommitConf 2024 - Spring Boot <3 Testcontainers
CommitConf 2024 - Spring Boot <3 Testcontainers
 
Clasificación de Conjuntos de Datos Desequilibrados.pptx
Clasificación de Conjuntos de Datos Desequilibrados.pptxClasificación de Conjuntos de Datos Desequilibrados.pptx
Clasificación de Conjuntos de Datos Desequilibrados.pptx
 
tecnologiaactividad11-240323205859-a9b9b9bc.pdf
tecnologiaactividad11-240323205859-a9b9b9bc.pdftecnologiaactividad11-240323205859-a9b9b9bc.pdf
tecnologiaactividad11-240323205859-a9b9b9bc.pdf
 
Actividades de computación para alumnos de preescolar
Actividades de computación para alumnos de preescolarActividades de computación para alumnos de preescolar
Actividades de computación para alumnos de preescolar
 

Big Data en el entorno Bancario

  • 1. Big Data en el Entorno Bancario Martín Cabrera Technology Director Everis, an NTT DATA Company @dmcabrera martin.cabrera.aguilar@everis.com
  • 2. Enteprise Data Warehouse Cubos Sistemas Transaccionales (OLTP) Integración y Consolidación Operaciones y Analítica Arquitectura de Datos Tradicional CRM ERP Web Channel Call Center ETL Datamart Datamart ETL Reportes Operativos y Analíticos CRM ERP Modelamiento y minería de datos ETL Auditoría
  • 3. Gaps de la Arquitectura de Datos Tradicional • Soporte de volúmenes de datos limitado a nivel de los sistemas OLTP • Integración y consolidación compleja a través de procesos ETL • Excesiva normalización y rigidez a nivel de los esquemas de datos • No es compatible con la carga de fuentes de datos no estructuradas • No soporta naturalmente la implementación de real-time analytics • Capacidad de escalamiento y elasticidad limitados y de alto costo • Pensada principalmente para el mundo on- premise, lo que dificulta su extensión hacia el Cloud 30% 50% 20% Workloads ETL Operaciones Analíticos No esta preparada para la Transformación Digital
  • 4. Arquitectura de Datos Moderna Hadoop Distributed File System (HDFS) Otro EDW DM DM Data Access APIs OLTP OLTP OLTP Workload Interactivo Workload Real-time Workload Batch Workload Analítico Fuentes de Datos No Estructuradas Documentos y Correos Web Logs & Click Streams Social Networks Cloud-based Services Sensors Data Geo-location Data
  • 5. ¿Cómo resuelve los gaps la Arquitectura de Datos Moderna? • Eliminando la separación conceptual y física de los datos OLTP y los datos Analíticos a partir de una Arquitectura de Datos unificada • Eliminando las clásicas limitaciones de manejo de volúmenes de información restringidos • Soportando bajo una misma plataforma todos los workloads requeridos actualmente, Interactivo, Real-time, Batch y Analítico • Integrándose con los activos de datos existentes como el EDW, los DataMarts y las bases de datos OLTP más las fuentes de datos no estructuradas. • Generando la figura de un Enterprise Data Lake disponible para toda la corporación. • Siendo compatible con arquitecturas de tipo Cloud-Híbrida 20% 40% 40% Workloads ETL Operaciones Analíticos Siendo un habilitador fundamental para la implementación de productos y servicios digitales
  • 6. Resumen Comparativo • Volúmenes de datos limitados y capacidad de escalamiento vertical. • Separación conceptual y física de datos OLTP y datos analíticos rellenorellenorellen.o • Excesiva normalización y rigidez a nivel de los esquemas de datos. • Limitaciones importantes para resolver workloads de Real-time analytics rellenorellenorelleno • No preparada para soportar el desarrollo de productos y servicios digitales • Pensada principalmente para el mundo on-premise. Arquitectura de Datos Tradicional • Volúmenes de datos ilimitados con capacidad de escalamiento horizontal. • Arquitectura de datos Unificada que integra fuentes de datos estructuradas y no estructuradas. • Esquemas flexibles diseñados para cambiar frecuentemente. • Diseñada para soportar cualquier tipo de workload, Interactivo, Real-time, Batch y Analítico. • Fundamental para la implementación de productos y servicios digitales • Compatible con cualquier arquitectura Cloud (privada, pública, híbrida). Arquitectura de Datos Moderna
  • 7. Web/Móvil Sucursales Callcente r ETL Enteprise Data Warehouse Inteligencia de Clientes Modelos Predictivos Campañas Push Modelos Riesgo Reportes Pérdida de Información al momento de transformar los datos Existen datos que no estamos procesando (ej: logs) No soporta la implementación de servicios de Real-Time Analytics Capacidad Analítica limitada a los datos disponibles Baja capacidad de impulsar la práctica de Data Discovery Escenario actual en la Banca Riesgo Canales Operacione s
  • 8. Carga incremental (en near-real- time) de todas las fuentes de información relevantes. Carga de fuentes no estructuradas como logs, correos e información de redes sociales. Escenario futuro (Big Data) Real-time Analytics API Campañas Real-time Data Insight Discovery Logs Logs Logs Big Data Enterprise Platform (Data Lake) EL ETL Web/Móvil Sucursales Callcente r ETL Enteprise Data Warehouse Modelos Predictivos Campañas Push Modelos Riesgo Reportes Data Scientists Capacidad analítica potenciada por nuevas fuentes de información Soporta la implementación de servicios real-time y la práctica de Discovery de datos Machine Learning based models Inteligenci a de Clientes Riesgo Canales Operacione s
  • 9. ¿Cuáles serían los casos de uso más comunes de Big Data en la Banca y la arquitectura sugerida?
  • 10. Enterprise Data Warehouse offloading Enterprise Data Warehouse OLTP ETL 1 2 Movemos información de menor valor y/o histórica desde el EDW a Hadoop ocupando Sqoop También podemos replicar la información en Hadoop para derivar carga de explotación Equipos Explotació n 3 4 Los equipos explotan la información con las mismas herramientas que ocupan actualmente.
  • 11. Enterprise Data Lake Enterprise Data Warehouse (EDW) ETL 1 Equipos Explotació n 3 4 OLTP OLTP Las bases de datos OLTP más importantes se cargan as-is en Hadoop en modalidad Batch ETL 2 El EDW puede ser cargado desde el Data Lake en Hadoop a través de procesos ETL
  • 12. Enterprise Data Lake + Nuevas Fuentes Enterprise Data Warehouse (EDW) ETL 1 Equipos Explotación 4 5 OLTP El Data Lake incorpora fuentes de datos No Estructuradas en modalidad Batch ETL 3 Logs OLTP Logs 2 Data Scientists Data Insight Discovery (Aster Data) Advanced Analytics (Mahout, R) Cognitive Analytics (IBM Watson)
  • 13. Near-Real-Time Data Ingestion Enterprise Data Warehouse (EDW) Equipos Explotació n 4 5 OLTP Los agentes de Flume hacen streaming de la información generada ETL 3 Logs OLTP Logs Flume Agent Flume Agent Flume Agent Los Interceptors de Flume permiten enriquecer la ingesta de datos para finalmente guardarla en HDFS (Hadoop) 1 2 Data Scientists Data Insight Discovery (Aster Data) Advanced Analytics (Mahout, R) Cognitive Analytics (IBM Watson)
  • 14. Real-Time Analytics con HBase OLTP Logs OLTP Logs Flume Agent Flume Agent Flume Agent En el proceso de ingesta de datos, se guarda información en HBase que posteriormente servirá como input para los servicios Real-Time (ej: el consumo acumulado diario por rubro de un cliente con tarjeta de crédito). 1 Real-Time Analytics Services API 2 3 El servicio real-time (expuesto como API) es consumido por ejemplo por la aplicación móvil cada vez que el cliente realiza un pago con tarjeta. Con la estructura clave-valor en HBase, el servicio puede advertir al cliente de un consumo excesivo en su tarjeta e inclusive compararlo con meses y años anteriores.
  • 15. Real-Time Analytics con HBase+Spark OLTP Logs OLTP Logs Flume Agent Flume Agent Flume Agent 1 Real-Time Analytics Services API 3 Spark permite crear un Resilient Distributed Dataset (RDD) a partir de datos en HDFS, HBase, etc. Su capacidad de representar los datos en memoria y de procesar los mismos de manera distribuida, permite crear servicios de real-time analytics avanzados que requieran procesar grandes volúmenes de datos. 2
  • 16. Ejemplo Digital Journey soportado por BigData Web Red Social El usuario se conecta a www.banco.cl La aplicación le indica que se registre con sus credenciales de Twitter / Facebook o Linkedin El usuario selecciona Linkedin y la aplicación solicita permisos para acceder a su perfil y su lista de contactos La aplicación le muestra sus datos, le solicita que ingrese su número de móvil, una clave segura y le envía por SMS un código de enrolamiento para su dispositivo. Móvil El usuario recibe el código de enrolamiento para confirmar su regsitro El usuario confirma su registro y ya es “Cliente Registrado”. La aplicación le da la Bienvenida y la indica que 36 de sus contactos en Linkedin ya son clientes del Banco y que 22 de ellos tienen Cta Cte y Tarjeta de Crédito, mientras que 18 tienen productos de inversión, invitándolo a contratar dichos productos Email El cliente recibe un correo de bienvenida, con la misma información de sus contactos que está viendo en la aplicación web y con la invitación a seguir explorando los productos del Banco
  • 17. Resumiendo • Los Bancos (y todos los negocios digitales) necesitan una Arquitectura de Datos Moderna que soporte el procesamiento de grandes volúmenes de información (Big Data). • El foco inicial debe estar puesto en la implementación de una Plataforma de Big Data Corporativa, tanto para fines analíticos como operativos. • Los casos de uso más implementados son: • Database offloading • Enterprise Data Lake • Near-Real-Time Data Ingestion • Real-Time Analytics
  • 18. Big Data en el Entorno Bancario Martín Cabrera Technology Director Everis, an NTT DATA Company @dmcabrera martin.cabrera.aguilar@everis.com