Logo-Graphenus-negativo

Características y herramientas

ARQUITECTURA FUNCIONAL

Gestión y control end-to-end de los datos: desde la gestión y monitorización de la infraestructura hasta el almacenamiento, 

el análisis y el gobierno de los datos

  • Almacenamiento distribuido de alta disponibilidad

 

  • Procesamiento distribuido de datos en batch y streaming

 

  • Representación de datos y consultas SQL

 

  • Construcción de notebooks para realizar tareas de computación, ciencia de datos o machine learning

 

  • Acceso a diferentes fuentes de datos, incluso en tiempo real

 

  • Interfaz de usuario para interactuar con las herramientas de la distribución
  • Planificación de procesos

 

  • Monitorización del uso y funcionamiento de los servicios

 

  • Capa de seguridad para la protección del acceso a los datos en función de su sensibilidad, la gestión de la autenticación y la autorización.

 

  • Gobierno del dato a lo largo de todo el ciclo de procesamiento de la información

ARQUITECTURA FUNCIONAL

security-gobernance

Roadmap

y actualizaciones

Dos líneas evolutivas, varias releases anuales

La política de releases de Graphenus reduce el riesgo de obsolescencia tecnológica, incorporando de forma continua nuevas capacidades 

vaso_precipitado

Experimental

  • Nuevos desarrollos

 

  • Nuevas versiones de los componentes

 

  • Pruebas de concepto

 

  • Equipo propio buscando posibles funcionalidades o nuevas herramientas

 

  • Periodo de release: 3 meses
bandera

Estable

  • Software totalmente estable

 

  • Promocionado desde la versión experimental

 

  • Perfectamente integrado con el resto de los componentes

 

  • Periodo de release: 6 meses.

Promoción: Cada 3 meses se analiza qué componentes y desarrollos tienen una estabilidad suficiente para pasar de la versión experimental a la versión estable, generando nueva Release

ROADMAP DE PRODUCTO

FUNCIONALITY

circulo-g

Data Governance:

– Actualización Linkedin Datahub.

 

Security:
– Ranger Audit (elastic).

 

Interoperabilidad:
– GAIA X Inception
– Nifi

 

Almacenamiento:
– Ozone

 

Administración:
– Graphenus Manager:

Administración de servicios y acceso centralizado

circulo-g

Security:

– Ranger Policy Share.

Administración:

– Graphenus Manager: Centralización de logs y métricas

Machine Learning:

– Inclusión de nuevas librerías de machine learning

Interoperabilidad:

– GAIA X Ready

– Integración PowerBI & Qlik

SW Base & Infra:

– Adaptación a Rocky 8

– Kubernetes Inception

circulo-g

Administración:

– Graphenus Manager:

Configuraciones y versionado

Sandbox:

– Disponibilización Sandbox público

SW Base & Infra:

– Adaptación a Rocky 8

– Kubernetes Ready

circulo-g

Security:
– Gestión automática de principals, keytabs y certificados.

Interoperabilidad:
– Flink
– Apache Iceberg
– Cassandra

EXPERIMENTAL

2022-3T

2022-4T

2023-1T

2023-2T

ESTABLE

2022-4T

2023-1T

2023-2T

2023-3T

Logo-Graphenus-negativo
20 herramientas open source,
una solución integral

Acceso a diferentes fuentes de datos, incluso en tiempo real.

TRINO  |  SPARK  |  KAFKA

Almacenamiento distribuido de alta disponibilidad.

HDFS

Gestión de contenedores.

DOCKER SWARM

Procesamiento distribuido de datos en batch y streaming.

YARN  |  SPARK

Planificador de procesos

AIRFLOW

Representación de datos y consultas SQL.

HIVE   |  TRINO

Construye notebooks para realizar tareas de computación, ciencia de datos o machine learning.

JUPYTER NOTEBOOKS

Interfaz de usuario para interactuar con las herramientas de la distro.

HUE

Monitorización del uso y funcionamiento de todos los servicios.

CADVISOR   |  LOKI  |  PROMETHEUS   |  GRAFANA

Identificación, autentificación y autorización de usuarios.

FREEIPA   |  KERBEROS  |  KNOX  |  KEYCLOAK  |  RANGER

Gobierno del dato a lo largo de todo el ciclo de procesamiento de la información

Linkedin DataHub