Características y herramientas

ARQUITECTURA FUNCIONAL

Gestión y control end-to-end de los datos: desde la gestión y monitorización de la infraestructura hasta el almacenamiento, el análisis y el gobierno de los datos.

  • Almacenamiento distribuido de alta disponibilidad.

  • Procesamiento distribuido de datos en batch y streaming.

  • Representación de datos y consultas SQL.

  • Construcción de notebooks para realizar tareas de computación, ciencia de datos o machine learning.

  • Acceso a diferentes fuentes de datos, incluso en tiempo real.

  • Interfaz de usuario para interactuar con las herramientas de la distribución.
  • Planificación de procesos.

 

  • Monitorización del uso y funcionamiento de los servicios.

 

  • Capa de seguridad para la protección del acceso a los datos en función de su sensibilidad, la gestión de la autenticación y la autorización.

 

  • Gobierno del dato a lo largo de todo el ciclo de procesamiento de la información.

 

  • Visualización de datos.

ARQUITECTURA FUNCIONAL

Roadmap

y actualizaciones

Dos líneas evolutivas, varias releases anuales

La política de releases de Graphenus reduce el riesgo de obsolescencia tecnológica, incorporando de forma continua nuevas capacidades.

vaso_precipitado

Experimental

  • Nuevos desarrollos

 

  • Nuevas versiones de los componentes

 

  • Pruebas de concepto

 

  • Equipo propio buscando posibles funcionalidades o nuevas herramientas

 

  • Periodo de release: 3 meses
bandera

Estable

  • Software totalmente estable

 

  • Promocionado desde la versión experimental

 

  • Perfectamente integrado con el resto de los componentes

 

  • Periodo de release: 6 meses.

Promoción: Cada 3 meses se analiza qué componentes y desarrollos tienen una estabilidad suficiente para pasar de la versión experimental a la versión estable, generando nueva Release.

ROADMAP DE PRODUCTO

FUNCIONALITY

circulo-g

Administración:

– Graphenus Manager:
Accesos


Interoperabilidad:
– Data Virtualization
– Integración PowerBI & Qlik

 

SW Base & Infra:
Adaptación a Rocky 8

 

Visualization:
Apache SuperSet

circulo-g

Interoperabilidad:

Apache Iceberg

 

Interoperabilidad:

– GAIA X Inception

 

BBDDs:

– Cassandra

– HBase

 

SW Base & Infra:

– Graphenus Lite en Kubernetes

circulo-g

Machine Learning:

– OCR

 

Administración:

– Graphenus Manager:

Administración de los servicios y recursos

 

Sandbox:

– Sandbox

 

Administración:

– Graphenus Manager:

   Monitorización y logs

circulo-g

Administración:
– Graphenus Manager: configuraciones y versionado

 

SW Base & Infra:
– Kubernetes

 

Security:
– Ranger Policy Share

 

Machine Learning:
– Federated Learning

EXPERIMENTAL

2024-4T

2023-1T

2023-2T

2023-3T

ESTABLE

2023-1T

2023-2T

2023-3T

2023-4T

Logo-Graphenus-negativo
Más de 20 herramientas open source, una solución integral

Acceso a diferentes fuentes de datos, incluso en tiempo real.

TRINO  |  SPARK  |  KAFKA

Almacenamiento distribuido de alta disponibilidad.

HDFS

Gestión de contenedores.

DOCKER SWARM

Procesamiento distribuido de datos en batch y streaming.

YARN  |  SPARK

Planificación de procesos.

AIRFLOW

Representación de datos y consultas SQL.

HIVE   |  TRINO

Construye notebooks para realizar tareas de computación, ciencia de datos o machine learning.

JUPYTER NOTEBOOKS

Interfaz de usuario para interactuar con las herramientas de la distribución.

HUE

Monitorización del uso y funcionamiento de todos los servicios.

CADVISOR   |  LOKI  |  PROMETHEUS   |  GRAFANA

Identificación, autentificación y autorización de usuarios.

FREEIPA   |  KERBEROS  |  KNOX  |  KEYCLOAK  |  RANGER

Gobierno del dato a lo largo de todo el ciclo de procesamiento de la información

DataHub

Visualización de los datos.

SUPERSET