cropped-FaviconGraphenus.png

Graphenus integra distintas librerías de machine learning para permitir a los equipos de data science desarrollar cualquier tipo de modelo, abstrayéndolos de la complejidad de gestión de datos distribuidos (infraestructura, configuración, procesamiento, etc).

Facilidad de uso

  • Soporte para múltiples lenguajes de programación: Java, Python, Scala, R.
  • Integración out-of-the-box con cualquier fuente de información soportada por Graphenus.
  • Abstracción de la complejidad de computación distribuida.

Elevado rendimiento y escalabilidad

  • Ejecución de los modelos y algoritmos de machine learning sobre Spark.
  • Disponibilidad de múltiples modelos optimizados.
  • Escalabilidad garantizada gracias a Graphenus y su arquitectura de contenedores.

Amplio ecosistema

  • Elevado volumen de algoritmos de ML disponible (clasificación, regresión, recomendación, clustering, etc).
  • Utilidades tipo workflow para la transformación de features, definción de pipelines, evaluación de modelos, persistencia, etc.
  • Modelos de redes neuronales, algoritmos genéticos, tensores, etc.
spark_mllib
mlflow
tensorFlow
pyTorch
pandas
scikitLearn

Graphenus cuenta con una sólida base sobre la que apoyar el desarrollo de modelos de machine learning.

Sobre la base disponible de Spark ML se añaden nuevas librerías para dotar a Graphenus de capacidades diferenciales de ML:

  • Graphenus es totalmente compatible con las principales librerías de ML: Scikit Learn, Pandas, TensorFlow, PyTorch, Mlflow y Spark MLib.

 

  • Gracias a Spark, los modelos de ML pueden ejecutarse de forma totalmente distribuida, utilizando prácticamente cualquier fuente de datos y de forma transparente para el desarrollador.
  • Federated Learning: Técnica de aprendizaje automático que permite entrenar un modelo utilizando múltiples nodos de procesamiento con su propio dataset local, sin que los datos salgan de los mismos. Es decir, permite la obtención del modelo de manera descentralizada, evitando concentrar todos los datos en una misma ubicación. Así, el flujo de datos está únicamente compuesto por los parámetros que componen el modelo, nunca por los datos locales de cada nodo, por lo que lo hace particularmente útil cuando los datos son sensible so privados.