CLOUDLESS

Objetivos

El objetivo del proyecto CLOUDLESS es desarrollar una plataforma de computación en el borde (Edge) para la creación y despliegue de Espacios de Datos abiertos (International Data Spaces). La plataforma seguirá una arquitectura distribuida descentralizada que ofrezca servicios de descubrimiento e interconexión abiertos (data brokers) basados en eventos a diferentes consumidores (data consumers) y proveedores de datos (data providers). La arquitectura ofrecerá también infraestructuras seguras Cloud/Edge que permitan el análisis de datos eficiente (data connectors) en base a variables como localidad, coste económico, privacidad o latencia. La plataforma será validada en diferentes espacios de datos abiertos como la ciencia ciudadana, el turismo o los datos ómicos (genómica y metabolómica).

Optimizar en el continuum

Desarrollo de un middleware de computación en el extremo que optimice de manera transparente en el continuum (Cloud/Edge)

Espacios de Datos abiertos

Desarrollo de una plataforma de computación en el borde para la gestión de Espacios de Datos abiertos

Plataformas heterogéneas Cloud/Edge

Validación y diseminación de resultados sobre plataformas heterogéneas Cloud/Edge incluyendo Clouds públicos, clusters privados, dispositivos IoT, y dispositivos de usuario final (browsers, móviles)

Resultados Software

Nombre	Descripción	Enlace
Lithops	The main serverless computing framework developed and extended during the project, featuring the 'Flexecutor' scheduler and enhanced WebAssembly support.	Repositorio
Lithops Applications (Benchmarks)	A suite of reference applications and benchmarks (Bioinformatics, Geospatial, Metabolomics) used for KPI and performance validation.	Repositorio
SpotWhisk	SpotWhisk is a FaaS platform that replaces standard computational units with spot instances to achieve significant cost savings.	Repositorio
Water Consumption Pipeline	A serverless pipeline designed to measure and analyze water consumption across different geographic regions.	Repositorio
DataPlug	An open-source library for cloud data management that enables on-the-fly dynamic partitioning of unstructured and semi-structured data.	Repositorio
DataCockpit	A visual tool (Python widget) that enables simple and intuitive dataset partitioning through a graphical interface without writing code.	Repositorio
ML-Pipeline-Optimizer	Repository including the platform and results of the publication 'Intelligent Optimization of Distributed Pipeline Execution in Serverless Platforms: A Predictive Model Approach'.	Repositorio
Dynamic Frequency Based Fingerprinting Attacks against Modern Sandbox Environments	An attack framework that identifies cloud containers and sandboxes via CPU frequency fingerprints and proposes mitigation through noise injection.	Repositorio
OpenNebula Appliances	Official repository containing the appliances developed to deploy Lithops and MinIO on clusters managed by OpenNebula (K8s/LXC).	Repositorio

Publicaciones

Título	Enlace
Dataplug: Unlocking extreme data analytics with on-the-fly dynamic partitioning of unstructured data	Abrir
Exploiting Inherent Elasticity of Serverless in Algorithms with Unbalanced and Irregular Workloads	Abrir
Intelligent Optimization of Distributed Pipeline Execution in Serverless Platforms: A Predictive Model Approach	Abrir
Exploring Secure and Efficient Temporary Data Sharing between co-located Kubernetes Containers	Abrir
Burst Computing: Quick, Sudden, Massively Parallel Processing on Serverless Resources	Abrir
Optimizing WebAssembly Garbage Collection in Go: Performance Insights, Tuning Tips, and Batch Execution Strategies	Abrir
Dynamic Selection and Detection of Spreading Factors and Channels for End-Node Devices of LoRa Networks	Abrir
Let It Unthread: The Good, The Bad and The Ugly within WebAssembly Portable Multithreading	Abrir
The Hidden Dangers of Public Serverless Repositories: An Empirical Security Assessment	Abrir
Dynamic Frequency-Based Fingerprinting Attacks against Modern Sandbox Environments	Abrir
Rethinking the mobile edge for vehicular services	Abrir
Energy-Efficient Task Computation at the Edge for Vehicular Services	Abrir

PyRun

PyRun se define como el primer "Serverless Python Studio" del mundo, una plataforma deep-tech que actúa como un puente inteligente entre el código local y la inmensa potencia de la nube. Su importancia crítica reside en que elimina el "impuesto de complejidad": actualmente, los científicos de datos e ingenieros de IA pierden hasta el 60% de su tiempo configurando infraestructuras complejas en lugar de innovar. PyRun soluciona esto democratizando la supercomputación; permite que cualquier usuario de Python, sin conocimientos de DevOps, ejecute sus scripts en nubes como AWS o IBM con un solo clic, mientras la plataforma gestiona automáticamente todo el ciclo de vida de los servidores, garantizando que el talento técnico se centre puramente en crear valor y no en "conectar cables".

Visitar PyRun

Sobre

Título del proyecto	CLOUDLESS: Plataforma de computación de información en el borde
Coordinador	Dr. Pedro García López (URV)
Socios	Universitat Rovira i Virgili OpenNebula Telefónica Research Alterna Tecnologías Universidad de Zaragoza
Duración	01/01/2023 - 30/06/2025
Presupuesto	2.351.607,14 €
Financiación	Programa UNICO I+D Cloud, en el marco del Plan de Recuperación, Transformación y Resiliencia -Financiado por la Unión Europea- Next Generation EU
Materiales de diseminación	Brochure - Poster