CLOUDLESS
Plataforma de computación de información en el borde

Objetivos


El objetivo del proyecto CLOUDLESS es desarrollar una plataforma de computación en el borde (Edge) para la creación y despliegue de Espacios de Datos abiertos (International Data Spaces). La plataforma seguirá una arquitectura distribuida descentralizada que ofrezca servicios de descubrimiento e interconexión abiertos (data brokers) basados en eventos a diferentes consumidores (data consumers) y proveedores de datos (data providers). La arquitectura ofrecerá también infraestructuras seguras Cloud/Edge que permitan el análisis de datos eficiente (data connectors) en base a variables como localidad, coste económico, privacidad o latencia. La plataforma será validada en diferentes espacios de datos abiertos como la ciencia ciudadana, el turismo o los datos ómicos (genómica y metabolómica).


O1

Optimizar en el continuum

Desarrollo de un middleware de computación en el extremo que optimice de manera transparente en el continuum (Cloud/Edge)

O2

Espacios de Datos abiertos

Desarrollo de una plataforma de computación en el borde para la gestión de Espacios de Datos abiertos

O3

Plataformas heterogéneas Cloud/Edge

Validación y diseminación de resultados sobre plataformas heterogéneas Cloud/Edge incluyendo Clouds públicos, clusters privados, dispositivos IoT, y dispositivos de usuario final (browsers, móviles)

Resultados Software


Nombre Descripción Enlace
Lithops The main serverless computing framework developed and extended during the project, featuring the 'Flexecutor' scheduler and enhanced WebAssembly support. Repositorio
Lithops Applications (Benchmarks) A suite of reference applications and benchmarks (Bioinformatics, Geospatial, Metabolomics) used for KPI and performance validation. Repositorio
SpotWhisk SpotWhisk is a FaaS platform that replaces standard computational units with spot instances to achieve significant cost savings. Repositorio
Water Consumption Pipeline A serverless pipeline designed to measure and analyze water consumption across different geographic regions. Repositorio
DataPlug An open-source library for cloud data management that enables on-the-fly dynamic partitioning of unstructured and semi-structured data. Repositorio
DataCockpit A visual tool (Python widget) that enables simple and intuitive dataset partitioning through a graphical interface without writing code. Repositorio
ML-Pipeline-Optimizer Repository including the platform and results of the publication 'Intelligent Optimization of Distributed Pipeline Execution in Serverless Platforms: A Predictive Model Approach'. Repositorio
Dynamic Frequency Based Fingerprinting Attacks against Modern Sandbox Environments An attack framework that identifies cloud containers and sandboxes via CPU frequency fingerprints and proposes mitigation through noise injection. Repositorio
OpenNebula Appliances Official repository containing the appliances developed to deploy Lithops and MinIO on clusters managed by OpenNebula (K8s/LXC). Repositorio

Publicaciones


Título Enlace
Dataplug: Unlocking extreme data analytics with on-the-fly dynamic partitioning of unstructured data Abrir
Exploiting Inherent Elasticity of Serverless in Algorithms with Unbalanced and Irregular Workloads Abrir
Intelligent Optimization of Distributed Pipeline Execution in Serverless Platforms: A Predictive Model Approach Abrir
Exploring Secure and Efficient Temporary Data Sharing between co-located Kubernetes Containers Abrir
Burst Computing: Quick, Sudden, Massively Parallel Processing on Serverless Resources Abrir
Optimizing WebAssembly Garbage Collection in Go: Performance Insights, Tuning Tips, and Batch Execution Strategies Abrir
Dynamic Selection and Detection of Spreading Factors and Channels for End-Node Devices of LoRa Networks Abrir
Let It Unthread: The Good, The Bad and The Ugly within WebAssembly Portable Multithreading Abrir
The Hidden Dangers of Public Serverless Repositories: An Empirical Security Assessment Abrir
Dynamic Frequency-Based Fingerprinting Attacks against Modern Sandbox Environments Abrir
Rethinking the mobile edge for vehicular services Abrir
Energy-Efficient Task Computation at the Edge for Vehicular Services Abrir

PyRun


PyRun Logo

PyRun se define como el primer "Serverless Python Studio" del mundo, una plataforma deep-tech que actúa como un puente inteligente entre el código local y la inmensa potencia de la nube. Su importancia crítica reside en que elimina el "impuesto de complejidad": actualmente, los científicos de datos e ingenieros de IA pierden hasta el 60% de su tiempo configurando infraestructuras complejas en lugar de innovar. PyRun soluciona esto democratizando la supercomputación; permite que cualquier usuario de Python, sin conocimientos de DevOps, ejecute sus scripts en nubes como AWS o IBM con un solo clic, mientras la plataforma gestiona automáticamente todo el ciclo de vida de los servidores, garantizando que el talento técnico se centre puramente en crear valor y no en "conectar cables".

Sobre


Título del proyecto CLOUDLESS: Plataforma de computación de información en el borde
Coordinador Dr. Pedro García López (URV)
Socios Universitat Rovira i Virgili
OpenNebula
Telefónica Research
Alterna Tecnologías
Universidad de Zaragoza
Duración 01/01/2023 - 30/06/2025
Presupuesto 2.351.607,14 €
Financiación Programa UNICO I+D Cloud, en el marco del Plan de Recuperación, Transformación y Resiliencia -Financiado por la Unión Europea- Next Generation EU
Materiales de diseminación Brochure - Poster