Blockchain et DataScience dans l’énergie : un couplage gagnant ?
Article co-écrit par Sophie Germain, senior manager à Yélé consulting, Jérémy Slavik, senior manager, Filipe Afonso, manager et Abir Krifi, consultante.
Dans un contexte de transition énergétique et de révolution numérique, les métiers traditionnels des énergéticiens (production, transport, distribution, fourniture) traversent une période de turbulence.
L’arrivée massive d’énergies renouvelables distribuées (délocalisées) et l’explosion des innovations digitales (simulation – intelligence artificielle, intermédiation – plateformes de marché et suivi de consommation), perturbent les fondamentaux des marchés (prix, quantité, disponibilité) ainsi que l’organisation directe de ces filières (relation concurrentielle, relation clients).
De plus, l’environnement réglementaire évolue rapidement (LTECV ( loi relative à la transition énergétique pour la croissance verte), nouveau paquet Energie-Climat de l’UE).
Ainsi, apparaissent désormais, sur toutes les mailles de la chaîne de valeur, des nouveaux services portés par de nouveaux entrants (autoproduction, agrégation – flexibilité – stockage, conseil en eco-efficacité énergétique et courtage, etc.) ; nouveaux services qui permettent également d’interconnecter les différents marchés de l’énergie (multi fluide, power to X, …)
En conséquence, les acteurs historiques se retrouvent challengés par une « ubérisation » de leur filière, par un foisonnement de nouveaux services énergétiques dont la ressource première est la donnée.
Par exemple, Google a diminué de plus de 40% la quantité d’énergie utilisée par ses datacenters. Les ingénieurs de Moutain View ont fait appel en 2016 à Deepmind, un système d’Intelligence Artificielle (IA) dont l’algorithme alimenté par des données.
Cette IA ajuste au mieux les systèmes de refroidissement des datacenters, comme les ventilateurs à l’intérieur des serveurs mais aussi la ventilation à l’intérieur de la salle. Dans n’importe quel environnement consommateur d’énergie à grande échelle, cela constituerait une amélioration considérable.
Des entreprises technologiques telles qu’Enlightened, de la Silicon Valley, ont également aidé leurs clients à réduire leurs factures d’éclairage de 70%, grâce à leur équipement intelligent, compatible avec les principaux technologies IoT. Ici encore, la donnée traitée (raffinée) prend toute sa valeur.
« BeeBryte (start-up franco-singapourienne qui a développé un EMS de monitoring et pilotage énergétique) a publié les résultats d’une étude sur l’optimisation de l’autoconsommation collective dans un écoquartier du 19ème arrondissement de Paris. Cette étude montre à la fois la rentabilité pour l’investisseur en PV et l’optimisation de la consommation (sans stockage) grâce au foisonnement des différents usagers et les tarifs d’électricité. Le résultat de l’étude annonce 98% d’autoconsommation et 2% d’autoproduction, avec un TRI** (Taux de Rentabilité Interne) de 5% pour l’investisseur». (Source M. Douteau- Yélé)
En prenant en compte les prévisions météorologiques, l’activité des bâtiments ainsi que le prix de l’électricité, BeeBryte anticipe la production PV et la demande thermique des sites pour produire le froid/chaud au meilleur moment en respectant le confort et la plage de fonctionnement déterminée par les usagers.
L’utilisation de la donnée est une des clés de la transition énergétique. La réussite de ces projets repose sur la capacité des acteurs à extraire des données brutes de qualité, issues de sources multiples et hétérogènes, à les stocker de manière sécurisée et à les raffiner dans le but d’alimenter leurs nouveaux services énergétiques.
Or on note aujourd’hui un double phénomène. Le secteur de l’énergie connait des progrès continus dans la collecte de grandes quantités de données mais les efforts pour les rendre accessibles ou exploitables doivent être décuplés.
En outre, la CRE, qui régule les marchés de l’électricité et du gaz, incite à la publication et la sécurisation des données. Depuis 2015, des textes de nature législative sont intervenus en matière de gestion et de mise à disposition des données collectées par les gestionnaires de réseaux d’énergie.
Accroissement de la quantité de données
La récupération des données se fait à une maille spatiale et temporelle de plus en plus fine afin de répondre aux différents enjeux du réseau d’électricité. Les nouveaux compteurs Linky relèvent une mesure de consommation, pour chaque foyer équipé, à un pas de temps de 30 minutes pouvant descendre jusqu’à 10 minutes.
Selon la CRE***, cela devrait conduire Enedis à collecter, dans les cinq années qui viennent, 5 000 fois plus de données qu’aujourd’hui. Aussi, GRTgaz indique dans son rapport d’activité et de développement durable qu’elle collecte chaque jour 28 millions de données sur son réseau de transport.
(***)Rapport du comité d’études relatif aux données dont disposent les gestionnaires de réseaux et d’infrastructures d’énergie, 18 mai 2017
Les données nécessitent d’être nettoyées ou enrichies avant d’être traitées
Cet important volume de données n’est souvent pas exploitable en l’état. Par exemple, certaines données collectées au niveau du réseau électrique via des capteurs connectés peuvent être issues d’erreurs de mesures, de coupures ou de reconfigurations.
D’autre part, les données issues d’une seule base de donnée nécessitent souvent d’être enrichies par le biais de jointures avec d’autres bases apportant des variables nécessaires à l’analyse.
Des données protégées par le RGPD
D’autre part, les données personnelles doivent être traitées conformément au consentement express accordé par les consommateurs. Les acteurs de la transition énergétique ont ainsi un enjeu majeur de prouver leur capacité à maîtriser et protéger les données des utilisateurs afin d’induire le climat de confiance nécessaire pour actionner les leviers du big data.
Des données cloisonnées ou dégradées
Enfin, les données peuvent se trouver cloisonnées entre acteurs du secteur de l’énergie ou au sein d’une même entreprise.
À travers la loi pour une République Numérique, promulguée le 8 octobre 2016, les gestionnaires de réseaux publics de distribution de gaz et d’électricité ont l’obligation de mettre à disposition des données détaillées de consommation et de production issues de leur système de comptage d’énergie, dans l’objectif de favoriser notamment le développement d’offres d’énergie, d’usages et de services énergétiques, ce sont les services d’open data.
Ces données sont cependant agrégées selon des modalités convenues avec la CNIL, et parfois difficilement exploitables par manque de granularité.
Les réponses données par la data science
Le nettoyage et l’enrichissement des données brutes peuvent facilement représenter plus de 70% de la durée d’un projet autour de la Data.
Des outils en data science, comme les très à la mode R et Python, permettent de gagner énormément de temps sur ces phases. En plus d’avoir l’avantage considérable d’être Open Source, ils se montrent particulièrement adaptés à la manipulation, l’exploration et la visualisation de données avec des bibliothèques conçues spécifiquement pour ces tâches permettant un lancement rapide des analyses.
Ces outils rendent en outre possible l’intégration et l’analyse de toutes les données qu’elles soient hétérogènes, parsemées ou très volumineuses (Big Data).
Des outils comme Spark notamment permettent des passages à l’échelle en exploitant de manière très efficace les capacités du cloud computing (données stockées sur plusieurs ordinateurs). Les possibilités actuelles s’étendent même jusqu’à l’exploitation du Big Data en temps réel (Spark Streaming).
Il est ainsi plus facile de nettoyer les données de consommation énergétiques et de les croiser à d’autres sources telles que la météo, les données Insee, la description des infrastructures existantes, les historiques de maintenance.
Les réponses apportées par la Blockchain pour instaurer un climat de confiance sur le traitement de la donnée.
Si les data sciences apportent des réponses pour nettoyer et enrichir les données, les technologies blockchain ont les caractéristiques permettant de protéger les données personnelles à disposition des organismes collecteurs.
La blockchain permet de contrôler les accès aux données avec transparence
La blockchain permet tout d’abord via des infrastructures distribuées de gestion des accès (distributed access control) une ouverture aux données beaucoup plus flexible, sécurisée et sous contrôle direct des consommateurs qui peuvent par exemple rendre accessible la totalité de leurs données de comptage au GRD pour la facturation, et une partie seulement à un prestataire choisi pour des services d’efficacité énergétique ou à un agrégateur pour des services d’effacement.
La blockchain permet de certifier les traitements effectués
L’intérêt des technologies blockchain ne se limite pas au contrôle des accès, mais s’étend également au contrôle des traitements effectués sur les données. Ceci est directement lié à l’obligation de « responsabilité » introduite par le RGPD : ainsi, les organisations doivent être en mesure de démontrer à tout moment, qu’elles effectuent les traitements de données conformément au consentement recueilli et à l’ensemble des obligations réglementaires.
Cette obligation, vécue comme un progrès par les consommateurs qui n’avaient jusque-là aucune possibilité de vérifier que leurs données n’ont pas été transmises à un tiers ou utilisées pour d’autres motifs, se révèle être un casse-tête pour beaucoup d’organismes
Des solutions blockchain à des coûts compétitifs face aux systèmes classiques
Des solutions classiques d’audit trail basées sur des architectures centralisées existent bien, mais plus elles sont sécurisées, plus elles sont coûteuses (lorsqu’elles sont par exemple couplées à des coffre-forts électroniques) et requièrent la mise en place de processus de validation chronophages.
Dans le cadre de solutions déployées sur une architecture blockchain en revanche ces processus sont automatisés grâce aux smart contrats (protocoles qui permettent d’automatiser l’exécution d’actions -transfert de valeur, envoi d’information, opération, etc.- sous certaines conditions préalablement définies), et la blockchain présente les attraits supplémentaires d’un coût maîtrisé et d’une traçabilité inaltérable des traitements effectués sur les données sensibles.
Une réponse aux données cloisonnées
L’intérêt de ce type d’architecture est en outre de pouvoir maintenir un stockage local des données (au niveau de la base de donnée de l’organisme collecteur par exemple) et de permettre un traitement qui sera également exécuté localement, gage supplémentaire de confiance pour le consommateur : les données n’ont plus à être transmises aux différents acteurs de la chaine de traitement pour être utilisées.
Ces architectures distribuées basées sur la blockchain permettent de surcroît de décloisonner des informations jusque-là contenues dans des silos, aussi bien en interne qu’en externe, et de traiter dans leur lieu de stockage des données provenant de multiples banques de données auxquelles les propriétaires ont autorisé un accès sélectif, ouvrant donc leur potentiel à des applications de type deep learning.
La blockchain peut ainsi participer à instaurer un climat de confiance dans le cadre du déploiement de services de la transition énergétique très dépendants de l’accès aux données. Elle peut également contribuer à décloisonner des données traditionnellement maintenues dans des silos.
Cette technologie associée à celles des Data Science apporte des réponses pour concrétiser l’utilisation des données collectées massivement dans le secteur de l’énergie.
Crédit photo : Freepik et Mélanie Ferreira
COMMENTAIRES