Selon une étude de McKinsey, le marché de la donnée collectée par les voitures connectées et autonomes représentera 750 milliards de dollars (670 milliards d’euros) en 2030. Gartner, quant à lui, annonce 250 millions de véhicules connectés en circulation d’ici 2020. Si l’on considère qu’une voiture connectée génère en moyenne 10 à 20 téraoctets de données brutes par heure de roulage (issues de caméras et de radars essentiellement), on peut imaginer la quantité colossale de données que les constructeurs devront traiter dans un futur proche. Par « traiter » les données, on entend à la fois les collecter, les envoyer dans un datacenter, générer des métadonnées et faire en sorte que ces données soient exploitables par de l’intelligence artificielle.

Transformer l’expérience en information programmable

Ne perdons pas de vue que les principaux enjeux du véhicule connecté se situent en dehors du véhicule, dans le traitement des données qu’il génère. Prenons l’exemple d’un véhicule autonome qui doit être capable de reconnaître un piéton dans de multiples situations, en temps réel…

Il est techniquement impossible de programmer le véhicule pour tous les cas de figure. En revanche, l’exploitation des données issues des capteurs et de caméras permet de transformer l’expérience en information programmable : par l’observation des autres conducteurs, le véhicule apprend à changer de file ou à interpréter les mouvements.

Pour parvenir à ce résultat, d’énormes volumes de données sont transférés soit dans un datacenter soit dans le cloud pour alimenter les réseaux neuronaux et créer ainsi les règles d’inférence nécessaires à la création de l’IA. Pendant la phase d’apprentissage, le réseau neuronal brasse des quantités d’images de piétons qui traversent dans toutes les conditions météorologiques, sous tous les angles. Les résultats sont exploités et intégrés à l’IA. Dans le véhicule autonome, un calculateur utilise le réseau neuronal « entraîné » pour identifier le piéton qui traverse, quelle que soit la situation, la météo ou la configuration du lieu.  Seul le résultat de la phase d’apprentissage est exploité.

Stockage et standardisation du traitement de la donnée : les enjeux de demain 

Tout projet de véhicule autonome nécessite donc de transporter de la donnée depuis un périphérique via des datacenters ou vers le cloud, afin de fournir de la puissance de calcul. Ces mécanismes de transport et de traitement de la donnée sont à la base du véhicule autonome mais sont également déterminants pour un large spectre d’applications : classification d’images radiographiques pour le dépistage du cancer, détection du ton et du niveau de la voix pour anticiper les comportements clients dans les centres d’appel, personnalisation des offres en temps réel, détection des menaces à partir de la simple écoute du réseau, etc.

À l’heure actuelle, chaque constructeur de voiture connectée et autonome développe sa propre technologie de captation et de traitement de la donnée. A long terme, cette situation risque de poser des problèmes de communication entre les différents véhicules. Pour que le modèle de la voiture autonome soit viable, un principe unique et standardisé de collecte et d’exploitation de la donnée devra émerger.

Par ailleurs, l’approche à adopter en termes de stockage sera cruciale au regard des volumes colossaux de données en jeu. Certaines solutions flexibles semblent sortir du lot, comme les systèmes de stockage multiniveau, qui consistent à transférer les données vers le niveau de stockage le mieux adapté aux besoins en matière d’accès.