février 2016

Comprendre les données volumineuses

Par Sean Dessureault

Sean Dessureault

L'intérêt porté aux données volumineuses n'a cessé de croître ces dernières années, particulièrement en ce qui concerne la valeur de l'application de l'analytique avancée à la quantité massive de données que produisent les opérations de nos jours. Cet intérêt émane du nombre croissant de technologies de contrôle de l'équipement que proposent de nombreux fournisseurs, chacune étant dotée de sa propre structure de base de données personnalisée, de serveurs pouvant héberger les données et de systèmes de notification. Dans le contexte de l'industrie minière, ce développement s'est traduit par un nombre croissant d'exploitations possédant de grandes quantités de données sous la forme de centres de stockage des données, notamment sur l'état des machines et les ordres d'exécution, qui pourraient générer de nouvelles approches de gestion de la production, révéler de nouvelles ressources et réduire les risques en termes de sécurité et d'environnement. Mais avant de pouvoir intégrer des systèmes de surveillance disparates et de se lancer à la poursuite de l'analytique des données massives, il faut bien comprendre l'état et le type de données les plus pertinentes au regard de l'analytique utilisée dans les mines.

Données relationnelles

Les données de surveillance de l'équipement mobile proviennent d'une part, des informations fournies par l'opérateur à l'aide de l'écran tactile installé dans sa cabine et d'autre part, des systèmes embarqués qui contrôlent automatiquement les paramètres importants tels que l'emplacement et l'état d'une machine. Ces données sont ensuite transmises à un serveur sur le site, dans lequel elles sont stockées en vue d'une analyse ultérieure dans une base de données relationnelles. D'autres logiciels, tels que des systèmes d'entreprise ou des systèmes de gestion de la maintenance informatique, sont dotés de bases de données relationnelles secondaires qui traitent les transactions telles que les paiements ou les demandes et le traitement d'ordres d'exécution.

Les bases de données relationnelles s'appuient sur des tableurs ayant des relations interconnectées. Par exemple, les données relatives au transport par camion sont transcrites dans un tableur qui établit la liste des cycles des camions, à savoir quelle pelle a chargé tel ou tel camion, l'heure à laquelle le chargement a eu lieu et la durée du transport. Un utilisateur peut souhaiter générer des rapports qui énumèrent la production en fonction du type de pelle utilisée. Ces informations concernant la pelle sont reportées dans un tableau connexe avec lequel une relation existe, d'où l'expression base de données relationnelles.

Les données ad hoc exportées d'un système de planification des mines ou de tableurs électroniques qui contiennent des données sur la sécurité peuvent aussi être vaguement considérées comme relationnelles, dans le sens où l'on trouve des détails de certaines colonnes dans d'autres tableurs.

Données de procédé

Par données de procédé, on entend généralement les données analogiques et de contrôle recueillies dans des usines de traitement. Ces usines sont instrumentées et automatisées à tel point que, souvent, un seul opérateur est en mesure de manipuler la plupart des paramètres dans l'usine afin de s'adapter aux conditions ou de modifier les résultats du procédé.

Plusieurs techniques permettent d'extraire efficacement et en toute sécurité les données de ces systèmes de contrôle des procédés. Le mécanisme le plus courant consiste à s'appuyer sur un logiciel connu sous le nom de système d'historisation des données qui numérise le réseau de contrôle, enregistre les valeurs analogiques et définit les points pour référence ultérieure. Ces systèmes d'historisation sont dotés d'algorithmes très performants qui compressent les signaux analogiques pour une transmission simple des données analogiques. Récemment, cette technologie a servi à consigner les données analogiques relatives à l'équipement mobile, par exemple la température des gaz d'échappement des moteurs. Si l'on compresse ces informations, elles peuvent être transmises par le biais d'un réseau sans fil de manière à ce qu'un technicien préposé à l'entretien puisse surveiller la machine comme s'il s'agissait d'une petite usine. De nouvelles fonctions ajoutées à certains systèmes d'historisation permettent en outre de détecter automatiquement certains événements (par exemple, le commencement et la fin d'une période de pondération nulle sur un transporteur à courroie) par le biais d'algorithmes de reconnaissance de formes.

Données non structurées

Les données non structurées sont des informations, fichiers texte ou média y compris, qui ne s'intègrent pas bien dans une base de données structurées, comme celles décrites ci-dessus, et dont les technologies sous-jacentes sont des langages et approches basés sur le Web ou des technologies mobiles tels que les structures de notation des objets du langage Java (JSON) ou de documents. De nos jours, les programmeurs informatiques changent si souvent les éléments de données que les programmeurs spécialisés dans la modélisation des données relationnelles ne sont plus en mesure de perpétuellement modifier la structure de la base de données pour s'adapter à ces changements. Les fichiers texte et média lourds sont également stockés dans ce format non structuré, sans qu'il n'existe de plan d'action immédiat. Ainsi, les bases de données doivent pouvoir gérer toutes ces données non structurées. Le volume de données devant être stockées et traitées est si important qu'un monoprocesseur ne peut répondre à la demande. La technologie s'appuie donc sur un ensemble de développements technologiques relativement récents, tels que MapReduce, un mécanisme dans lequel un vaste ensemble de données peut être simplifié puis traité par l'intermédiaire d'algorithmes en distribuant les calculs (ce qui permet de réduire leur complexité) dans plusieurs processeurs au sein d'une série de serveurs « organisés ».

Bien que l'industrie minière ne dispose pas de beaucoup de données non structurées à l'heure actuelle, ces dernières représentent indéniablement l'avenir pour de nombreuses applications. Nombre des outils analytiques en cours de développement reposent sur cette forme flexible de structure de données. La prochaine génération de technologies de contrôle de l'équipement sera développée sur des plateformes flexibles à bas prix telles que des tablettes, et reposera sur des capteurs peu coûteux adaptés à l'Internet des objets (IdO), lesquels utilisent tous deux énormément les données non structurées.

La plupart de nos données actuelles relatives à l'exploitation minière et aux coûts se présentent cependant dans un format relationnel, et nos données de traitement sont stockées dans des bases de données semi-structurées et souvent seulement partiellement contextualisées dans des systèmes d'historisation. Toutefois, le potentiel inexploité de nos structures de données existantes aujourd'hui est énorme. Le traitement du signal des données analogiques et l'extraction des données relationnelles sont techniquement à notre portée à l'heure actuelle. Nous pouvons immédiatement adopter une approche honnête et pratique à l'intégration à l'aide des techniques actuelles dans un environnement relationnel et de traitement, en attendant le déploiement de la prochaine génération de technologies et la modernisation de nos procédures de travail pour pouvoir profiter de ces nouvelles capacités.

Sean Dessureault est le président et chef de la direction de Mining Information Systems and Operations Management (MISOM) Technologies.
Vous souhaitez nous donner votre avis sur cet article ? Envoyez vos commentaires à editor@cim.org.

Traduit par Karen Rolland


Retour à la table des matières | Article de fond : la technologie prêt-à-porter | Section technologie | Profil de projet : La mine CaribouÀ la une : Cuivre

Publier un commentaire

Commentaires

Version PDF