L’open data pour développer mon entreprise ou mon association
cONTEXTE
Jeudi 20 mai 2021 a eu lieu un atelier de 3h intitulé « L’open data pour développer mon entreprise ou mon association ? ». Organisé dans le cadre du projet européen Interreg Alpine Space DEAS dédié à la valorisation de l’open data dans les domaines de l’environnement, de la mobilité et du tourisme.
TUBÀ s’est associé à l’Agence d’Innovation et de Prospection Internationale du Grand Est, Grand E-nov ainsi qu’à son partenaire local l’ADERLY dans son organisation.
Ce temps animé par la coopérative Datactivist a réuni près de 30 personnes.
L’objectif proposé était de découvrir le potentiel des données numériques ouvertes pour piloter ou développer les activités d’une structure. L’atelier s’est organisé en trois temps :
- Les données, le big data, l’open data, de quoi parle-t-on ?
- Comment utiliser les données ouvertes au profit de mon entreprise, mon association ?
- Data training : manipuler l’open data pour créer son application de recherche de financement
Les données, le big data, l’open data, de quoi parle-t-on ?
La première partie, dressant un état des lieux de la donnée, a permis de contextualiser leur essor, d’en connaitre l’historique et d’évoquer les enjeux associés. Un premier constat peut être celui de la pluralité des termes que recouvre le mot « data » : du latin dare – donner – et du singulier datum soit ce qui est évident, ce qui va de soi, ce qui est accepté sans discussion. Son sens moderne aurait d’ailleurs été dévoilé au 18e siècle à l’occasion des premiers recensements de population demandés dans le contexte des grandes épidémies de peste en Europe. Par la suite, le monde se serait « nombrifié » voir « mis en donnée » en se concentrant de manière exponentielle sur des représentations numérales. On serait donc passé du verbe, (présent dans les décrets et lois) aux nombres présents dans les jeux de données, ce qui impliquerait un changement de la société. Dans un même temps, la définition de la donnée s’est affinée. La classification pyramidale de Russel Ackoff en 1989 permet de préciser que la donnée constitue des faits, des signaux et stimuli. Cette typologie montre le pouvoir croissant que peut avoir la data, passant de la donnée brute, à l’information et enfin à la connaissance.
Rob Kitchin complète cette définition avec la notion des « building blocks » – blocs en construction – constitués par la donnée « brute », créant ainsi l’ensemble de l’information et de la connaissance.
La notion de « donnée brute », très récente, semble être assez controversée puisque perçue comme paradoxale. En effet, l’idée même que la donnée puisse ne pas être interprétée semble caduque pour certains théoriciens puisque de fait, une donnée devrait permettre d’interpréter quelque chose. Lisa Gitelman a d’ailleurs écrit un ouvrage intitulé « Raw Data is an oxymoron » démontrant que la donnée, de facto, est toujours « cuisinée » et jamais « crue ».
Comment utiliser les données ouvertes au profit de mon entreprise, mon association ?
Ensuite, les différents types de données existants ont été présentés, différenciant ainsi logiquement les données qualitatives des données quantitatives. Différents exemples de données ont été évoqués telles que les données structurées, semi-structurées, non structurées, échappées, capturées, transitoires, dérivées, crowdsourcées… Cette seconde partie s’est ensuite concentrée sur l’explication et la définition du big data et des données ouvertes.
BIG DATA
Après cette définition, la question de l’utilisation des données ouvertes a été abordée : Quelles bases de données ? Quels usages ? Quels services ?
En premier lieu, a été présenté l’importance d’utiliser des données ouvertes en tant que :
- Matière première : pour la revendre (installation de capteurs etc)
- Levier : pour réduire ses coûts ou développer ses revenus
- Actif stratégique : pour développer une nouvelle offre de service par exemple.
Sans oublier de mentionner les risques et déviances qui peuvent découler des données ouvertes. C’est notamment le cas avec les data brokers qui monétisent les données personnelles faisant de la vie privée un marché fructueux.
Data training : manipuler l’open data pour créer son application de recherche de financement
Pour finir, cette formation s’est conclue sur la démonstration d’un cas d’usage concret réalisé spécialement pour ce temps d’échange. Pour l’occasion une application visant à optimiser la recherche de financement publics en utilisant l’open data a été présentée et reproduite. Deux jeux de données libres ont été nécessaires, ainsi que plusieurs outils :
- Glide : Outil gratuit de création d’application à partir d’un ou plusieurs jeux de données
- Workbench Data : Outil gratuit de manipulation de données
- Air Table : Logiciel d’utilisation et de partage de données