L’OPEN
DATA

L’OPEN DATA

Data

Aujourd’hui, la France est sur le podium des nations les plus engagées dans une politique d’ouverture de leurs données publiques. Elle se classe ainsi au 2ème rang mondial de l’open data, derrière la Corée du Sud.

À l’heure de la transformation digitale et du data management, pourquoi est-il si important d’ouvrir les données ? Cet accès aux données publiques est-il un idéal ou constitue-t-il une véritable valeur ajoutée ? Pourquoi et comment intégrer ces données disponibles gratuitement au système d’information d’une entreprise ?

Découvrez comment exploiter l’open data

L’open data

L’Open Knowledge Foundation définit l’open data comme des données ouvertes dont l’accès est public et libre de droit.
Ces données exploitables par tous doivent respecter 3 critères essentiels :

• La disponibilité
Ce sont des données numériques en libre accès, téléchargeables depuis internet. Elles sont légalement et techniquement ouvertes. Elles doivent donc être accessibles de tous, n’importe quand et sans charges financières.
• La réutilisation et la redistribution
Il doit notamment être possible de croiser ces données avec d’autres ensembles de données, de les réutiliser et de les redistribuer.
• La participation universelle
Tout le monde doit pouvoir accéder à ces données, les utiliser et les partager sans aucunes restrictions.

Ces 3 aspects constituent le socle de l’open data. Si le big data se détermine par son ampleur, l’open data se définit quant à elle par l’interopérabilité. Ce terme désigne la capacité de différentes entreprises ou systèmes à travailler ensemble. En l’occurrence, l’interopérabilité est la capacité de mélanger différents jeux de données grâce à des langages de programmation communs ou un élément programmatique intermédiaire1.

1https://www.lebigdata.fr/open-data-definition

Open data VS open source

L’un concerne, les données, l’autre les applications et logiciels, mais tous deux répondent à un principe d’ouverture, de diffusion et de réutilisation.
Ainsi les logiciels open source, ou logiciels libres, sont distribués sous des licences open source, ou licences libres. Il existe différentes licences open source : licence GPL, licence BSD… Parmi elles, le copyleft, en référence au droit d’auteur, ou copyright, est l’autorisation donnée par l’auteur du programme informatique « d’utiliser, d’étudier, de modifier et de diffuser son œuvre »2.

Le code source d’un logiciel disponible sous licence open source est ainsi « ouvert » c’est-à-dire qu’il est mis à la disposition de tous et qu’il peut être modifié et partagé.
Tout comme pour l’open data, un logiciel open source doit répondre à divers critères essentiels : l’utilisation, la modification, la distribution et la publication de versions modifiées. L’open source s’appuie ainsi sur une démarche collaborative pour renforcer l’intérêt, la pérennité et la sécurité des solutions informatiques.

2https://www.appvizer.fr/magazine/services-informatiques/gestion-licences/licence-open-source#qu-est-ce-qu-une-licence-open-source

Si l’open data provient principalement du gouvernement et du secteur public, tout le monde peut mettre à disposition des données ouvertes : entreprises, startups, universités… et même citoyens ! Ces données sont généralement des données géographiques, des statistiques, des budgets, des résultats de recherches scientifiques, des données de santé… Ce sont toutes des données non personnelles ou anonymisées afin de respecter la vie privée des utilisateurs. L’open data peut donc provenir de n’importe quel secteur, de n’importe quelle source et peut concerner n’importe quel sujet !
En France, c’est la mission Etalab, lancée en 2011, qui coordonne la politique d’ouverture des données publiques . Une de ses missions est notamment de faciliter la réutilisation des informations publiques3. Etalab est également à l’initiative de la plateforme open data data.gouv.fr. Ce portail de données ouvertes se destine à rassembler et à rendre accessible l’ensemble des données publiques de l’Etat, de ses établissements publics, des collectivités et des personnes chargées d’une mission de service public.

En 2019, www.data.gouv.fr enregistre
50 millions de pages visitées,
soit une augmentation
de 43% par rapport à 20184.

Pour un gouvernement, l’ouverture des données publiques permet de rendre compte de l’action publique, de dynamiser l’activité sur le territoire en développant notamment de nouveaux services et de renforcer voire de personnaliser le lien entre citoyen et collectivité. Cependant, si la France a fait des progrès en termes de formation et d’accompagnement des administrations dans leurs démarches d’open data, ces dernières manquent de moyens pour ouvrir correctement leurs données : problème d’infrastructure, coût humain5… Ainsi en 2020, seulement 12 % des communes ayant l’obligation d’ouvrir leurs données, l’ont fait6.

Les gouvernements et organismes publics ne sont pas les seuls à pouvoir bénéficier de l’open data. Les entreprises peuvent également trouver de l’intérêt à la réutilisation des données ouvertes voire même à l’ouverture de leurs données.

3https://www.etalab.gouv.fr/qui-sommes-nous
4https://www.data.gouv.fr/fr/posts/retour-sur-les-activites-de-data-gouv-fr-en-2019/
5https://www.lemonde.fr/blog/data/2018/09/24/la-difficile-marche-des-collectivites-locales-vers-l-open-data/#:~:text=Les%20communes%20ont%20l’obligation,%C2%AB%20nettoyer%20%C2%BB%20et%20les%20uniformiser.
6http://www.opendatafrance.net/2020/02/04/la-quinzaine-des-donnees-ouvertes-190-opendata/

Les données libres comme leviers stratégiques

Réutiliser les données mises à disposition par le secteur public peut présenter de nombreux avantages pour le secteur privé. D’ailleurs certaines entreprises exploitent déjà ces données sous la forme d’application, de service ou d’analyse.

L’open data pour …

INNOVER

L’open data est sans aucun doute un levier d’innovation. La libération des données a conduit les entreprises à disposer de nouvelles informations. Ces volumes de données et cette diversité ont ouvert de nouvelles perspectives.
Ainsi, la start-up City Mapper, aujourd’hui leader sur le marché des calculateurs d’itinéraires, n’existerait pas sans l’open data. 80% des données exploitées par l’application sont des données ouvertes. C’est la combinaison des données publiques de plusieurs modes de transport qui permet à l’application de calculer en temps réel les itinéraires des usagers.

renforcer l’expérience client

L’open data enrichit les bases de données clients. Si aujourd’hui, avec notamment le big data, les entreprises collectent de plus en plus d’informations via à leur site e-commerce, les objets connectés, les réseaux sociaux… il est parfois difficile de bien qualifier ses clients et ses contacts.
Croiser ces informations avec, par exemple, les données INSEE, permet de mieux définir les profils socio-démographiques : CSP, niveau de revenu, âge, situation familiale… Cette meilleure connaissance des clients et de leur comportement est la clé d’une stratégie marketing réussie.
D’autres données issues des transports ou des villes permettent aussi de revoir certains aspects du parcours client comme l’accessibilité, le stationnement… pour améliorer l’expérience client finale.

anticiper

Ces nouvelles informations vont également venir alimenter les jeux de données d’entraînement de l’intelligence artificielle. En effet la mise à disposition de données aussi variées mais interopérables facilite le machine learning.
Cette technologie de l’IA permet de découvrir des patterns, des schémas, au sein d’un ensemble de données afin d’effectuer des prédictions. Ainsi, en se basant sur les informations associées à la qualité de l’air, la localisation et au trafic routier, et en comparant avec les données historiques, le machine learning permet par exemple de détecter les pics de pollution. En entreprise, cette analyse prédictive peut permettre d’anticiper de potentiels problèmes au niveau de la chaîne de production comme les futurs besoins ou les habitudes des consommateurs.

L’intérêt public-privé de l’open data est aujourd’hui indéniable même si encore peu d’entreprises ont réellement pris conscience des possibilités offertes par la réutilisation des données publiques. En revanche nous parlons moins de l’open data privé. Qu’en est-il de l’ouverture des données des entreprises ?

L’open data privé

L’open data privé fait référence à l’ouverture des données d’une entreprise à tous. Ainsi les organismes publics, les citoyens et mêmes les autres entreprises peuvent accéder aux données brutes de celle-ci.

Bien sur il n’est pas question ici d’ouvrir toutes les données de l’entreprise mais de sélectionner tel ou tel jeu de données qui permettra de dynamiser le secteur, développer de nouveaux business et ainsi créer de la valeur pour tous les acteurs économiques.

Certaines entreprises ont déjà ouvert une partie de leurs données. C’est par exemple le car d’Airbnb et d’Uber qui permettent à la mairie de Paris d’accéder, via leurs portails, à certaines informations relatives au tourisme et à la circulation. Mais ces données ne servent pas qu’au secteur public. En ouvrant ses données, Airbnb offre aussi la possibilité à d’autres acteurs du tourisme de mieux choisir leur emplacement et d’améliorer leur offre de services.

Mais ces collaborations pourraient aller encore plus loin et bénéficier à d’autres secteurs. Ainsi les études préalables au forage des sols dans le secteur pétrolier pourraient également être utilisées par des promoteurs immobiliers en amont de la construction.7

Dans un monde où la transparence est de plus en plus demandée par l’ensemble de l’écosystème d’une entreprise, ouvrir ses données peut également avoir un effet bénéfique sur son image. En effet, en partageant ses données l’entreprise entre dans une démarche plus collaborative. A l’instar des gouvernements qui ouvrent leurs données, l’entreprise qui diffuse ses données permet aussi au grand public de vérifier ses actions. Au-delà de la transparence, l’entreprise démontre ainsi son engagement.

Contactez-nous

7https://www.usine-digitale.fr/article/avis-d-expert-l-open-data-prive-le-nouvel-eldorado-des-entreprises.N781694