<< Retour aux articles
Image  Frédéric Caillaud, directeur de l'innovation de l'INPI et Anne Dufour, directrice du département des données

« L’INPI met à disposition des entreprises plus de 7 millions de données »

Tech&droit - Start-up, Données
29/06/2017
Dépositaire de toutes les données françaises sur les brevets, les marques, les dessins et modèles et les comptes annuels des entreprises, l’INPI met à disposition des millions de données, mine d’informations essentielles pour de nombreux acteurs (start-up, PME, grandes entreprises, chercheurs ou services publics). Clé pour les levées de fonds, ces données permettent de dresser son environnement concurrentiel, sa veille technologique, de réaliser des études marketing, de rechercher des partenaires ou encore de lutter contre des contrefacteurs… Le point sur les données accessibles et les outils proposés pour les exploiter, avec Frédéric Caillaud, directeur de l'innovation de l'INPI, Anne Dufour, directrice du département des données et Sabine Darrigade, responsable du pôle diffusion des données.
Actualités du Droit : L’INPI a été l’un des pionniers dans l’ouverture des données. Quand a commencé cette politique de mise à disposition de data BtB ?
Anne Dufour, directrice du département des données : L'INPI, dans ses missions, assure la mise à disposition de toutes les informations techniques, commerciales et financières, qui sont contenues dans les titres de propriété industrielle et les données des entreprises inscrites au registre national du commerce et des sociétés (RNCS). Cette mission est inscrite dans le Code de la propriété intellectuelle, à l’article L. 4111-1.
Et depuis fin 2015, a été introduite dans le même article la notion de mise à disposition gratuite et pour réutilisation, selon la volonté gouvernementale d'ouverture des données publiques.
La mise à disposition des données s'est faite à partir de 1993, mais à l'époque c'était payant. La première licence gratuite a été accordée en octobre 2014 pour les données relatives aux titres de propriété industrielle et la première sur les données du RNCS en mars 2017.
 
AdD : Quelles sont actuellement les données en open data ?
Sabine Darrigade, responsable du pôle diffusion des données : Nos bases de données couvrent les titres de propriété industrielle qui sont gérés par l’INPI, à savoir les brevets, marques, dessins et modèles, et un fonds de jurisprudence. L’INPI met également à disposition les données sur les entreprises, par exemple les comptes annuels déposés auprès des greffes depuis le 1er janvier 2017 et les immatriculations, modifications et radiations (les IMR), depuis le 5 mai 2017.
Les antériorités varient en fonction des fonds. Pour les dessins et modèles, les données sont disponibles sur les titres depuis 1910. Pour la plus ancienne marque les données remontent à 1976 et pour les brevets à 2010.
  
AdD : Quel volume de données cela représente-t-il ?
Anne Dufour : Pour la propriété industrielle, nous mettons à disposition 4,5 millions de données. En données « entreprises » cela représente environ 1,2 million de « données comptes annuels » et 1,4 million de « données IMR » par an. L’INPI met donc à disposition des entreprises plus de 7 millions de données. 
 
AdD : Prévoyez-vous d’étendre ce champ ?
Sabine Darrigade : Notre travail porte essentiellement sur la reprise de l’antériorité. Un chantier est en cours pour couvrir l’ensemble du fonds brevets par exemple.
Une nouvelle base d’Indications géographiques (IG) permet d’accéder librement, depuis décembre 2016, aux enquêtes publiques en cours, aux dernières homologations. Cette base permet de compléter une recherche d’antériorité de marques, de prendre connaissance de la liste des opérateurs économiques habilités à utiliser une IG ou à connaitre les techniques de fabrication et/ou traditions d’une IG (cahier des charges).

AdD : Comment accède-t-on à ces données ?
Anne Dufour : Avec une licence gratuite : les entreprises ou personnes intéressées par ces données doivent télécharger la licence, puis la compléter. Les licenciés s’engagent notamment à ne pas faire un usage des données personnelles qui serait contraire aux dispositions de la loi relative à l’informatique, aux fichiers et aux libertés. Les données leur sont mises à disposition et actualisées toutes les semaines ou quotidiennement selon le type de données.
Après seulement quelques semaines d’ouverture, 308 licences ont été souscrites pour les données du RNCS. De nouveaux services que l’on n’imagine pas aujourd’hui vont être développés, ce qui va créer de la valeur. Le croisement de plusieurs fonds et de plusieurs données sera très intéressant. Nous mettons également à disposition des jeux de données statistiques, en ligne sur www.data.gouv.fr utilisables avec la licence ouverte d’Etalab.
 
Sabine Darrigade : Nous avons mené une étude sur le profil de nos licenciés propriété industrielle, en février-mars 2017. Nous recensons aujourd’hui 130 licenciés en propriété industrielle, qui ont souscrit 185 licences pour les différentes données. L’étude a porté sur 30 % de cette cible. Il est intéressant de relever que les demandes sont effectuées par des Français à 80 %. Ensuite, les demandes viennent de Belgique, d’Allemagne, du Royaume-Uni, des États-Unis, du Canada ou encore du Japon (notamment pour des brevets, qui ont une dimension internationale). Les demandeurs sont des entreprises de toute taille, aussi bien des grandes structures que des PME et start-ups.
 
Concernant l’exploitation de ces données mises à jour chaque semaine, 80 % de ces entreprises téléchargent effectivement les données, et 80 % d’entre elles le font à un rythme hebdomadaire (20 % à fréquence plus variable). La non-exploitation de ces données s’explique le plus souvent par l’abandon du projet, le manque de financement, la complexité d’exploitation de ces données en propriété industrielle…
 
S’agissant plus précisément de l’usage qui est fait de ces données, dans 5 % des cas, ces données sont utilisées pour des applications en interne mais pour la très grande majorité (95 % des autres usages), elles sont orientées business et connaissance du marché : statistiques, croisement des données, KYC, veille marketing, prospection, recherche scientifique et technique, etc.
 
Avant l’open data, les personnes qui consultaient ces données étaient issues du milieu industriel et spécialisées en traitement de données propriété industrielle, mais avec l'ouverture, cela a démultiplié les usages et nous avons à faire à des personnes qui sont moins averties en termes de connaissances en propriété intellectuelle mais qui croisent ces données avec d’autres bases de données, de domaines complémentaires. Ces données servent aussi à des hackatons, qui permettent à des start-up de se distinguer.
 
AdD : Quels usages font les entreprises de ces données ?
Anne Dufour : Afin de faire connaître ces usages, l’INPI a justement invité au Salon Viva Technology qui s’est tenu à Paris du 15 au 17 juin dernier des start-up qui utilisent nos données, principalement sur les titres de propriété industrielle.
Ce sont des entreprises qui cherchent soit à enrichir ou créer des solutions logicielles utilisées en interne, soit à imaginer de nouveaux services/produits pour répondre à un besoin existant.
 
L’entreprise Timbuktoo est un exemple de ces deux utilisations, interne à l’entreprise et externe. Cette agence conseil dédiée à la création de marques a créé, en 2012 puis en 2016, des outils à usage interne. Cela leur permet d’enrichir leurs créations. À partir de 2014, la société a développé une plateforme collaborative, qui permet aux entreprises qui souhaitent fédérer leurs collaborateurs autour d’une création ou d’un changement de nom, de consulter et recueillir les propositions de noms et avis de leurs salariés, qui votent ensuite pour le nom de leur choix.
 
On peut également citer EXenSa, qui est un laboratoire de recherche. Ils nous ont demandé une licence sur les brevets, étant intéressés par les brevets similaires. Cette société est capable de traiter de gros volumes de données en des temps assez courts (recherche par champ sémantique, avec du machine learning).
 
Dernier exemple avec C-Radar, qui est une start-up spécialisée dans les « données entreprises », l’open data, le big data, la dataviz, le machine learning et la data science. Cette société croise beaucoup de bases de données de l’INPI (marques, brevets, jurisprudence en propriété intellectuelle et RNCS), pour faire de l’intelligence économique et de la prospection (ciblage plus précis).
 
Autre utilisation possible de nos données : l’atlas des brevets. C’est un travail qui a été effectué en collaboration avec le ministère de la Recherche pour mettre à disposition les brevets par zone géographique : les requêtes peuvent être faites jusqu’au niveau de la commune. Pour chaque zone géographique, chacun peut ainsi consulter le nombre de brevets déposés, les secteurs d’activité concernés, la part déposants privés/déposants publics, la part inventeurs homme/femme, etc. Le tout avec des représentations cartographiques très claires qui permettent de caractériser la production technologique locale. Il est en ligne depuis le 2 février 2017.
 
Sur le RNCS, nous attendons de multiples autres utilisations, l’accès étant ouvert depuis peu de temps.
 
AdD : L’INPI vient de rendre public un nouveau service, l'analyse cartographique des inventions brevetées. Pouvez-vous nous indiquer en quoi consiste cet outil ?
Frédéric Caillaud, directeur de l'innovation de l'INPI : La cartographie des brevets permet de rendre le monde des inventions beaucoup plus transparent. Elle apporte donc un avantage concurrentiel majeur. En analysant le marché, l’INPI s’est aperçu qu’au moins 95 % des entreprises n’y avaient pas accès en raison de son coût et de sa complexité d’utilisation. Nous avons alors commencé à réfléchir à la façon dont on pourrait faciliter le décodage des 90 millions d’inventions brevetées issues du monde entier, pour les rendre accessibles au plus grand nombre d’entreprises, et ciblant en priorité les start-up. L’objectif, donc : mettre le big data des brevets au service des structures innovantes afin qu’elles maitrisent mieux leur environnement concurrentiel mondial. 
Nous avons conduit un test auprès d’une trentaine de start-up et de PME, pour adapter le service à leurs attentes stratégiques. L’étude réalisée est à chaque fois personnalisée. Pour elles ce fut une découverte, car seules les grandes entreprises ont les moyens de conduire ou de s’offrir ce type d’études
En quoi consiste cette analyse cartographique ? Après extraction des brevets pertinents par un ingénieur spécialisé de l’INPI, un logiciel très complexe classe les brevets par concept et les positionne sur une carte topographique qui ressemble à une carte d’état-major. Plus vous avez de brevets basés sur le même concept, plus la pile est haute.
Aujourd’hui, il faut savoir qu’il y a au minimum 90 millions de brevets qui ont été déposés dans le monde. L’outil ressemble un peu à Google earth : plus on zoome, plus on voit de détails On commence par voir le domaine d’activité, puis le zoom permet de voir le secteur, les sociétés qui y opèrent, le département qui exerce cette activité dans l’entreprise, et ce jusqu’au chercheur.
Il faut noter que, souvent, quand on analyse sa concurrence, on pense à celle de son domaine. Or il faut savoir qu’en matière d’inventions, 20 % des problèmes technologiques existants ont déjà été résolus par des entreprises qui viennent d’autres secteurs. Cet outil, permet de les révéler.
Concrètement, lorsqu’un client a un challenge technologique à résoudre ou lorsqu’il veut positionner son invention dans son environnement concurrentiel mondial, il peut s’adresser à l’un de nos ingénieurs spécialistes de son secteur, qui va extraire les brevets pertinents pour dresser plusieurs cartes sur mesure (analyse précise des inventions ou concurrents, universités par secteur, des tendances de R&D, etc.). L’expert délivre les résultats par une visio-conférence interactive qui permet de répondre encore plus précisément aux questions des dirigeants.
Ce service sera disponible à partir du mois de septembre 2017 sur inpi.fr ou en contact les représentants régionaux de l’INPI. Il sera accessible aux start-up, PME, fonds d’investissement, cabinets de conseil en propriété intellectuelle et en stratégie, universités et organismes publics de recherche, pour un prix compris entre 3.600 et 4.200 euros (il faut habituellement compter 12-15.000 euros pour une analyse par d’autres acteurs), selon les options choisies.
 
AdD : Quels sont vos prochains projets ?
Anne Dufour : Dans le cadre de notre contrat d’objectif et de performance 2017-2020, nous travaillons à l’ouverture d’un nouveau portail d’accès, destiné à améliorer le confort d’utilisation de ces données : avec des jeux de données plus complets, des API, des visualisations des données, plus d'interopérabilité, etc. Il faudra patienter encore quelque temps !
 
 
Propos recueillis par Gaëlle MARRAUD des GROTTES
 
Source : Actualités du droit