En 2016, cette personne c'était vous (You), pour reconnaître votre maîtrise de l'entrée dans l'Age de l'information avec la révolution des réseaux sociaux, des tablettes et des smartphones, assimilée par plus de 3 milliards d'individus sur la planète. Mais comme dis le proverbe chinois "quand le sage montre la lune, le fou regarde le doigt".
Il nous a fallu un peu plus de temps pour voir la lune : la data.
En 2018 GreenSI pense que la data pourrait être la couverture "Person of the Year" : une année qui va être marquée par la mise en place du RGPD en Europe pour mieux gouverner les données personnelles dans les entreprises et l'explosion de l'Intelligence Artificielle en Chine et aux États-Unis, qui exploite les gisements de données les plus riches de la planète, celles des citoyens du Monde en attendant celles des machines.
Mais si la donnée est vraiment l'or noir du XXIème siècle, sa place devrait être centrale dans l'entreprise. Les raffineries de données devraient tourner à plein régime et valoriser cet or noir au maximum pour créer de la richesse visible dans les comptes des entreprises et anticipée par la Bourse.
Il n'y a pas de doute que les GAFAs l'ont bien compris et si on prends en exemple le ratio de productivité de Google ($1.200 million par employé) il est jusqu'à six fois supérieur à une société traditionnelle reposant simplement sur des actifs matériels. La valorisation des GAFAs est aussi impressionnante, plusieurs dizaines de fois leurs bénéfices.
En France en 2016 deux entreprises du CAC40 sont à ce niveau de productivité globale, Total qui exploite l'or noir du siècle précédent et AXA dans l'assurance et les services financiers fortement numérisés. Puis le ratio tombe a la moitié pour terminer en bas du classement avec le commerce de détail qui tourne autour de 200.000€ par employé.
Ces chiffres semblent donc indiquer une révolution... qui ne se matérialise pas encore!
Au niveau des valorisations, si on regarde les prometteuses startups, en 2017 les licornes (dont la valorisation est supérieure à 1 milliard) sont américaines ou chinoise à 77% chinoises. Les européennes sont passées de 47 à 57 en 2017 (+21%), mais les françaises sont toujours au nombre de 3 comme en 2016 (Blablacar, Criteo et Vente-privée), et 4 si GreenSI ajoute OVH valorisée plus d'un milliard mais beaucoup plus vieille que les 3 autres. Ces 3 exemples sont pourtant le moteur français de l'économie des plateformes avec au cœur les données. Quand à OVH, dans l'hébergement des plateformes, il profite lui plus largement de cette nouvelle économie en fournissant les infrastructures.
Proportionnellement à son poids en Europe, ces exemples de grands groupes ou de licornes semblent bien légers pour représenter la France. D'où la question posée par GreenSI : la France est-elle en train de rater la révolution du moteur de la donnée ?
Est-ce que la valorisation des données, pourtant à l'agenda de Davos avec l'intelligence artificielle à toutes les sauces et dans toutes les réunions de programmes de transformation des grands groupes, butte sur une difficulté inattendue ? Pourquoi n'a t-on encore que les exemples des GAFAs et BATX pour parler de valorisation massive des données ?
Cette question sera débattue le 7 mars dans le cadre d'une table ronde aux rencontres d'affaire de ROOMn. Ce billet est l'occasion de laisser votre avis ou des exemples non-GAFAs dans les commentaires, dans le sondage à la fin du billet ou, comme vous savez très bien le faire, directement sur Twitter ou LinkedIn ;-)
Dans les premiers échanges que j'ai pu avoir avec des data scientists pour la préparation de cette conférence, on m'a déjà remonté plusieurs "mirages" vers lesquels l'entreprise se dirige et que je voulais partager dans ce billet. Et comme chacun sait, le mirage n'est que le reflet d'une réalité beaucoup plus lointaine, mais qui pourrait décourager les caravanes qui en attendait leur salut...
Le mirage de la plateforme unique
Pour valoriser les données faut-il une plateforme unique pour toute l'entreprise ?
Si l'entreprise est petite ou moyenne, on l'achète, si elle est grande on noue un partenariat stratégique avec un des acteurs de ces plateformes. D'ailleurs les budgets marketing de Microsoft, IBM, et autres Salesforce sont justement fait pour vous faire avoir cette idée (rappelez-vous du film Inception du réalisateur Christopher Nolan?) !
Oui, il faudra structurer une chaîne d'information des sources à la valorisation, et oui les plateformes citées vont jouer un rôle pour raffiner les données jusqu'à les exposer dans de nouveaux services, mais de là à penser qu'il suffirait d'en acheter une pour atteindre le Saint-Graal et qu'il n'en faudra qu'une pour tous le besoins, c'est une autre histoire...
Si on prends l'exemple de la valorisation par de nouveaux algorithmes intelligents qui vont transformer les processus et délivrer de nouveaux services, ils ne se feront pas sans une transformation des métiers.
C'est une nouvelle relation homme-machine au service du business qui se dégage de tous les débats sur l'IA et a été traitée dans le billet sur l'IA la plateforme de développement du business. La plateforme technique n'est donc au mieux que la moitié du sujet. Elle ne répond pas à l'organisation du métier, des processus et de la collaboration nécessaire.
GreenSI voit donc dans l'étude récente de Gartner, commentée par Silicon.fr, qu'un DSI sur deux est prêts à déployer l'IA, un signe qui n'est finalement pas très rassurant. Sans le métier les DSI n'iront certainement pas bien loin et on aura dépensé beaucoup d'argent pour acheter une plateforme mirage ou peut-être même miracle.
En plus des rôles déjà existant dans les directions métiers, notamment au marketing, les nouveaux rôles des données émergent dans les entreprises. Le Chief Digital Officer coordonne la transformation digitale qui repose en partie sur les données (mais pas que). Le Chief Data Officer lui se positionne sur la valorisation des données. Dans le monde anglo-saxon on met en place les rôles prévus par les démarches structurées comme DM-BOK (ex. Data Steward, Data Owner, ...), une démarche qui est à la data ce que PM-BOK est à la gestion de projet (BOK = Body of Knowledge). Sans compter les Data Scientists parfois oubliés dans leurs laboratoires.
Et voilà qu'en 2018 le nouveau Règlement Général de Protection des Données demande la mise en place d'un Data Protection Officer (DPO), qui pourra être le CIL (correspondant informatique et liberté) demandé par la CNIL, pour se porter garant de tous les processus exploitant les données personnelles, ce que bien sûr l'entreprise a déjà identifié et documenté depuis fort longtemps ;-)
Comment tous ces acteurs interagissent ? A quelle vitesse ? Sont certainement des questions qu'il faut se poser pour avoir des organisations réellement opérationnelles pour le business et pas uniquement ancrées dans la gouvernance des données.
La réalité est donc certainement que l'entreprise cherche son modèle d'organisation pour traiter les données de bout en bout ; et lâcher prise sur les applications qui en sont irriguées et qui jusqu'à présent ont structuré (et siloté) sa façon de penser le SI.
Pour GreenSI l'Intelligence Artificielle est révélatrice des vrais transformations, et c'est peut-être une bonne chose de regarder plus loin et de lever la tête au dessus du mirage que peuvent représenter ces nouvelles organisations à la peinture encore fraîche.
Le retour d'expérience c'est qu'en 9 années, toutes les entreprises sont encore loin d'exploiter en interne ce moteur et celles qui l'exploitent ne le font pas encore à son plein potentiel. Et en externe les flux sociaux, un immense réservoir de données, ne sont pas non plus maîtrisées par les entreprises qui pensent encore que l'Internet 2.0 est un média et non un espace de collaboration. C'est donc un processus de changement relativement lent qui est à l'œuvre dans les entreprises sur le sujet de la collaboration.
Les outils ne sont pas à blâmer, même si l'entreprise peut regretter que Microsoft qui était bien ancré dans la bureautique n'ait pas été le leader qui emmène ses clients dans l'entreprise 2.0 avant 2013 (fin 2012 Microsoft change de cap et rachète un des acteurs majeurs, Yammer).
La collaboration ne se décrète donc pas, elle s'organise et s'anime tous les jours. On revient donc à la question de l'organisation et de la création d'une culture favorable.
Pour la donnée ce sera pareil. La culture de la donnée doit se développer et ce ne sera pas simple. C'est un programme de conduite des changements qui se met en œuvre pour sensibiliser à la valeur de cette matière première virtuelle et au soucis de sa qualité.
Tout y est bien classé sur des étagères identiques. Quand on fait une requête on obtient un résultat exhaustif, donc on trouve ce qui correspond à nos critères et on sait que rien d'autre n'existe dans la bibliothèque si il ne nous a pas été retourné. C'est l'image de l'organisation d'un stock de données et de réservoirs annexes.
Malheureusement nous avons certainement quitté le monde des stocks pour le monde des flux.
Déjà les réseaux sociaux avaient mis le doigt sur l'importance de créer un réseau disponible pour répondre à des sollicitations imprévues et moins sur le stockage à priori des réponses. C'est pourquoi Twitter est aujourd'hui le meilleur outil de gestion de crise offrant une grande capacité de résilience. C'est même un peu pour ça que la DARPA a créé Arpanet en pleine guerre froide (devenu Internet) pour avoir un réseau résilient à une attaque nucléaire qui supprimerait l'un de ses nœuds.
Ces réseaux nous amènent donc dans le monde des flux, où les données y sont ouvertes avec des API, des mécanismes d'abonnements et de publication remplacent les requêtes aux critères trop précis dans un monde incertain. De nouvelles architectures "Data Driven" sont choisies par les GAFAs pour développer leurs plateformes. Les bases de données gros volumes n'utilisent plus uniquement SQL, le langage standard de requête, et se différencient du modèle relationnel historique avec le NoSQL (not only SQL). L'open data, va amplifier ce mouvement entre entreprises de la sphère publique.
La vision statique et rassurante des données est donc certainement un mirage dans un monde d'abondance de données. C'est pourtant ce que propose de nombreuses architectures applicatives. La vision dynamique des données se concentre sur les flux et tant pis si on ne les a pas toutes et/ou toutes bien organisées. Dans un modèle de flux c'est la vitesse qui compte, l'organisation des données se fait à la volée.
La bibliothèque bien organisée qui ressemble à un grand MDM de l'Univers est donc peut-être également un mirage...
Si l'entreprise est petite ou moyenne, on l'achète, si elle est grande on noue un partenariat stratégique avec un des acteurs de ces plateformes. D'ailleurs les budgets marketing de Microsoft, IBM, et autres Salesforce sont justement fait pour vous faire avoir cette idée (rappelez-vous du film Inception du réalisateur Christopher Nolan?) !
Oui, il faudra structurer une chaîne d'information des sources à la valorisation, et oui les plateformes citées vont jouer un rôle pour raffiner les données jusqu'à les exposer dans de nouveaux services, mais de là à penser qu'il suffirait d'en acheter une pour atteindre le Saint-Graal et qu'il n'en faudra qu'une pour tous le besoins, c'est une autre histoire...
Si on prends l'exemple de la valorisation par de nouveaux algorithmes intelligents qui vont transformer les processus et délivrer de nouveaux services, ils ne se feront pas sans une transformation des métiers.
C'est une nouvelle relation homme-machine au service du business qui se dégage de tous les débats sur l'IA et a été traitée dans le billet sur l'IA la plateforme de développement du business. La plateforme technique n'est donc au mieux que la moitié du sujet. Elle ne répond pas à l'organisation du métier, des processus et de la collaboration nécessaire.
GreenSI voit donc dans l'étude récente de Gartner, commentée par Silicon.fr, qu'un DSI sur deux est prêts à déployer l'IA, un signe qui n'est finalement pas très rassurant. Sans le métier les DSI n'iront certainement pas bien loin et on aura dépensé beaucoup d'argent pour acheter une plateforme mirage ou peut-être même miracle.
Le mirage de l'organisation silotée
Donc l'organisation va être essentielle pour aborder cette transformation.En plus des rôles déjà existant dans les directions métiers, notamment au marketing, les nouveaux rôles des données émergent dans les entreprises. Le Chief Digital Officer coordonne la transformation digitale qui repose en partie sur les données (mais pas que). Le Chief Data Officer lui se positionne sur la valorisation des données. Dans le monde anglo-saxon on met en place les rôles prévus par les démarches structurées comme DM-BOK (ex. Data Steward, Data Owner, ...), une démarche qui est à la data ce que PM-BOK est à la gestion de projet (BOK = Body of Knowledge). Sans compter les Data Scientists parfois oubliés dans leurs laboratoires.
Et voilà qu'en 2018 le nouveau Règlement Général de Protection des Données demande la mise en place d'un Data Protection Officer (DPO), qui pourra être le CIL (correspondant informatique et liberté) demandé par la CNIL, pour se porter garant de tous les processus exploitant les données personnelles, ce que bien sûr l'entreprise a déjà identifié et documenté depuis fort longtemps ;-)
Comment tous ces acteurs interagissent ? A quelle vitesse ? Sont certainement des questions qu'il faut se poser pour avoir des organisations réellement opérationnelles pour le business et pas uniquement ancrées dans la gouvernance des données.
La réalité est donc certainement que l'entreprise cherche son modèle d'organisation pour traiter les données de bout en bout ; et lâcher prise sur les applications qui en sont irriguées et qui jusqu'à présent ont structuré (et siloté) sa façon de penser le SI.
Pour GreenSI l'Intelligence Artificielle est révélatrice des vrais transformations, et c'est peut-être une bonne chose de regarder plus loin et de lever la tête au dessus du mirage que peuvent représenter ces nouvelles organisations à la peinture encore fraîche.
Le mirage de la collaboration facile
En 2009, l'entreprise s'est penchée sur le développement des réseaux sociaux et a cherché à reproduire en interne ce moteur de la collaboration qui en 10 ans a touché 3 milliards de personnes dans le monde. Ce sont les réseaux sociaux d'entreprises.Le retour d'expérience c'est qu'en 9 années, toutes les entreprises sont encore loin d'exploiter en interne ce moteur et celles qui l'exploitent ne le font pas encore à son plein potentiel. Et en externe les flux sociaux, un immense réservoir de données, ne sont pas non plus maîtrisées par les entreprises qui pensent encore que l'Internet 2.0 est un média et non un espace de collaboration. C'est donc un processus de changement relativement lent qui est à l'œuvre dans les entreprises sur le sujet de la collaboration.
Les outils ne sont pas à blâmer, même si l'entreprise peut regretter que Microsoft qui était bien ancré dans la bureautique n'ait pas été le leader qui emmène ses clients dans l'entreprise 2.0 avant 2013 (fin 2012 Microsoft change de cap et rachète un des acteurs majeurs, Yammer).
La collaboration ne se décrète donc pas, elle s'organise et s'anime tous les jours. On revient donc à la question de l'organisation et de la création d'une culture favorable.
Pour la donnée ce sera pareil. La culture de la donnée doit se développer et ce ne sera pas simple. C'est un programme de conduite des changements qui se met en œuvre pour sensibiliser à la valeur de cette matière première virtuelle et au soucis de sa qualité.
Le mirage de la bibliothèque bien organisée
Quand on demande aux acteurs métiers quel est le monde idéal pour l'organisation des données on obtient souvent l'image de la bibliothèque.Tout y est bien classé sur des étagères identiques. Quand on fait une requête on obtient un résultat exhaustif, donc on trouve ce qui correspond à nos critères et on sait que rien d'autre n'existe dans la bibliothèque si il ne nous a pas été retourné. C'est l'image de l'organisation d'un stock de données et de réservoirs annexes.
Malheureusement nous avons certainement quitté le monde des stocks pour le monde des flux.
Déjà les réseaux sociaux avaient mis le doigt sur l'importance de créer un réseau disponible pour répondre à des sollicitations imprévues et moins sur le stockage à priori des réponses. C'est pourquoi Twitter est aujourd'hui le meilleur outil de gestion de crise offrant une grande capacité de résilience. C'est même un peu pour ça que la DARPA a créé Arpanet en pleine guerre froide (devenu Internet) pour avoir un réseau résilient à une attaque nucléaire qui supprimerait l'un de ses nœuds.
Ces réseaux nous amènent donc dans le monde des flux, où les données y sont ouvertes avec des API, des mécanismes d'abonnements et de publication remplacent les requêtes aux critères trop précis dans un monde incertain. De nouvelles architectures "Data Driven" sont choisies par les GAFAs pour développer leurs plateformes. Les bases de données gros volumes n'utilisent plus uniquement SQL, le langage standard de requête, et se différencient du modèle relationnel historique avec le NoSQL (not only SQL). L'open data, va amplifier ce mouvement entre entreprises de la sphère publique.
La vision statique et rassurante des données est donc certainement un mirage dans un monde d'abondance de données. C'est pourtant ce que propose de nombreuses architectures applicatives. La vision dynamique des données se concentre sur les flux et tant pis si on ne les a pas toutes et/ou toutes bien organisées. Dans un modèle de flux c'est la vitesse qui compte, l'organisation des données se fait à la volée.
La bibliothèque bien organisée qui ressemble à un grand MDM de l'Univers est donc peut-être également un mirage...