Sommaire
Les besoins des entreprises
La montée en puissance des réseaux sociaux et du commerce électronique a encouragé le développement de solutions dédiées au Big Data. Logiquement, les premiers clients, et même les initiateurs, ont été les acteurs historiques de l'Internet (Yahoo !, Google...), ensuite les poids lourds du e-commerce (e-Bay, Amazon...) et enfin les réseaux sociaux (Facebook, Linkedin...).La seconde vague de clients comprend les acteurs de la grande distribution et des télécoms, mais aussi les organismes financiers. De grands groupes industriels tirent aussi des bénéfices des solutions de Big Data. Très peu de recherches peuvent en effet rapporter beaucoup d'argent à une entreprise. Avant de développer une nouvelle technologie et de la protéger en déposant des brevets, des multinationales s'appuient sur des technologies de Big Data pour vérifier qu'aucune de leurs filiales ne l'a déjà fait auparavant. De quoi économiser « des centaines de milliers d'euros », selon l'éditeur d'un moteur de recherche spécialisé dans le Business search.
L'exemple de ces multinationales montre que les solutions de Big Data doivent répondre aux besoins particuliers des entreprises.
- Marketing : développement du géo-marketing, du marketing comportemental... Une marque de sport peut souhaiter analyser les commentaires laissés sur ses pages Facebook et sur des blogs spécialisés et reconnus. L'analyse du comportement des internautes et du parcours de chacun des visiteurs d'un site est affinée par le Big Data. Ces études permettent en effet aux sites de préciser leur stratégie de segmentation de leurs visiteurs afin de réorienter en temps réel le contenu présenté. Elles permettent aussi de comprendre ce qui fait basculer l'internaute dans l'acte d'achat, en fonction des clics ou des formulaires remplis.
- Merchandising : optimisation des assortiments, des prix et des emplacements.
- Logistique : gestion des inventaires, optimisation de la logistique et des négociations fournisseurs.
- La réglementation : la gestion des risques ou de la fraude pour les banques ou la LCEN (Loi pour la confiance dans l'économie numérique) dans les télécoms par exemple nécessitent de stocker de très gros volumes de données pour assurer une traçabilité maximale mais aussi une réactivité dans l'analyse des données afin de faciliter le déclenchement d'alertes liées à des comportements suspects.
- La sécurité informatique : « L'âge du Big Data en sécurité est arrivé », affirme Eric Schwartz. Pour le RSSI de RSA, il est nécessaire d'avoir une approche de la sécurité tenant compte du contexte dans lequel les comportements des utilisateurs et des systèmes sont analysés afin de servir de fondement à la décision. L'exploitation de grands volumes de données de sécurité permet aux entreprises de « fouiller » l'ensemble de leur infrastructure pour accélérer les enquêtes a posteriori et améliorer la détection de fraudes, ainsi que la sécurité du SI dans son ensemble.
« De nombreux responsables de la sécurité informatique ont beaucoup de données à traiter et recherchent des personnes qui connaissent l'analytique. Ils ont également besoin d'analystes venant du décisionnel afin d'étudier les données de sécurité sans idées préconçues. L'objectif est de trouver des schémas logiques au milieu de toutes ces données », constate Mais Brian Fitzgerald, vice-président de RSA en charge du marketing.
- La santé : le Big Data peut aussi servir des causes plus « nobles » que la volonté d'être meilleur que les concurrents. Fin mars 2012, le Centre Hospitalier Universitaire de Leiden aux Pays-Bas a retenu Bull pour l'aider à concevoir un environnement de stockage Big Data. L'un des objectifs est de faciliter le calcul intensif sur des volumes de données gigantesques afin de disséquer et séquencer l'ADN humain.
De façon générale, les entreprises souhaitent bénéficier de méthodes d'analyse plus rapides et des rapports plus clairs et adaptés à leurs exigences (au fil de la journée ou de façon périodique) afin de disposer d'un avantage concurrentiel. Cette tendance a été identifiée par l'indice Big Data de Jaspersoft. Cet éditeur des logiciels décisionnels a mis en place en janvier 2012 le premier indice Big Data dans le secteur du décisionnel. Il s'agit d'un classement des connecteurs en téléchargement associés aux principales bases et sources de données.
« Recherche désespérément scientifique des données »
Malgré les progrès réalisés par les solutions de Big Data, l'être humain reste indispensable. Exceptées des solutions simplifiées à destination de PME, il ne s'agit pas de produits pré-packagés où il suffit d'ouvrir une boite, d'installer un logiciel sur des serveurs et le mettre en production. D'où la nécessité d'avoir des administrateurs systèmes avec des solides connaissances pratiques et surtout des... « scientifiques des données ».Ils doivent être capables de combiner les compétences d'un programmeur de logiciels et d'un statisticien et poser aussi les bonnes questions à la machine. En un mot, ils sont capables de faire le rapprochement entre les données brutes et leur analyse. Bref, un mouton à cinq pattes très difficile à dénicher. En plus de ce profil, les entreprises doivent disposer d'experts en mathématique et en statistique pour développer des modèles analytiques avancés et dégager des tendances... Cette carence apparaît d'ores et déjà comme un frein au développement du Big Data. Aux États-Unis, McKinsey prévoit un déficit de 140 000 à 190 000 spécialistes en analyse de données d'ici à 2018.
Big Data et protection des données personnelles
Selon la Commission nationale de l'informatique et des libertés (CNIL), le phénomène Big Data ne modifie pas en tant que tel la nature des obligations que les entreprises ont vis-à-vis des données personnelles (clients, fournisseurs, salariés) qu'elles détiennent. Le problème vient plutôt du fait que le volume devient de plus en plus important et donc de plus en plus difficiles à sécuriser.
Selon une enquête menée en 2010 par le Ponemon Institute auprès de 1000 spécialistes, 42 % considèrent que leur propre entreprise ne fait pas grand-chose pour réduire les risques de vols ou de pertes de données confidentielles. 45% d'entre eux reconnaissent qu'ils seraient dans l'impossibilité d'identifier, et donc d'avertir, les utilisateurs ou les clients dont les données personnelles auraient été volées.
Or l'article 34 de la Loi n° 78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés précise : « Le responsable du traitement met en oeuvre toutes mesures adéquates, au regard de la nature des données et des risques présentés par le traitement, pour assurer la sécurité des données et en particulier protéger les données à caractère personnel traitées contre toute violation entraînant accidentellement ou de manière illicite la destruction, la perte, l'altération, la divulgation, la diffusion, le stockage, le traitement ou l'accès non autorisés ou illicites ».
Selon la Commission nationale de l'informatique et des libertés (CNIL), le phénomène Big Data ne modifie pas en tant que tel la nature des obligations que les entreprises ont vis-à-vis des données personnelles (clients, fournisseurs, salariés) qu'elles détiennent. Le problème vient plutôt du fait que le volume devient de plus en plus important et donc de plus en plus difficiles à sécuriser.
Selon une enquête menée en 2010 par le Ponemon Institute auprès de 1000 spécialistes, 42 % considèrent que leur propre entreprise ne fait pas grand-chose pour réduire les risques de vols ou de pertes de données confidentielles. 45% d'entre eux reconnaissent qu'ils seraient dans l'impossibilité d'identifier, et donc d'avertir, les utilisateurs ou les clients dont les données personnelles auraient été volées.
Or l'article 34 de la Loi n° 78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés précise : « Le responsable du traitement met en oeuvre toutes mesures adéquates, au regard de la nature des données et des risques présentés par le traitement, pour assurer la sécurité des données et en particulier protéger les données à caractère personnel traitées contre toute violation entraînant accidentellement ou de manière illicite la destruction, la perte, l'altération, la divulgation, la diffusion, le stockage, le traitement ou l'accès non autorisés ou illicites ».
