Le Big Data est un concept qui s'est popularisé dès 2012 pour
signi er la croissance exponentielle des données (data) à traiter.
Ces mégadonnées dépassent l'intuition et les capacités humaines d'analyse. Elles nécessitent donc de nouveaux outils pour stocker, requêter, traiter et visualiser l'information.
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
Infographie (Big?) Data - EnjoyDigitAll by BNP Paribas
1. by
(big)DATA?
Le Big Data est un concept qui s'est popularisé dès 2012 pour
signifier la croissance exponentielle des données (data) à traiter.
Ces mégadonnées dépassent l'intuition et les capacités humaines
d'analyse. Elles nécessitent donc de nouveaux outils pour stocker,
requêter, traiter et visualiser l'information.
Volume car les masses de
données à traiter sont
sans cesse croissantes.
Vitesse car la collecte,
l’analyse et l’exploitation
des données doivent de
plus en plus souvent se
faire en temps réel.
Valeur : il s'agit de se
concentrer sur les
données valables et
actionnables.
Véracité ou fiabilité, menacée
par les comportements
déclaratifs (formulaires), par la
multiplication des formats de
données et par l'activité des
robots et faux profils.
VOLUME VITESSE VARIÉTÉ VÉRACITÉ VALEUR
On comprend souvent les dimensions du Big Data grâce aux 5V :
Variété car les données sont de
formes variées et pas toujours
structurées (données relatives
aux réseaux sociaux par exemple).
90% des
données sont
«non structurées»
ÉVOLUTION DES FLUX DE DONNÉES
les mystères de la data ?
2013 : 28 875Go/sec
2018 : 50000Go/sec
1992 : 100Go/jour
2002 : 100Go/sec
1997 : 100Go/heure
WWW
Données Structurées
Les données structurées sont des informations organisées et classées en vue de faciliter
leur lecture et leur traitement. Vos bases de données clients ou produits sont des données structurées.
Date de naissance
Adresse
Points de fidélité
Transactions
NomMontants
Les données semi-structurées constituent une forme intermédiaire. Elles ne sont pas organisées selon une méthode
complexe rendant possible un accès et une analyse sophistiqués ; cependant, certaines informations peuvent leur être
associées, telles que des balises de métadonnées, qui permettent l'adressage des éléments qu'elles renferment.
Les données non structurées ne sont pas organisées dans un format qui permet d'y accéder
et de les traiter facilement. En réalité, très peu de données sont complètement non
structurées. Même des éléments souvent considérés comme non structurés, tels que des
documents et images, sont structurés dans une certaine mesure. Un document Word est
généralement considéré comme un ensemble de données non structurées.
Données Semi/Non-Structurées
Avis Produits
Tweets
Likes
Images, etc...
90% DES DONNÉES
AUJOURD’HUI DISPONIBLES
ONT ÉTÉ CRÉÉES CES 2
DERNIÈRES ANNÉES !
2000 20201970
L'analyse de données est la partie des Data
Science qui décortique les données brutes
en leur appliquant des algorithmes.
Les analystes de données
procèdent par inférence :
partir de prémisses
connus pour aller vers
de nouvelles conclusions
afin d'améliorer les systèmes
et la prise de décision.
ANALYTICS
DATA
QUE FAIRE DE TOUTES CES DONNÉES ?
On peut distinguer, sans perdre la complexité des usages, deux grands potentiels :
Lié à l’exploitation des informations
collectées pour mieux comprendre
une cible complexe (étude e-rep),
créer des corpus d’informations pour
améliorer les algorythmes d’IA...
INFORMATIONINFORMATION
Intelligence
Artificielle
INSIGHT &
E-REPUTATION SEGMENTATION,
PROFILING,
TARGETING
BIG DATA
Lié à l’exploitation de la data pour
l’amélioration des performances par ex.
avec un tableau de pilotage global
(dashboard) ou en menant des actions
spécifiques d’optimisation !
PERFORMANCEPERFORMANCE
OPTIMISATION
DASHBOARD
(tracking ROI, RTB programmatic...)
DATA
S
C
I
E
N
C
E
D
A
T
A
Designed by
by
Sources : Definitions-Marketing.com, Le Big Data au Quotidien - Vouchercloud.fr,
« United Nations Population Division » - Organisation des Nation Unies, Lexique - Nordnet.com
SimpliLearn.com, Wikipedia.fr, FlatIcon.com, « Données Semi-Struturées » - LeMagIT.fr