Tout d'abord, un appel pour ouvrir la file lors du 4eme trimestre ouvertures-des-files-du-4-eme-trimestre-2018
Aujourd'hui pour faire le lien avec hier sur le RGPD (dont vous avez les résultats du quizz ici quizz-rgpd-t24336.html) je vous propose de s'interroger sur le Big Data, l'IA … et le RGPD
J'ai tenté de vulgariser un maximummum, en prenant quelques raccourcis. S'il y a des connaisseurs dans les lecteurs, pardonnez-moi
Big Data
Qu'est ce que le Big Data ?
1) Le stockage de données de taille unitairement volumineuses ?
2) Le stockage de données de taille unitairement variable, mais le nombre les rend volumineuses ?
3) Le nom de mon voisin qui aime bien les fast food ?
Ces entrepôts Big Data sont généralement basés sur des technologie spécifiques différentes des bases de données classiques. Ces dernières sont plus adaptées à des données structurées. Dans le cas du Big Data il y a peu ou pas de structure de données.
D'autre part le stockage massif de données et les requêtes / interrogations nécessites des technologies adaptées (comme NoSQL, Hadoop).
Rappelons au passage que le RGPD vise à poser un certain nombre des règles afin de réduire les risques de fuite de données (ex l'affaire Cambridge Analytica).
Ces entrepôt de données sont donc soumis au RGPD ...
IA
Qu'est ce que l'IA ?
1) une Intelligence Artificielle
2) l'Instinct Andlilien
3) l'Ichimoku des Aruspices
- Exemple 1 : beaucoup de personnes retweetent le dernier tweet de Trump, il faut le regarder
- Exemple 2 : on est un dimanche il est 14h on est à Bordeaux, il fait beau, tout le monde va aller à la plage ; mon application de GPS anticipe pour moi un temps de parcours plus long / un chemin différent.
Cette IA peut aussi utiliser des méthodes de Machine Learning qui permet à l'algorithme d'apprendre par lui-même.
- Exemple 1 avec Machine Learning : beaucoup de personnes retweetent le dernier tweet de Trump, il faut le regarder ET sur les 50 fois précédentes si le DOW change de tendance dans les 2 minutes alors le tweet a un impact économique donc l'IA se positionne dans la tendance.
- Exemple 2 avec Machine Learning : On est un dimanche il est 14h on est à Bordeaux, il fait beau, tout le monde va aller à la plage ; mon application de GPS anticipe [...] ET la probabilité d'accident étant augmentée l'IA du système de régulation du trafic limite la vitesse sur les axes fréquentés qui ont eu des accidents lors d'événement similaires ET prévient en avance les services chargés de la sécurité routière ...
Les exemples sont infinis ... avec bien-sur beaucoup d'enjeux commerciaux ...
Données, IA et RGPD
On veut traiter / croiser un maximummum de données et il faut respecter la réglementation.
Du fait de la collecte d'information, des capacités de calcul qui augmentent, où est la limite des données personnelle ?
En effet une somme d'informations non personnelles (anonymes) peut permettre d'identifier quelqu'un unitairement.
Combien de critères anonymes faut il réunir pour identifier quelqu'un ?
Plusieurs études ont démontré qu'on pouvait "facilement" retrouver une personnes individuelle à partir du croisement de données totalement anonymes, lorsqu'elles sont prises séparément.
En 2016, le gouvernement Australien a mis à disposition des données médicale "anonymisées" (ordonnances, prescription et suivi de 2.9 M de personnes).
Les données à caractère personnel direct avaient été supprimées mais une équipe de recherche de l'université de Melbourne ont pu retrouver des personnes en croisant ces données avec d'autres accessibles publiquement (informations de célébrités et d'athlètes).
87% de la population des USA peut être identifiée en ayant la date de naissance, le sexe et le code postal.
Des données anonymes deviennent personnelles si le croisement est fait … par notamment les IA qui ont pour objectif de nous donner toujours plus de services ...
Je vais m'arrêter là, je voulais juste vous faire toucher du doigt :
- - Les possibles antagonismes entre la collecte des données, leur analyse et la réglementation
- - Le fait que vos données sont précieuses dans ce monde numérique
- - Qu'elles sont collectées et utilisées, acceptez le pour les usages dont vous avez besoin, refusez le pour le reste : soyez acteurs de vos données
Calendrier éco