#DataColada 21 : la fachosphère US, le client selon Amazon, les communautés créatives, etc.

Pierre Col
Data Colada
Published in
4 min readSep 23, 2016

--

Bienvenue à l’automne ! Voici votre dose hebdomadaire d’actualités des données :-)

Et comme l’automne nous rend pensifs, on n’est pas trop causants… Bonne lecture !

Rappel : chaque section de Data Colada est différenciée par une couleur et une catégorie (par ex., #opendata). Les URL vers les sources de chaque section sont dans le texte. Comme vous aimerez Data Colada, nous avons également ajouté des boutons “Partager” pour que vous puissiez plus facilement en faire bénéficier votre entourage :-)

Merci de votre confiance, et à la semaine prochaine !

#impact La fachosphère américaine

On parle beaucoup de (dé)radicalisation en lien avec le groupe terroriste Etat Islamique et les jeunes européens partant grossir ses rangs. Mais le phénomène de radicalisation touche une autre partie de la population : ce que les anglo-saxons appellent l’alt-right, soit un groupement de suprémacistes blancs, d’anti-sémites et autres individus violents et fascisants. Un data scientist de la startup New Knowledge a analysé les tweets de milliers de ces comptes et le résultat est pour le moins inquiétant.

#outils Les projections en d3.js

Les gens qui nous lisent savent combien on est fans de la bibliothèque D3.js (et surtout Rayna). L’excellent blog VisionsCarto propose une “ode aux projections de D3”. Une projection cartographique consiste à convertir des coordonnées (latitude et longitude) en coordonnées sur l’écran (des pixels, quoi). D3.js est connu pour offrir une infinité de possibilités de modification et adaptation. On vous laisse découvrir :-)

#bigdata “Le client d’abord” selon Amazon

C’est le leitmotiv d’Amazon. Mais ça n’a pas l’air d’être celui des algorithmes utilisés dans la proposition de produits. Une analyse de ProPublica s’est intéressée aux 250 produits couramment achetés sur Amazon, sur quelques semaines. L’article révèle, jeu de données et méthodo à l’appui, que 75% du temps, les produits les plus suggérés à l’achat sont ceux d’Amazon et d’entreprises qui payent pour les services d’Amazon. Et ce, même si des produits bien moins chers existent sur la plate-forme.

#jeudedonnées L’humour, c’est drôle

Une équipe de data scientists et l’éditeur du New Yorker entrent dans un bar… et écrivent un article scientifique intitulé “Humor in Collective Discourse: Unsupervised Funniness Detection in the New Yorker Cartoon Caption Contest”. Le New Yorker publie chaque semaine une caricature sans légende et demande aux lecteurs de proposer la leur. L’article décrit plusieurs méthodes automatiques de sélection des légendes les plus drôles. Le jeu de données correspondant contient 50 caricatures et près de 300 000 légendes par les lecteurs.

#datavis Les communautés créatives vues autrement

Projet intéressant à plusieurs niveaux. Oui, les visualisations sont vraiment chouettes. De plus, il présente une vision vraiment différente des communautés créatives. On est plutôt habitué à les voir expliqué à travers des chiffres issus de la démographie et liés à l’emploi (ou chômage, ça dépend). Kickstarter, l’une des plus grandes plate-formes de financement collaboratif, a fourni les données concernant 100 000 projets créatifs ayant cherché des sous via leur site web, à Polygraph. Le résultat vaut le détour.

Data Colada et sa surprise, c’est pour vous parce que vous êtes des gens sympas. Un échantillon (non) représentatif de lecteurs vous assure qu’il faut cliquer sur ce lien :

La surprise de la barmaid

Retrouvez toutes les éditions précédentes de Data Colada et abonnez-vous pour ne plus rien manquer.

Data Colada est la seule infolettre en français sur la vie des données. Une idée de @MaliciaRogue (Rayna Stamboliyska) et @PierreCol (Pierre Col).

--

--

Pierre Col
Data Colada

Internet veteran & marketer for ISPs and software vendors since 1986. Expert blogger @ ZDNet (Infra|Net). Now doing communications for SAP Build.