De Chinese internetwinkel Alibaba komt voor de dag met het bizarre idee dat de borstomvang van hun vrouwelijke klanten hun koopgedrag voorspelt: ‘Earlier this summer, a group of data crunchers looking at underwear sales at Alibaba came across a curious trend: women who bought larger bra sizes also tended to spend more’. Is het terecht dat de internetwinkel zijn verkoopstrategie mede bepaalt op basis van deze ‘big data’? Data (feiten) zijn niet per sé hetzefde als informatie, en informatie leidt niet per sé tot een nieuw inzicht. Zonder een goede verklaring voor de data heeft Alibaba nog niet veel in handen. Dat legt een statisticus uit in dit artikel in thecrunch.com.
Veel pseudowetenschap beroept zich op toevallige en nietszeggende samenloop van gegevens. Een bekend voorbeeld van zo’n toevallige samenloop is de afname van de ooievaren-populatie in Nederland en de afname van het aantal geboren kinderen. Het is glashelder dat je op dit soort ‘samenhangen’ geen beleid kunt baseren. De kans is dan ook groot, dat de ‘big data’ van Alibaba geen echte informatie of inzichten bevatten maar berusten op toeval of anderszins irrelevant zijn. Maar geinig is het natuurlijk wel en het maakt verder duidelijk hoe het gesteld is met je privacy bij deze webwinkel. Via Dirk Koppenaal. GJvtL.