Jste zde

Big data na počátku invaze do soukromí. Kam až chtějí vývojáři zajít?

Analýza obrovských objemů dat, získaných v on-line i off-line světě, je díky moderním technologiím stále rychlejší a rovněž i levnější. Výsledkem je, že si musíme začít chránit soukromí více než kdy dříve – big data totiž o každém z nás prozradí téměř cokoli.
Účely využití analýzy velkých objemů dat mohou být různé: Google a Facebook, snad největší sběrači dat na internetu (pomineme-li tajné služby), využívají detailní znalosti zákazníků svých (bezplatně poskytovaných) služeb k nabízení stále efektivnějšího cílení reklamy, kterou si u nich platí firmy i různé další organizace. Big data ale mají i mnohem bohulibější záměry a přínosy. Díky datům z rozsáhlých sítí senzorů lze předpovídat počasí a včas varovat obyvatele před přírodními katastrofami, v lékařství pomáhají připravit pro každého pacienta léčbu přesně na míru či modelovat šíření epidemií nakažlivých chorob a některá města již začínají analýzu velkých dat využívat i k prevenci a odhalování kriminality.
 
 

Co o sobě prozradíme?

 
Big data mají i svoji stinnou stránku, kterou ukážou ve chvíli, kdy se při jejich zpracování začne zaměňovat příčina a následek. Především poskytovatelé finančních či pojišťovacích služeb, kteří samozřejmě musejí ke svým zákazníkům přistupovat s vysokou mírou opatrnosti (nebo chcete-li nedůvěry), mohou big data použít jako „křišťálovou kouli“ a předem odhadovat rizika z dosud nebývale širokých souvislostí.
 
Již nyní mají některé z tuzemských bank specializované oddělení risk managementu, které pomocí sociálních sítí vyhledává informace o klientech – žadatelích o úvěr. Agregují a vyhodnocují informace ze soukromí, které běžně sdílíme přes Facebook, LinkedIn a další sociální sítě. Čelíme tedy době, kdy jsou žadatelé o úvěry hodnoceni i podle svých facebookových profilů, včetně toho, s kým se přátelí (co kdyby mezi nimi byl nějaký neplatič) a jakým životem žijí (střídají partnery, nakupují drahé zboží a tak dále).
 
Pojišťovny celosvětově spouštějí vývojové programy, které chystají zařízení na sledování životních funkcí. I v tuzemsku je již ve fázi testování služba, která umožňuje prostřednictvím chytrých zařízení sledovat zdravotní stav seniorů a pomocí získaných dat sledovat dlouhodobý vývoj jejich kondice. Blíží se doba, kdy budou na životní pojištění poskytovány slevy klientům, kteří budou ochotni nosit zařízení sledující jejich životní funkce a odesílající získaná data analytikům? Již dnes se při uzavírání havarijního pojištění či povinného ručení k automobilům zohledňuje například věk řidiče a místo jeho bydliště. Dalším krokem bude bezpochyby sledování telematických dat z našich vozů. Pojišťovna pak nastaví bonusy podle toho, jak často překračujeme povolenou rychlost, prudce akcelerujeme či brzdíme a jen tak mimochodem bude vědět i to, kam jezdíme.
 
Analýza velkých dat zasahuje do soukromí lidí i tam, kde bychom to na první pohled vůbec nečekali. Big data a armáda jejich analytiků pomohla například i při znovuzvolení Baracka Obamy prezidentem Spojených států. S trochou nadsázky se hovoří o tom, že jeho tým znal osobně každého z bezmála 70 milionů Američanů, kteří Obamu volili. Data, získaná na základě předchozích voleb i z dalších zdrojů, byla využita pro identifikaci nerozhodnutých voličů a k jejich individuálnímu oslovení. Vypadá to, že big data ohrožují i další metu našeho soukromí – právo na tajnost volby.
 

 

Co nás ještě čeká?

 
Množství dat použitelných k analýze bude bezpochyby i nadále růst raketovým tempem. Obrovský podíl na tom budou mít i zařízení takzvaného internetu věcí, tedy různé senzory či inteligentní zařízení a spotřebiče. Cisco odhaduje, že do roku 2018 bude internet věcí ročně generovat 400 zettabajtů dat (1 zettabajt = 1021 bajtů), což představuje čtyřnásobný růst oproti roku 2013. Příval dat ze senzorů dobře demonstruje příklad letadla Boeing 787, které za hodinu letu vygeneruje plných 40 terabajtů dat. Faktem ovšem je, že jen velmi malá část dat generovaných zařízeními internetu věcí je dnes dále zpracovávána a ukládána v datových centrech. Podle Cisca půjde v roce 2018 „jen“ o 8,6 zettabajtů.
 

Wi-Fi moduly pro internet věcí se vším všudy

 
  • Netvrdíme, že se chytré krabičky s drátovým připojením vzájemně vylučují. Pokud již ale pustíme data vzduchem, mělo by to dávat smysl. Stejně jako v případě nových, jedno a dvoupásmových Wi-Fi modulů Qualcomm.
Různými senzory pro sběr budou vybavena stále další a levnější zařízení. Jejich výrobci pak budou mít možnost získávat data o tom, jak jejich produkty zákazníci využívají, a budou jim schopni kdykoli poskytovat servisní služby. Již dnes začíná být samozřejmé, že se automobilka může na dálku po internetu připojit k vozům svých zákazníků, spustit diagnostiku a získat data potřebná pro servisní zásah na porouchaném voze. V případě autonomně řízených vozidel, která již dnes testují snad všechny velké automobilky, bude přísun dat z automobilů mnohonásobně větší, navíc budou vozy komunikovat nejen mezi sebou navzájem, ale také s prvky inteligentního dopravního značení a systémy automatizovaného řízení provozu. Řídicí jednotka auta pak automaticky upraví trasu podle „dopravních hlášení“, získaných od dalších vozů na cestě či semaforů, a dokonce dokáže odvrátit hrozící kolizi. Nic takového by nebylo možné bez zpracovávání obrovského množství dat v reálném čase.
 
Automobilka Audi již v reálném provozu, například v německém Berlíně, testuje systém, který řidiče informuje o optimální rychlosti pro dojetí k semaforu na zelenou, případně, pokud již auto stojí, o zbývajícím čase, než se zelená rozsvítí. Pokud bychom v budoucnu podobným způsobem zpracovávali data ze všech semaforů (respektive systémů, které je řídí), budeme moci nejen přesněji odhadovat dobu dojezdu v navigacích, ale také optimalizovat trasy a daleko plynuleji řídit dopravu.

 

Za vším hledejte data

 
Budeme si muset zvyknout, že náš každodenní život bude, podobně jako výše zmíněné letadlo, generovat stále více dat. Kromě našich smartphonů, tabletů a počítačů budou pocházet z dalších předmětů denní potřeby, našich elektronických doplňků a oblečení vybaveného senzory, automobilů a třeba i bezpečnostních kamer, kolem kterých projdeme na ulici nebo v obchodním centru. Tomuto nastupujícímu trendu se nemůžeme zcela vyhnout, ale zároveň bude jen na nás, abychom si v propojeném a vše sledujícím světě zachovali maximum soukromí. Můžeme začít velkou opatrností při výběru „zdarma“ poskytovaných služeb, jejichž skutečnou cenou jsou informace z našeho soukromí, které jsou následně zpeněženy, a pak také volbou poskytovatelů a výrobců služeb či produktů, kteří opravdu a prokazatelně dbají na ochranu dat, která o svých zákaznících získávají.
 
Reálně se ovšem sběru informací o nás samotných vyhnout nelze. Znamenalo by to nejen značnou obezřetnost a hlubokou technickou znalost, ale hlavně nutnost vyhnout se systému. Vždyť i chystané zavedení registračních pokladen, se kterými brzy přijdeme do styku v každodenním životě, je cílený sběr dat. Pojďme se raději zaměřit na jejich efektivní využití, abychom data nejen poskytovali, ale také z nich měli co největší prospěch.
 
Jan Chalas, Business Intelligence Consultant společnosti Servodata
 
 
Hodnocení článku: