Ako sa pýtať správne otázky?

Veľké dáta majú dva základné aspekty – deskriptívny a analytický. Je pomerne jednoduché použiť dáta na to, aby sa ich majiteľ dozvedel základné veci o svojom biznise: ktorý výrobok alebo služba sa predáva najlepšie, koľko priemerne minie zákazník na jeden nákup, koľko času strávi návštevník na webovej stránke a ďalšie opisné otázky. Odpovede na ne sú samozrejme cenné a je dôležité ich poznať a vyhodnocovať pri prijímaní rozhodnutí.

Oveľa zaujímavejšie je však poznať biznis do hĺbky a využiť dostupné dáta na zodpovedanie ťažších otázok. Najlákavejšie je použiť dáta a dátovú analytiku na vytvorenie predikcií, a tým vedieť napríklad predpovedať reakcie zákazníkov, odhadnúť správanie konkurencie alebo určiť najlepšiu stratégiu vo verejných a iných súťažiach.

Dáta však nezodpovedajú na všetko. Je potrebné dávať si pozor na to, aby sme nechceli odpovede na otázky, ktoré sa z dát nedajú vyčítať. Pri každej analýze je potrebné urobiť určitý počet predpokladov, ktoré však nemôžu byť nereálne alebo špekulatívne. Čím špecifickejšia je otázka, tým bude odpoveď na ňu pravdivejšia.

Big_data_2

Ďalej je potrebné vždy myslieť na to, že pri analýze dát sa určujú korelácie, a nie závislosti. To, že dve premenné sa menia v rovnakom čase alebo pri rovnakých pozorovaniach neznanemá, že jedna ovyplvňuje tú druhú. Pre určenie závislosti je potrebné mať čo najväčší počet premenných a nevyhnuté externe overiť predpoklady, z ktorých analýza vychádza.