Vodeno mučenje - Analogija analitike ide predaleko

analitika kapanja

Podaci, poput vode, dolaze u mnogim oblicima. Ljudski um evoluirao je tako da filtrira većinu podataka koji nam dolaze, jer ih jednostavno ima toliko.

Kad otvorite oči i uši, podataka ima svugdje. Boja zida, zvuk klima uređaja i miris kafe vašeg susjeda tretiraju se kao vlaga. Voda je stalno u zraku, ali nije korisno obraćati joj puno pažnje.

Kad se voda kondenzira u maglu, prisiljava vas da je vidite i otežava razumijevanje svijeta oko sebe. Nepotpuni skupovi podataka, oštećeni podaci, loše nauke, lažni zaključci i kognitivna pristranost sve vas čine da se izgubite u magli.

Podaci padaju poput kiše. Kad je malo, to je divlje nezadovoljavajuće - tek toliko da uprljate svoj automobil i zbunite razgovor. Zateknete kako brišete mjesto na naočalama dok neko ispljuva neku slučajnu točku podataka, prikupljenu iz nekog opskurnog izvora.

  • Ustajala voda u plitkom ribnjaku je opasno. Podaci prikupljeni iz nepouzdane zalihe, niti pročišćeni ili normalizirani i ostavljeni da miruju, lako mogu dovesti do pogrešnih zaključaka.
  • A postojana kapljica vode može biti dovoljno za punjenje menze ili održavanje šumskog ekosistema. Samo tri podatkovne točke (broj poslanih e-poruka, naspram otvorenih i napuštenih) mogu održati marketinški program.
  • A zdraviji protok podataka u obliku malog potoka može se koristiti za kupanje. Kontinuirani protok podataka omogućava upoređivanje i povijesne usporedbe. Optimizacija odredišne ​​stranice može se postići stalnim podacima o konverziji.
    A skromna rijeka može pogoniti mlin za piljenje drva ili mlevenje pšenice. Mašini za preporuke potreban je samo pouzdan doprinos nekolicine pritoka kako bi se povećala vrijednost kolica za kupovinu.
  • A vodopad može pokrenuti ogromni vodeni točak, a dovoljan priliv informacija može pokretati dinamički sistem sadržaja u stvarnom vremenu.
  • A Reka koji je dovoljno širok i dubok može podržati čitavu transportnu industriju. Dovoljno podataka može plutati teglenicama i teretnim brodovima u obliku kolekcije kolačića s reklamnih mreža, agregatora podataka programa vjernosti i posrednika podataka.

Kada podaci stignu u očekivanim količinama u predviđenim vremenima, mogu se prikupiti, kanalizirati i staviti u upotrebu. Sistemi za navodnjavanje, brane i rezervoari pružaju osjećaj kontrole i omogućavaju izgradnju sve šire infrastrukture s kanalima, bravama i branama. Skladišta podataka izgrađena su na manje pouzdanim tokovima.

Čistoća je pored pobožnosti

Čista voda je vitalna za uspjeh života, navodnjavanje, pogon elektrana itd. Definicija „čista“ može se promijeniti u svrhu; U redu je ako u vodi ima algi koja hladi elektranu i nije prihvatljivo ako u vodi za piće ima više od 10 dijelova na milijardu arsena.

Podaci su isti. U prijavi za direktnu poštu nije važno da li imate titulu osobe (gospodin, gospođa, gospođa) ... osim ako ne šaljete poštu ljekarima. Ali prljavi podaci svaki put će vas saplesti.

Kao glavni američki naučnik za podatke, DJ Patil, stavite to na samitu CTO prvog kruga, „Ako od samog početka ne razmišljate o tome kako održavati svoje podatke čistima, vi ste f ^ ¢ & ed. Garantujem. Pokušaj čišćenja nakon činjenice potrajat će najmanje mjeseci. "

Ako vodu zagrijete do tačke ključanja, ona može pokrenuti cijelu industrijsku revoluciju. Čini se da podaci rade istu stvar. Od trenutka kada su računari mogli pohranjivati, kao i računati, podaci su se prikupljali onoliko brzo koliko je skladišna oprema mogla biti stvorena za to.

Jezero podataka

Kako se podaci s ovih pritoka provlače kroz mlinove motore, sve završava u jezeru, iza brane. Kako se podaci izdaju kontrolirano, oni pokreću turbine u industriji podataka; oni ogromni motori obrade podataka s imenima poput Googlea i Facebooka. Ovdje neće biti suše.

I, konačno, postoji dubok bazen vode koji čeka analitičara da zaroni. Skuba i koplje u ruci, analitičar istražuje dubinu, mapira novo tlo i otkriva nove vrste. Vrlo je uzbudljivo vrijeme biti istraživač podataka.

Zato se toliko njih pojavilo za eMetrics Summit od 2002. Sljedeća prilika je u Bostonu, od 27. septembra do 1. oktobra 2015.

Registracija eMetrics Summita

A Bridge Too Far

A kakva je moć podataka za urezivanje sljedećeg Velikog kanjona? Šta je sa glečerskim topljenjem strukturiranih podataka? Kako se odnosimo prema otpadnoj vodi u svijetu koji postaje sve više i više svjestan privatnosti?

To su pitanja za neko drugo vrijeme i voda ispod mosta.

Šta ti misliš?

Ova stranica koristi Akismet kako bi smanjila neželjenu poštu. Saznajte kako se podaci vašeg komentara obrađuju.