Az emberi számítás

Human 2 Human

Visszatekintő: Big Data

2015. március 24. - Pankotai Balázs

big_data.jpgVisszatekintő azoknak a bejegyzéseknek a gyűjtőneve, amelyeket régebben már elküldtem a kollégáimnak inspirációs levélként, de valamilyen okból most újra előveszek, és ha szükséges, persze aktualizálom is. Ezt az ajánlót eredetileg 2014. január 13-án írtam, és mostanság ismét a kezembe kerültek a témával kapcsolatos kutatások, amelyekről egy újabb bejegyzés fog szólni.

Figyelem, varázsszó következik: Big Data.

Arról írok ma nektek, miért ez a nagy hype felhajtás a téma körül mostanában,

hogyan érinthet ez minket, és hogyan keressünk szakembert ilyen feladatra.

Maga a kifejezés 2008-ban „keletkezett”, és mindazt a jelenséget értjük alatta, amikor nagy mennyiségű adathalmaz keletkezik, amely értékes információt (ezáltal összefüggéseket, ezáltal üzleti hasznot) tartalmaz, viszont olyan méretű, hogy a hagyományos módszerekkel sosem érünk az elemzésének a végére.

Nézzük, milyen mennyiségű is az az adat, amelyet napjainkban az emberiség és a gépek termelnek.

Naponta átlagosan 2,2 millió terabyte (1 TB=1024 GB) adat keletkezik a világban, ami kb. annyi, mint a civilizáció hajnalától mostanáig – bár, őszintén, sosem értettem, hogy az ilyesfajta becsléseket hogyan készítik. :)
Hogy mi számít adatnak? Minden, ami számítógépeken, telefonokon képződik, ami gépek közti kapcsolaton át jön létre (Machine to Machine, M2M), vagy amit különféle érzékelők jelei formálnak, illetve mindenféle kommunikációs csatornán létrejött kódolt hang, szöveg, kép, videó, stb.
Persze ebben redundancia is van bőven: pl. ugyanaz a téma több videómegosztón is jelen van. A You Tube-ra egyébként 1 másodperc alatt hetven órányi videót töltenek fel a felhasználók.

A tárolt adat mennyisége a becslések szerint 2020-ban 50-szer (!) annyi lesz, mint 2010-ben.

Annak illusztrálására, hogy miféle adatok képződnek, és milyen mennyiségben, két példát hoztam:

  • 2011-ben egy joghallgató kikérte a Facebook-tól a vele kapcsolatban tárolt adatokat. Több mint 1000 oldal PDF-et kapott.
  • Charles Radclyffe, a BIPB üzleti intelligencia tanácsadó cég vezérigazgatója nyilatkozta a következőt: "Ha valaki egy bank weblapjára közvetlenül egy szerencsejáték oldalról lép át, vagy azonnal a vásárlás gombra szokott kattintani, esetleg egy személyi kölcsönöket hirdető oldalon egyből a legmagasabb felvehető összeg paramétereit kéri le, akkor lehet, hogy kockázatos adós."  Jó tudni, hogy vannak oldalak, ahol még az egérmutató mozgását is megfigyelik, rögzítik.

Nos, ilyen mennyiségű az az adat, amellyel kezdeni kéne valamit, mert egyrészt versenyelőny származhat belőle, illetve ha nem használjuk, akkor meg minek gyűjtjük (tárolási kapacitáson lehetne spórolni).
Az USA-ban cégvezetőket kérdeztek, mi a tervük a Big Datával kapcsolatban idén. Több mint felük komolyabban szeretne a jelenséggel foglalkozni, erőforrásokat viszont kevesebb mint a fele  allokált ehhez. Azaz: szándék van, konkrét cselekvés viszont nem feltétlenül lesz.

A legtöbb szolgáltató vállalatnak ugyanolyan fontos a Big Data, mint az olyan nagyágyúknak, amilyen a Google (akinek lényegében az egész biznisze erre alapozódik), a Facebook vagy a LinkedIn. Képesnek kell lenniük folyamatosan követni, hogyan változnak a fogyasztóik szokásai (egyáltalán: maguk a fogyasztóik), illetve segíthet az új stratégiai irányok megalapozott kijelölésében.

Mi, HR-esek akkor lehetünk sikeresek, ha megpróbáljuk kitalálni, milyen tudás és készségek kellenek ahhoz, hogy az ilyen elképesztő nagy adatbázisok szűrhetőek és vizualizálhatóak legyenek. Akik ebben a legjobbak, azokat kell megszereznünk.

A feladat azért nem könnyű, mert olyan embereket kellene találni,

  • akiket nem tudjuk, hol keressünk, mivel ilyen felsőfokú képzés jelenleg nincs,
  • akiknek a szükséges készségeit egyelőre csak találgatjuk, mivel szerteágazó, amit (és ahogy) tudniuk kell,
  • akiknek homályos, hogyan tudjuk mérni a teljesítményét.

Ezzel együtt, a Harvard Business Review (2012 Oct.) szerint ez lesz a XXI. század legtrendibb munkája. (Vagy valami más, ami még nem is létezik, teszem hozzá szkeptikusan.)

Ha mégis össze kell szednünk, milyen fontos készségek, képességek szükségeltetnek egy ilyen munka ellátásához, én így kezdeném:

  • jól tudnak kódolni-dekódolni, és képesek gyorsan tanulni új technológiákat,
  • profik az adatelemzés elméleti hátterét illetően, azaz igen erősek statisztikában,
  • túl az elemzésen, jól tudnak adatokat verbalizálni, illetve vizuálisan megjeleníteni,
  • értik, hogy miről szólnak az adatok, képesek értelmezni őket.

Én azt hiszem, léteznek ezek az emberek. Nem túl sok, és ők majd drágán adják magukat. És minden, magát komolyan vevő szervezetnek meg kell majd őket fizetni.

Szóval ha a szomszédasszony kérdezi, szerintetek mi legyen majd a gyermeke, lehet egy tippetek. ;)

A bejegyzés trackback címe:

https://human2human.blog.hu/api/trackback/id/tr587299863

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.