NMI 2013: Data za limity Facebook Insights
Druhý ročník New Media Inspiration 2013 měl zajímavé tematické rozpětí zahrnující moderní gadgety, vliv porna na formování nových technologií i kyborgy. Primárně se však nesl v duchu využívání dat. Mnohé příspěvky se věnovaly největšímu společenskému fenoménu dneška v podobě prezidentské volby. Jiné toho měly více společného s byznysem. Mezi ty nejzajímavější patřila prezentace Jana Schmida z Perfect Crowd o získávání dat o fanoušcích na Facebooku.
Interest positioning na Facebooku
Profil zákazníka je velice důležitý. Přesto stojí často modely typického reprezentanta cílové skupiny spíše na odhadech, klasický výzkum je poměrně drahá záležitost a online metriky nám toho řeknou dost o pohybu uživatele po webu s pár demografickými údaji navrch, ovšem ne moc o tom, co dané lidi skutečně zajímá. Takové informace má Facebook, i správci facebookových stránek mají ovšem problém získat kompletní jmenný seznam fanoušků, natož udělat jejich hloubkový průzkum. Situace je ještě těžší v případě, že chcete zkoumat fanoušky u konkurence.
Jan Schmid představil řešení a několik typů, které vám cestu do hloubi duše facebookového uživatele umožní. Velice zajímavou informací je například to, že i jako řadový člen skupiny na Facebooku je pro vás dostupný seznam všech jejích členů. Například s uživatelsky přívětivým nástrojem Facebook API Explorer lze veškerý obsah FB skupiny stáhnout v podobě html kódu a dále jej analyzovat. Ilustruje to obrázek níže.
K další práci Schmid doporučil nástroj Google Refine, který umožní práci s daty i lidem, kteří se s nimi běžně nezabývají na profesionální úrovni. Z Facebook ID čísel dokáže udělat po přidání „facebook.com“ URL a jednotlivé adresy navštíví. Dostupné jsou mu samozřejmě jen informace, které jsou zároveň přístupné veřejnosti. Síla tohoto softwaru je v tom, že dokáže projít jednotlivé profily uživatelů po stovkách i tisících sám a stáhnout dostupná data. Z hlediska analýzy zájmů jsou důležité především „lajky“ stránek, ve změti dat je pak potřeba pouze rozklíčovat počet výskytů jednotlivých stránek.
Jak Schmid dál upozornil, stránky s největším počtem „lajků“ nemusí být zdaleka ty nejdůležitější. Obvykle neposkytují dostatečný vhled pro konkrétní cílovou skupinu. Mnohem zajímavější jsou stránky, které jsou zastoupeny ve zkoumané skupině častěji než mezi zbytkem uživatelů Facebooku. Specifičnost fanoušků můžete měřit dle jejich afinity, která vypovídá o míře jejich odchylky od běžné facebookové populace. Zkoumáním skupiny Práce v reklamě zjistíte třeba, že fanoušky Zdeňka Pohlreicha je 8 % jejích členů, zatímco u českých FB uživatelů to je několikanásobně více (pokud budeme věřit, že má český Facebook 3,8 milionů uživatel, pak to je 21 % - skutečných uživatelů je ale jistě méně). Míra afinity u tohoto tématu je tak vlastně menší než nula a nevypovídající. Nelze tedy usuzovat, že by byla hlavní postava gastronomické reality show pro danou cílovou skupinu nějak významná.
Při vytváření profilů fanoušků některého subjektu je potřeba zaměřit se především na ty zájmy / stránky, které je nějakým způsobem vymezují. Lze to ilustrovat na analýze fanoušků vybraných prezidentských kandidátů. Je však nutné zdůraznit, že se jedná o studii fanoušků facebookových stránek, ke kterým neměl sám analytik administrátorský přístup. Jan Schmid v takovém případě volí postup analyzování fanoušků, které může vidět. To jsou ti, co lajkují nebo komentují příspěvky dané stránky. Jedná se tedy jen o výsek z celého vzorku, na druhou stranu o ten aktivní, a tím pádem relevantní.
Na grafice níže jsou uvedené i stránky, které nejvíce odlišují fanoušky s nejčastějším výskytem u fanoušků Miloše Zemana od ostatních. Vpravo vedle horizontálního sloupce je uveden počet jejich fanoušků v tisících. Tato čísla mají určitou vypovídací hodnotu o masovosti vkusu, samotná povaha stránek pak naznačuje jejich zájmy a priority. Právě to, že uvedené hodnoty jsou celkem nízké, znamená, že fanoušci Miloše Zemana se příliš neliší od běžného uživatele Facebooku. Z hlediska brandu je Miloš Zeman lidovým kandidátem, jakousi „Škodovkou“.
Oproti tomu aktivní fanoušci Jiřího Dientsbiera tvoří určitou niche, velmi specifickou skupinu. Lze pozorovat překryv s aktivními podporovateli ČSSD, kteří sledují i ostatní čelní představitele strany. Zároveň je zřetelná i profilace směrem k určitému liberálnímu křidlu strany.
Větší vypovídací hodnotu než samotná velikost fanoušky lajkovaných stránek má jejich povaha. Pokud se budeme věnovat primárně nejdominantnějším lajkům stránek fanoušků dvou kandidátů 2. kola prezidentské volby, jsou zde patrné zajímavé rozdíly.
Fanoušci Miloše Zemana mají rádi charismatické osobnosti a tzv. hlásiče, autory zajímavých hlášek a slovních bonmotů.
Mezi médii je nejdominantnější televize Nova, zpravodajský kanál ČT24, Sport a Idnes.cz.
Lze nalézt i stránky, které ukazují na to, že se fanoušci Miloše Zemana snaží ušetřit a někteří z nich si i rádi zavzpomínají na socialismus.
Patrný je i jistý nesouhlas se stávající politickou garniturou i s rozvojem Islámu na území České republiky.
U fanoušků Karla Schwarzenberga lze nalézt částečný překryv v oblibě osobností. Přítomnost Václava Havla, Ivana Trojana nebo Pavla Lišky ovšem naznačuje jakési intelektuálnější vyvážení.
Oblíbená média fanoušků KS nejsou tak mainstreamová, přítomna je obliba iHNED.cz i Respektu. Tyto tituly doplňuje časopis Reflex a ČT24.
Oblíbené stránky uvedené níže naznačují, že mezi fanoušky KS je mnoho mladých. Voliči Vladimíra Franze v prvním kole prezidentské volby se pravděpodobně přikloní v kole druhém ke Karlu Schwarzenbergovi.
Jan Schmid také poukazuje na to, že forma nostalgie po starých dobrých časech není formována u fanoušků KS ani tak politicky, ale spíše zážitkově, pohledem dětských očí.
Relevance analýzy
Prezentace vyvolala mezi profesionály v publiku debatu o úrovni relevance představené analýzy. Položili jsme proto Janu Schmidovi dodatečné dotazy.
Vaše prezentace vyvolala velké ohlasy. Ty negativní zpochybňují relevanci především u analýzy facebookových stránek, u kterých není zkoumán kompletní vzorek fanoušků, jako to je možné u skupin. Měli jste nějaký limit proporční relevance (např. u stránky s 1000 fanoušky cíl prozkoumat 100 fanoušků, u stránky s 10000 fanoušky prozkoumat 1000 fanoušků…)?
U analýzy stránek se skutečně spoléháme na zkoumání aktivních uživatelů, tedy těch, co na Zdi konkrétní stránky lajkovali či komentovali příspěvky. Proporční klíč nepoužíváme. U menších stránek do 1000 fanoušků je zkrátka třeba zkoumat velkou část fanouškovské báze. Ve skutečnosti bývá minimální počet zkoumaných fanoušků kolem 500, v případě velkých fan page kolem 1 600.
Ovšem praxe i teorie statistiky ukazují, že nezáleží na tom, jestli je zkoumaných fanoušků 600 nebo 6000, výsledky jsou zcela stejné. Například občas ze vzorku o 1600 fanoušcích speciálně vyčleníme ty, kteří nejen lajkovali, ale zároveň i komentovali. Dozvíme se tak, jaký typ fanoušků současná komunikace stránky vybudí ke komentování. Přestože se může jednat o menší část, kolem 250 fanoušků, tak až na fakt, že jejich analýza nám prozradí, že se jedná o obecně aktivnější uživatele, jsou v ostatních ohledech zcela stejní jako zbytek báze.
Jaké jsou jiné tradičnější varianty výzkumu (online i offline) zaměřující se na vytvoření profilu zákazníka / profilů zákazníků?
Pokud bych bral v potaz výzkumy, které zobecňují na úrovni čísel, a nikoli kvalitativních poznatků, tak především tak zvaná U&A studie (usage and attitudes). Jejich součástí bývají i segmentace trhu podle typu zákazníků, například podle jejich hodnot, životního stadia apod.
Vedle nich jsou zde kvalitativní výzkumy, kdy si zástupce cílové skupiny pozvete do studia a vedete s nimi skupinový či standardizovaný rozhovor. Takový výzkum je autentičtější, ale zase neumí kvantifikovat.
Dokážete tradičnější výzkumné metody porovnat časově a finančně s Vámi popsaným data miningem přes Facebook?
Jedná se o poměrně rozsáhlé výzkumy, které mapují cílovou skupinou podle postojů, demografických údajů a využívání kategorie. Nevýhodou je jistě cena (bývá o řád vyšší) i fakt, že tvrzení respondentů nelze ověřit. Problematická může být i rekrutace správných respondentů. Například sehnat 500 kluků, kteří jezdí na skateboardu a jsou ochotni vyplnit dotazník, je v ČR prakticky nemožné. Výhodou těchto klasických výzkumů je, že se můžeme zeptat, co vás konkrétně zajímá, a poměrně jasná metodologie.
Vzhledem k tomu, že interest positiong nevyužívá respondenty, ceny jsou o řád nižší než u klasického výzkumu.
Jaké jsou výhody a nevýhody ve srovnání s tradičním výzkumem? Já spatřuji ten nejzřejmější benefit v tom, že se člověk neptá, ale zkoumá, co už o sobě někdo dobrovolně řekl vlastním činem / fanouškovstvím na Facebooku. Oproti tomu u face-to-face výzkumů odpovídají lidé hodně podle toho, jak by chtěli být vnímáni.
Přesně tak, přičemž rizikem není ani tak, že by respondenti nemluvili pravdu, ale že se jich ptáme na nerelevantní témata. Nedozvíme se, co je přirozeně zajímá. Už samotné otázky vytváří jakési mantinely toho, co se dozvíme. V tomto si je interest postioning jistější, protože se neptá, pouze se dívá.
Jako nevýhodu interest positioningu na Facebooku vnímám, že všichni fanoušci nejsou zákazníky (dle výzkumu DBB to je jen 84 %) , zatímco při dotazování své zákaznické báze tzv. „mluvím k svým“. Sdílíte také tento náhled?
Vztah LIKE vs. VYUŽÍVÁNÍ je myslím dobré mít vyjasněný. V Perfect Crowdu hovoříme o interest positioningu, protože víme, že mapujeme zájmy. Výzkumník si musí určit, zda ho bude zajímat zvířecí složka člověka nebo kulturní, zájmová.
Pokud chápeme člověka pouze jako chytřejší opici, pak jako opice máme určitý způsob zvířecího, hluboce zakořeněného chování. Z hlediska lidského chování má smysl studovat uživatelská data v aplikacích, optimalizovat web z hlediska jednoduchosti apod. Ovšem zabýváme se chováním, a ne jednáním. Ale jako kulturní bytosti jednáme. Což znamená, že svému konání na rozdíl od chování dáváme nějaký smysl. Neponocujeme, protože se nám nechce spát (chování), ale protože to má nějaký smysl – musíme dokončit práci, abychom byli dobrými zaměstnanci, abychom získali respekt od ostatních, abychom splnili očekávání našich rodičů atd. atd. Projevem smyslu v jednání je zájem.
A právě to nás zajímá. LIKE je jednání, lajkuju, protože mám zájem:
a) vypadat lépe před ostatními, b) vyjádřit, že se mi to líbí, podpořit to, c) dát najevo, že mi na někom záleží, d) být informován, protože danou službu využívám apod. Asi bychom našli další smysly. Nedávno jsem třeba narazil, že mezi fanoušky jedné stránky je hodně fanoušků Ferrari. Jednalo se o užitečnou informaci, která nám v kontextu jiných výsledků o těch klucích pověděla, o čem sní a co respektují. Vlastníky Ferrari bych mezi nimi ale nehledal.
Jeden z workshopů London in Prague vedl britský planner, John Griffiths, a vysvětloval nám: "Musíte pochopit jednu věc. Když máte uhrovatého kluka, který hraje PC hru ve svém dětském pokoji za postavu nějakého Vikinga, tak ten Viking Vám o tom klukovi řekne více, než když se budete na kluka obracet jako na uhrovatýho puberťáka". Myslím, že to je pěkné vyjádření, o co v interest positioningu jde.