New Media Inspiration 2018: Proč Big Data selhávají
Na konferenci New Media Inspiration, která proběhla minulou sobotu 3. března v prostorách ČVUT v Praze, byla Big Data nejskloňovanějším pojmem hned za umělou inteligencí a strojovým učením. Jan Romportl (O2 Czech Republic) ve svém příspěvku upozornil na rozdíl mezi analýzou a vědou. Na Big Data totiž „obyčejná“ analýza nestačí. Je zapotřebí k nim přistupovat vědecky a mít k dispozici opravdu špičkové „data scientists.“ Big Data jsou vám totiž k ničemu, když je neumíte správně zpracovat a využít:
„...co jsem já tak jako pochopil za svoji činnost v O2 je, že Big Data jako takový jsou bezcenný. ...je zapotřebí přistoupit k jinému přístupu, než klasický ‘mám Big Data, ono to z toho vypadne samo,’ a to k přístupu Data Science…Big Data jsou nějakou formou otisku světa...věda vytváří mapy nad teritoriem….a pak nad těma mapama vytvářet hypotézy, ty testovat...a vytvářet nad tím nějaké prediktivní modely, toho co se v té realitě může stát...” (J. Romportl)
Jan Romportl. Zdroj: Internet Info
Obrovský rozvoj výpočetního výkonu a zdokonalení algoritmu pro strojové učení umožnily propojení Big Data a umělé inteligence (AI). Používají se k řešení běžných problémů – od fungování internetových vyhledávačů, přes automatické překlady, rozpoznání spamu, až po kontextové reklamy apod. V korporacích pak slouží hlavně k automatizaci - zpracování zákaznických dat, automatizaci rozhodování a nahrazení některých analytiků.
60 % Big Data projektů selhává
Gartner report ukázal, že až 60 % projektů, které využívají Big Data, selhává. Neoficiální čísla pak hovoří o 85 %.
We were too conservative. The failure rate is closer to 85%. And the problem isn't technology. https://t.co/ZdG7RRBKF2
— Nick Heudecker (@nheudecker) 9. listopadu 2017
Big Data jsou nutná pro strojové učení umělé inteligence. Jan Janča (Gauss Algorithmic) proto označil umělou inteligenci za pouhý buzzword (aktuálně populární označení, pozn. red.) skrývající Big Data. Než se však data mohou použít v AI, je nutné je řádně očistit, zvalidovat, normalizovat, vytřídit, sloučit, deduplikovat a tak dále:
“Pokud nejste dobří v datové analýze, tak v žádném případě neuspějete, ať jste jakkoliv dobří v umělé inteligenci.” (Jan Janča)
Jan Janča. Zdroj: Internet Info
Použití umělé inteligence je atraktivní, protože urychluje, usnadňuje, snižuje riziko a zvyšuje konkurenceschopnost. Podniky si ale neuvědomují, že její využití je stále na úrovni výzkumu, a tedy velmi náročné a drahé. Propast v adopci nových technologií, která přichází ve fázi splasknutí bubliny přemrštěných očekávání lze překonat jedině tak, že selžou všechny ostatní projekty. S tímto rizikem nelze nic dělat. Záleží tedy jen na vašem vztahu k riziku.
Cyklus zavádění nových technologií. Zdroj: Prezentace Jana Janči na NMI, 3. 3. 2018
Lepší je malý a dobře definovaný projekt
Základní kámen úrazu a příčina selhání projektů využívajících AI jsou přehnané ambice, které plynou z nedostatečného vzdělání a zkušeností v oboru. Chybí vědecký přístup, který by generoval a ověřoval hypotézy – nikdo neřeší, zda je projekt dosažitelný. Plánují se příliš velké projekty, pro které je potřeba spolupráce velkého počtu lidí, a kde hrozí mnoho chyb. Mezní termíny pro spuštění/generování výsledků jsou pak zcela mimo realitu.
Nevymýšlíte náhodou kolo?
Počet lidí, kteří mají potřebné vzdělání, talent a zkušenosti v oboru, je příliš malý. Vybudovat kvalitní tým je náročné, a hlavně velmi drahé. Rozpočet tedy může dojít ještě dříve, než přistoupíte k vlastnímu řešení projektu. Ti nejlepší se také velmi neradi vážou na jeden problém. Než začnete hledat vlastní tým zjistěte si, jestli váš problém už dávno nevyřešil někdo jiný.
Kvalita dat až na prvním místě
Nepodceňujte zapojení odborníků z praxe do datové analýzy. Neúplná integrace, špatné vyčištění a závislost jen na interních datech mohou mít pro váš projekt fatální důsledky.
Velké datové sety jsou náročné na výpočetní výkon. Pokud tedy používáte starší technologie je možné, že na zpracování nebudou mít kapacitu. Není nutné hned kupovat kompletně nové vybavení, ale nejprve si zanalyzujte náročnost jednotlivých úkolů – některé mohou být zpracovány například formou SaaS (Software as a Service, Software jako služba).
Jak dlouho je dost dlouho?
Někteří očekávají výsledky hned, jiní na ně čekají zbytečně dlouho. Umělá inteligence se nejprve učí z poskytnutých dat, pak se vývojáři učí z chyb, zatímco se vedení chystá projekt uzavřít jako neúspěšný, aniž by mu dal dostatek času. Vše opět vychází z nesprávného přístupu – AI jako zdroj rychlých zisků, namísto inovativní vědecké investice.
Stejně je to všechno jen marketing
Tomáš Mikolov. Zdroj: Internet Info
Tomáš Mikolov (Facebook) už na samém začátku konference zdůraznil, že je umělá inteligence ve velké míře hlavně marketingový trik. Mluví o ní kde kdo, nikdo jí pořádně nerozumí a hlavně se v posledních dekádách nikam neposunula. Konkrétně uvedl:
"...někteří lidé se snaží vytvořit dojem, že jsme udělali obrovský skok v umělé inteligenci...souhlasím se závěrem předchozí přednášky, že se za posledních 10-20 let vlastně nic neudálo, máme jen lepší data sety, lépe rozumíme těm technikám, jak natrénovat dobré klasifikátory a nějaký malý inkrementální pokrok tam je, ale neumíme řešit fundamentálně nové úlohy..."
Ač umělá inteligence generuje 90 % zisků společností, jako jsou Google či Facebook, filmové scénáře o převzetí nadvlády nad lidstvem v dohledné době nehrozí. Umělá inteligence se dokáže naučit mnoho, ale jazyku není schopná porozumět – i když píše básně:
VESMÍR
láska je jako hvězdná obloha
pocit nekonečna
jediná ukončí zlo
co tě tak trápí
Zdroj: Poezie umělého světa, Jiří Materna (resp. počítač za pomoci neuronových sítí)
Elon Musk už několikrát varoval, že umělá inteligence může zničit svět. Dle Tomáše Mikolova to je ovšem jen „marketingový trik”. Většina řečníků se shodla, že AI není ani zdaleka na tak pokročilé úrovni, jako je veřejnosti běžně předkládáno, a podobná proroctví jsou tak více než předčasná. Nemáme se tak ničeho bát. To, že se Alexa od Amazonu sama od sebe směje, je jen chyba v programu, nikoli příznak vlastního vědomí.
Kam dál?
Podle Tomáše Čupra z Rohlik.cz by robotizace měla přinést zjednodušení provozu, zlepšení služeb zákazníků, ušetřit náklady a také nahradit některé pracovní pozice. V budoucnosti by rád využíval i autonomní vozy pro doručení nákupů. Podívejte se, jak by mohla umělá inteligence a roboti pomoci maloobchodu v článku Retail Summit 2018: Rozvíjejícím se trendem je robotizace a s ní související změny v obchodech