2018-ban is dataSTREAM!

Exploring data - Inspiring business

Időpont: 2018. április 24.
Helyszín: Gerbeaud Ház


A cégek a folyamatosan növekvő mennyiségű adataikat újabb és újabb módszerekkel, technológiákkal igyekeznek feldolgozni, hogy a megfelelő termékeket alakíthassák ki, megjósolják az ügyfeleik viselkedését vagy felfedezzenek csalásgyanús ügyleteket. Új, korábban nem használt adatforrásokat kezdenek elemezni, hogy még több információhoz jussanak az ügyfeleikről.

Mit hozott a data science az üzletbe? Vajon a klasszikus módszerek vagy az új technológiák hatékonyabbak? Hol a data science helye a nagy szervezetekben?

Az idei dataSTREAM konferencián ezekre a kérdésekre keressük a választ, és megmutatjuk, milyen klasszikus és új elemzési módszereket használnak ma a cégek.

Ízelítő programunkból:

  • Körmendi György, a Clementine ügyvezetője idén is beszél a trendektől, újdonságokról és a jövő technológiáiról
  • Dr. Reinhold Engelbrecht, az IBM Digitial Business Automation európai szakértőjének előadásában a robotizált folyamat-automatizáció (RPA, Robotic Process Automation) jelentőségével, alkalmazási területeivel és esettanulmányokkal ismerkedhetünk meg
  • Molnár Sándor, az Ariosz Kft. üzletágvezetője az okos technológiákon alapuló lehetőségekről fog beszélni az energetika szektorban, illetve bemutat egy újfajta koncepcionális megközelítést a energiafogyasztói magatartásváltozás motiválására
  • Bemutatkozik a Watson Studio!
  • Az 50 éves az SPSS! Könyves Tóth Előd, a Clementine szakértőjének előadásában
  • Érdekes esettnulmány: Fiktív cégek azonosítása cégadatok elemzésével Kovács Gyula (Andego) előadásában

 

Teljes program

Videóanalitika és az adatbányászat

A márciusi Clementine dataStream meetup középpontjában a videóanalitika, az így rögzített nem strukturált adatok feldolgozási lehetősége állt.

Az előadók számtalan konkrét megoldással, gyakorlati példával mutatták be a jelenlegi technológia lehetőségeit.

  1. Németh Zoltán, a Ustream senior engineering managere a videó analitika jelen fejlettségi szintjét sporteseményeken készült felvételekkel mutatta be: Wimbledoni tenisz mérkőzések, a US Open vagy éppen egy golf mérkőzés elemzésén keresztül. A gyakorlati példákon keresztül fény derült a broadcasting cégek iránti elvárásokra, valamint a jövő fejlődési lehetőségeire is.

  2. Boa László, az IBM képviseletében az utcai kamerák által rögzített tartalmakat elemezte, méghozzá kiemelten a brazíliai Rio de Janeiróban megrendezett 2016. évi nyári olimpiai játékok segítségével. Az ott működő kamerarendszert és a képekből levont következtetéseket ugyanis az IBM szakértői működtették, és a videó analitika segítségével vontak le következtetéseket: hány fő tartózkodik egy-egy helyszínen, milyen csoportosulások várhatóak, vagy éppen hogyan lehet valakit azonosítani anélkül, hogy látszódna az arca.

    Szó esett még a közlekedésben rögzített felvételek feldolgozási lehetőségeiről, az ezekből levont következtetések feldolgozásáról. Az ilyen és ehhez hasonló közbiztonsági megoldások ma már egyre elterjedtebbek, aktívan segítik a bűnmegelőzést.

  3. Fülöp Péter Gergely, az NRC marketingkutató cég UX kutatója a szemmozgás-követéssel foglalkozó kutatásuk eredményeit mutatta be. A hirdetéseken vagy éppen a honlapokon elhelyezett információk hatását szemkamerával mérték, így derült ki, hogy hova néznek a fogyasztók, hol találhatóak az ún. vakfoltok stb. Példát láthattunk arra is, hogy hogyan változik az eltelt másodpercek alatt az információ befogadása, valamint mit nézünk meg egy-egy videós tartalomban. Utóbbit maguk az NRC munkatársai prezentálták egy szemmozgást mutató videóban: Magyarország image filmjét nézték végig, majd elemezték Spotlight Plus szoftveres megoldásuk segítségével. 

dataSTEAM meetup márciusban: Videó elemzés

Tavaszi meetup sorozatunk középpontjában a nem strukturált adatok állnak: hang, szöveg, kép, videó, azaz minden, amit hagyományos adatbányászati eszközökkel nem tudunk feldolgozni.

Előző meetup-unk alkalmával a hang és a beszéd feldolgozásának technológiáiról volt szó, most pedig a videoanalitika, a videók tartalmának elemzése lesz a téma.

A videó analitika célja időbeli és térbeli események azonosítása és elemzése, automatikusan videó tartalmakon. A képrögzítő technológiák fejlődésének köszönhetően egyre bővülnek az alkalmazási területek: az egészségügytől a kereskedelmen át a bűnmegelőzésig és rendvédelmi területekig számos iparágban már használnak ilyen technológiát. Legismertebb alkalmazások például a rendszámfelismerés, az arcfelismerés, tárgyak követése, viselkedés elemzés és még sorolhatnánk. Ezek közül ismerhetünk meg néhányat közelebbről.

Előadások:
1. Watson video analitika – Németh Zoltán, Ustream, senior engineering manager
Az IBM (jelentős részben a Ustream felvásárlásnak köszönhetően) egyre erősebben jelen van az online video piacon, kézenfekvő volt tehát a Watson AI képességeit is bevetni ezen az új területen. Ezt az új technológiát szeretném röviden bemutatni, néhány érdekes esettanulmánnyal. Például a Wimbledoni tenisz mérkőzések elemzése, vagy automatikus klipek készítése a US Openről.

2. Utcai kamerák rögzített tartalmának elemzése – Boa László, IBM
Autók súly és méret meghatározása az utcai kamerák képének elemzésével.

3. Eye tracking módszerek

Az előadások után lehetőség nyílik informális kapcsolatteremtésre az érdeklődők számára.

Tényleg mindent visz a „Fekete Péntek”?

Évről évre egyre nagyobbat robban, miközben fenekestől felforgatja a vásárlási szokásainkat – a Black Friday ma már megkerülhetetlen tényező a karácsony előtti időszakban. De vajon tényleg akkora népszerűségnek örvend? Megnéztük!

A Magyarországon 2013 óta jelen lévő, amerikai mintára átlagon felüli árkedvezményeket kínáló nap tulajdonképpen a karácsonyi bevásárlási szezon kezdetévé vált az elmúlt években.
Nem meglepő módon ilyenkor aktívak vagyunk a közösségi médiában is, így adatbányászaink megvizsgálták, hogy vajon milyen hashtag-ek jelennek meg a Black Friday kapcsán, mit vásárolunk, ki kommunikál egyáltalán, vagy éppen mit teszünk, ha mégis elkerülnénk. Elemzésünk során azt vizsgáltuk, hogy milyen kifejezéseket társítunk a #blackfriday hashtag mellett, és azokból milyen következtetések vonhatóak le szöveganalitikai módszerekkel.

Egyértelműen látszik például, hogy a 2017-ben november 24-re eső pénteki esemény előtt már egy héttel megkezdődött az akciók kommunikálása, kitartva egészen a Fekete Pénteket követő vasárnapig. Utóbbi annak is köszönhető, hogy sok cég már három napon keresztül kínálja kedvezményeiket, így a Black Friday ma már egyre inkább Black Weekend. A vizsgált posztokból az is kitűnik, hogy a tartalmak túlnyomó többsége (90%) az eladóktól származott, a vásárlói élmény - mint például a „Nézd ezt vettem a #blackfriday-en...” jellegű beszámolók jóval elmaradtak a boltok reklámjaitól.

Clementine BlackFriday infographic

Mit vásárolhatunk ilyenkor? Ma már szinte minden megtalálható a kínálatban, ugyanakkor a műszaki cikkek magasan vezetik az eladott termékek listáját. Ezen felül a ruházati termékek, lakberendezési tárgyak, kozmetikumok és a hobbi felszerelések is népszerűek a kedvezménnyel kínált lehetőségek között.

De mégis mekkora árengedménnyel kalkulálhatunk? 2017-ben az az esetek harmadában 20%-os kedvezményt kínáltak, ennél alacsonyabb engedményt csak 5%-ban kommunikáltak. Népszerűek még az 50%-os akciók, az esetek negyedében ezzel van dolgunk. Érdemes tehát készülni rá, élni vele!
Aki pedig a társadalom azon felébe tartozik, akit idegesít a felhajtás, akkor sincs gond, a hashtag-ek kiváló ötleteket adnak arra vonatkozóan is, hogy mit érdemes csinálni helyette: a pihenés, a kirándulás, de még a kutya sétáltatás is jó alternatíva lehet!

Sokszínű adatok

A 2017-es conTEXT konferencia a hagyományoknak megfelelően a legújabb szöveganalitikai megoldásokról és lehetőségekről szólt, a beszédtechnológia, a sportanalitika, a mesterséges intelligencia vagy éppen a kognitív alkalmazások oldaláról.

A teltházas rendezvény megnyitójában Körmendi György, a Clementine ügyvezetője a szöveganalitikai helyzet változásairól beszélt, mely az elmúlt egy évben is számos újdonságot tartogatott. A chatbotok működését, az interfaceket, vagy éppen a teljes technológiát befolyásoló újdonságok és lehetőségek bemutatásával komplex képet kaptunk az iparág helyzetéről, a felmerülő „merre tovább?” kérdésekről.

Dévényi Edit, a K&H csoport analitikus CRM osztályvezetője 10 olyan megoldást mutatott be, amelyen keresztül a szöveganalitika támogathatja a CRM működését, illetve hozzájárulhat az ügyfélélmény javításához. Megoldásai között szerepelt a chatbotok használata, a geo- és hálózatanalitikai megoldások alkalmazása továbbá a felhasználók érzelmeinek, élményeinek és egymásra vetített hatásainak vizsgálata is. Az általa bemutatott megoldások nagyban segítik azokat az elemzési folyamatokat, amelyek az ügyfél számára legmegfelelőbb ajánlat kidolgozásra hivatottak.

Vada Gergely, a Fusion Vital alapítója előadásában strukturálatlan humán fiziológiai adatok elemzésén alapuló esettanulmányokat mutatott be a profi sport, a fegyveres erők és a civil élet területéről. Kutatásaik, projektjeik során ugyanis szívdobbanások milliárdjainak elemzésén keresztül vizsgálták, hogy mit jelentenek a gyakorlatban azok az elvont fogalmak, mint „sportolói teljesítőképesség”, „ismételt bevethetőség” a katonaságnál vagy „egészséges életvitel” a mindennapokban. Mint kiderült, a pulzusvarianca elemzésével rengeteg értékes adat kinyerhető: a fizikai terhelés, a restitúciós folyamatok eredményessége, az éjszakai regeneráció vagy a mentális felkészültség mind-mind megmutatkozik a pulzus mintázatában, amely ma már könnyen hozzáférhető. Ráadásul nem csupán sportolás vagy egyéb terhelés közben, hanem az új technológia segítségével hasznos információk gyűjthetők a sportoló mindennapjait 80%-ban kitevő, az edzők által közvetlenül kontrolálhatatlan, korábban homályban maradó időszakokról, tevékenységekről (szabadidő, alvás, étkezés, életmód, munka, pihenés, pszichés sajátosságok) is.

Boa László, az IBM cloud architect szakértője Watson chatbot implementációk tanulságairól beszélt. Olyan gyakorlati példákat muatott be, amelyek a mindennapjainkra is nagy hatással vannak, például a vércukormérés területén. A páciensek ugyanis adataik segítségével már nem csak valós idejű betekintést kapnak állapotukba, de Watson segíthet előrejelzéseket készíteni, vagy éppen a kritikus döntések meghozatalában. Az ilyen és ehhez hasonló, személyre szabott megoldások ma már egyre szélesebb körben és egyre több szektorban elterjedtek, miközben kiválóan integrálják az analitikai, mobil, közösségi, biztonsági és felhő technológiákat.

Pancza Judit, a Clementine szöveganalitikai szakértője sorra vette az IBM SPSS Modeler valamint a Watson Explorer hasonlóságait és eltéréseit, a szótáralkotás, a vizualizáció, a felhasználók vagy éppen az alkalmazási lehetőségek szemszögéből. Az így kialakult összehasonlítás nyomán egy speciális demot mutatott be, amely - hibrid megoldásként - a két szoftver legjobb tulajdonságait ötvözve képes hatékony szöveganalitikai elemzésekre, valamint azok vizualizálására


Fegyó Tibor, a SpeechTex ügyvezetője előadásában bemutatta, hogy hol tart jelenleg a magyar nyelvű élőbeszéd leiratozása, milyen speech-to-text eljárások léteznek, ezek milyen erősségekkel illetve hiányosságokkal bírnak. Emellett megismertette a jelenlévőkkel a speech-to-text egy érdekes és összetett fejlesztési területével, a sport közvetítések valós idejű leiratozásával. A gyakorlati életből hozott példáin keresztül láthattuk, hogy milyen komplex és egyben szakterület specifikus tudással kell rendelkeznie egy programnak már egy futballmeccs pontos leiratozásához is.

Sztahó Dávid, a BMT TMIT kutatója újra megerősített mindenkit abban, hogy a beszédünkben rejlő nem-verbális információ sok mindent elárul rólunk. A beszéd a természetes kommunikációnk egyik alapvető eszköze, ám ezen kívül a hangok képzését befolyásolja a mindenkori egészségi és érzelmi állapotunk is. Az előadás során a résztvevők megismerhették a hang-alapú érzelem azonosítás során fellépő feladatokat, a felismerés információtechnológiai folyamatát, az alkalmazás gyakorlati problémáit, valamint a jelenlegi state-of-the-art megoldásokat. A gyakorlati alkalmazási területek és a felmerülő gyakorlati problémák bemutatása betekintést nyújtott a téma iránt érdeklődők számára.

A Precognox képviseletében Ilyés Virág (Data Scientist), Katona Eszter (Junior Data Scientist) valamint Varjú Zoltán (Head of Data Science) mutatták be tartalomelemzési kutatási projektjüket. Azt mindenki tudja, hogy a sajtóban megjelenő cikkek nem csak szöveges információt tartalmaznak, egy írás nem csak nyelvi, hanem képi eszközökkel is él. De vajon ugyanolyan módon tematizálják-e az egyes híroldalak szöveges és képi tartalmai a tárgyalt témákat? Kutatásuk során a migrációs válság kapcsán a hazai online médiában megjelent több mint negyvenezer cikket és a hozzájuk tartozó majd' tízezer képet elemezték, hogy megtudják a választ az author-topic model eljárás segítségével.

A konferencia zárásaként Máté Anna, a Clementine elemzője a nyári slágerek világába kalauzolt mindenkit – természetesen a szöveganalitika irányából. Kutatásában a dalszövegekből létrehozott adatbázis az SPSS Modeler szoftverben került tisztításra, -rendszerezésre, majd a Text Analytics megoldás segítségével specifikus szótárt készített. Előadásában ezen szótár létrehozásának kihívásait részletezte a magyar nyelvben található egyalakú- és hasonló alakú szavak, a homonimák vagy éppen a több jelentés problémájának kiszűrésével. A megoldásokat három irányból is bemutatta: szinonima, kézi szabály valamint szófaj alapján. Az elemzés végére pedig az is kiderült, hogy milyen szavakat, kifejezéseket használnak a magyar könnyűzenei élet szereplői a legmenőbb nyári slágerek megalkotásához.

Data science a piackutatás területén

Szeptember 26-án, kedden 16 órakor folytatódott a „Ha nagy leszek data scientist leszek! De hol?!” meetup sorozatunk, ahol ezúttal kifejezetten a piackutatás területén zajló adatelemzési gyakorlatokba tekinthettünk be

Az új helyszínen, a Kaptár Budapest termében megtartott rendezvény érdekes témákat tartogatott:

  • Pancza Judit, a Clementine szöveganalitikai szakértője gyakorlati példát hozott, melyet az IBM SPSS Modeler segítségével prezentált. A FINA vizes világbajnokság alatt született bejegyzésekben szavak, kifejezések, hashtegek gyakoriságát, a tendencia alakulását vizsgálta – most pedig a meetup résztvevőinek a konkrét folyamatot mutatta be.
    Aki esetleg lemaradt az előadásról, annak ajánljuk figyelmébe a projekt rövid összefoglalóját: http://www.clementine.hu/hirek-2/igy-szurkoltunk-a-vizes-vb-alatt
  • Máté Anna, a Clementine elemzője szintén egy szöveganalitikai projekttel készült, méghozzá a rádiós slágerlisták világából. Kutatásában a dalszövegekből létrehozott adatbázis az SPSS Modeler szoftverben került tisztításra, -rendszerezésre, majd a Text Analytics megoldás segítségével specifikus szótárt készített. Az elemzés végére pedig az is kiderült, hogy milyen szavakat, kifejezéseket használnak a magyar könnyűzenei élet szereplői a legmenőbb nyári slágerek megalkotásához.
    Érdekel a téma? További információ itt: http://www.clementine.hu/hirek-2/szoveganalitikaval-slagert-lehetseges
  • Molnár Sándor, az Ariosz energia üzletágvezetője egy nemzetközi fogyasztásváltozás-vizsgálat tapasztalatairól számolt be egy okosmérés kutatás bemutatásával. Konzorciumi vezetőként az Ariosz szakemberei a projekt során a fogyasztói szegmentációt végezték el, méghozzá metaklaszterezési eljárással. A cél az volt, hogy azonosítani tudják a tipikus fogyasztói mintázatokat, majd őket perszonalizált kommunikációval érjék el.
  • Szerencsés Tibor, az IPSOS üzletfejlesztési vezetőjeként és tapasztalt kutatóként a piackutatás egészéről, az új trendekről tartott bemutatót, konkrét példákkal színesítve: online eye tracker megoldások, vásárlási élmény a virtuális valóságban.
  • Könyves Tóth Előd, a Clementine szakértője az IBM SPSS Statistics verziófrissítése kapcsán mutatta be annak újdonságait, kifejezetten a bayes-i és hagyományos statisztikai eljárások különbségeire fókuszálva.

A gyakorlati bemutatók már az előadások közben kérdéseket generáltak, majd a hivatalos program végén további érdekes beszélgetésekre került sor. A meetup sorozatunk hamarosan folytatódik, a következő dátumért és további információért érdemes honlapunkat böngészni: clementine.hu/datastream