Big Data og Intelligent transport går hånd i hånd
I de senere år har der været en øget fokus på fremtidens intelligente transport ved at skabe klare, grønne og integrerede transportsystemer både på europæisk og på nationalt plan. Mange større byer har massive problemer med fx overbelastning og oversvømmelser. Dette, sammen med ambitiøse klimamål, er årsager til behovet for at genoverveje, hvordan gods- og passagermobilitetsløsningerne kan struktureres på nye smarte måder ved brug af Big Data og nye teknologier (Københavns Kommune, 2017). I Danmark har Københavns Kommune øremærket 60 mio. kr. til intelligente transportsystemer mellem 2014-2018. Et af initiativerne, CITS (Copenhagen Intelligent Transport System), vil understøtte intelligent transport med Big Data om brugerkoordinater, for derved at forstå brugeradfærden bedre.
Den øgede vægt på SMART-sensorteknologier og Big Data er nødvendig, men ud over disse teknologier giver Big Textual Data os adgang til en ny datakilde, der med tekstanalyser skaber grundlag for en innovativ teknologi til at forstå brugerens meninger og præferencer. Tekstbaseret datamining og nye datakilder har, når de integreres med den eksisterende digitale infrastruktur, potentialet til at give øget viden om forsyningskæden og en forbedret supply chain management. Det skyldes, at de involverer – og lægger stor vægt på – brugerens og forbrugernes rolle, deres feedback, meninger og følelser, og det hjælper til at genetablere forsyningskæden på en holistisk og sammenhængende måde.
Fra tekst til tal med nye teknikker
Forskellige datastrukturer findes i de forretningsmiljøer, som normalt bruges af beslutningstagere til at understøtte deres beslutninger. Nogle af disse data er tilgængelige i databaser og i forskellige regneark formater og betragtes ofte som strukturerede data. Den overvejende type af data, der er tilgængelig i organisationer, er dog tekstdata. Ifølge Gartner (2013) er 80% af organisationens samlede informationskilder ustrukturerede data. Tekstdata fra kilder som Twitter, Facebook, Google maps, blogs, Trustpilot, avisartikler og e-mails kan klassificeres som Big Textual Data.
Text Analytics er anvendelsen af algoritmer og metoder fra forskellige nærliggende data-fagfelter med det formål at finde nyttige mønstre. Text Mining er et relativt ungt forskningsområde, der har udviklet sig inden for de sidste 20 år som et tværfagligt forskningsfelt. Text Mining er integreret med Natural Language Processing (NLP), informationsudvinding og knowledge management, informationsindsamling, machine learning og menneskelig computerinteraktion (Tolkin 2016). Text Analytics beskriver teknikker til analyse af ustruktureret tekstdata, og til at omdanne tekst til tal ved at anvende avancerede algoritmer på den store mængde data og for at gøre teksten tilgængelig. I det væsentlige kan tekstanalyser opdeles i syv øvelsesområder, som alle er afhængige af interaktioner med tekst, men til forskellige formål og på forskellige semantiske niveauer. Praksisområderne er indbyrdes forbundne, og et typisk tekstanalyseprojekt anvender metoder fra flere af områderne. Disse praksisområder er: Søgning & Informationsindsamling (IR), Webmining, Informationsudvinding, NLP, Konceptudvinding, Clustering og Kategorisering af dokumenter (Miner et al., 2012).
Tekstdata giver et manglende link til brugerfeedback
Smarte og effektive transportsystemer betragtes bredt som rygraden i den nuværende verdensøkonomi, præget af globalisering, globale forsyningskæder og kompleksitet. Intelligente logistiksystemer drives af Real Time data som en løsning på aktuelle udfordringer for gods- og passagermobilitet. Genopretning og analyse af tekstdata kan forbedre logistiksystemerne ved at reducere overbelastning og øge effektiviteten af ydeevne, brugertilfredshed og sikkerhed i transportsystemet.
Danmark er langt bagefter på tekstanalyse
Textdata er en nyttig, intelligent datakilde, der kan vise brugernes meninger og præferencer, og metoden ligger mere eller mindre uudnyttet hen i Danmark. EU’s Hargreaves-Kommission fokuserer også på samfundsmæssig værdi og massivt økonomisk potentiale i tekst og datagendannelse, men viser også, at Danmark er langt bagefter, set i et internationalt perspektiv og i forhold til europæiske naboer som Sverige og Holland (Hargreaves et al., 2014). For nylig blev potentialet for tekstdata og tekstanalyse udforsket på en omfattende workshop på CBS, med danske forskere og interessenter inden for den danske tranport- og logistikbranche. Her blev det understreget, at der er et uudnyttet potentiale i at udnytte Big Textual Data som kilde til brugerpræferencer. Følgende hovedapplikations-områder blev identificeret:
Forstå brugernes meninger: Real Time-sporing af kundetilfredshed, forståelse af årsager til kundeklager, sammenligning af kundeudtalelser om konkurrenter og produkter og præferencer for offentlig transport.
Interne operationelle forbedringer: Identificering af masterdata, automatisk prioritering af kundeklager, identificering af salgsmuligheder i kundeinteraktioner.
Opsporing af fremtidige trends inden for transport: Sporing af global logistik produktudvikling, efterspørgselsprognoser gennem identificering af tendenser i brugerpræferencer og overordnede tendenser i transport.
Brand Management: Kortlægning af hvem og hvad som påvirker virksomhedens image, og forståelse af baggrunden for god / dårlig medieomtale.
Trafikbetingelsessporing: Evaluering af brugen og værdien af trafikinformationsindsats, forståelse af adfærdsmæssige reaktioner på begivenheder på motorveje og detektering af ulykker.
Herudover blev branding-hovedbarrierer identificeret for disse applikationer. For første gang blev det almindeligt anerkendt, at intern modenhed er en udfordring ved implementering af tekstdata-analyse. Desuden blev repræsentativitet betragtet som en udfordring, efterfulgt af datatilgængelighed og manglen på datavolumen.
Hvilken rolle spiller sociale medier i dansk transport?
Kan lagring af ustruktureret tekstdata være en effektiv dataløsning, og hvad er sociale mediers fremtidige rolle? På den samme workshop blev dette interessante spørgsmål behandlet, da det også identificerede en række barrierer forbundet med anvendelsen af de vigtigste tekstdatakilder.
Næsten halvdelen af alle forekomster af Big Text Data vedrørte sociale medier, mens den anden del var interne kilder og også traditionelle medier som aviser. Sociale medier blev identificeret som det mest interessante medium sammen med interne data.
Der er stadig et betydeligt antal hindringer forbundet med udnyttelsen af disse kilder. Endnu en gang blev modenhed internt anset for at være den største barriere, og mens sociale medier blev anset for at have det højeste potentiale, blev det også betragtet som ganske problematisk at implementere i Danmark på grund af manglen på datamængde og problemer med tilgængelighed. Samlet set blev potentiale og effektivitet genereret af Big Textual data igen bekræftet.
En uudforsket metode med mange muligheder
I princippet har der eksisteret Text Mining og -teknologier i nogen tid. Det er en kompleks opgave at integrere brugerforståelser, og brugerperspektiver i teknologien er blevet forsømt i den tekniske sammensætning af Big Data infrastruktur. Teknikken er også ny, og virksomhederne har brug for at udvikle evner til at udvikle løsninger, hvilket gør investeringer risikable og gør fokusering vanskelig.
Der er brug for et fælles ansvar for at håndhæve nyttige innovationer til transportsektoren i Danmark. Samtidig er der vigtige metodemæssige udfordringer, der skal løses, først og fremmest i forhold til, hvordan tekst grundlæggende hjælper med evidensbaseret beslutningstagning inden for logistik og transport (se Chaniotakis et al., 2016). Tekstanalyser er så småt begyndt at blive anvendt på markedsførings- og sundhedsdomæner, men resultaterne er ikke direkte anvendelige i logistik- og transportområdet, og det kan nødvendiggøre en tilpasning af software.
Fremadrettet kan udnyttelsen af Big Textual datakilder, som sociale og offentlige medier, og implementeringen af tekstanalyser forbedre intelligensen og ydeevnen i det danske transportsystem betydeligt. Anvendelsen af Big Textual Data viser sig som en formidabel mulighed for at forstå brugerens, forbrugernes og offentlighedens mening om transportsystemer. Muligheden for at gøre dette i realtid og til lave omkostninger gør det endnu mere attraktivt, og det er en innovativ måde at udtrække yderligere værdi fra de planlagte intelligente transportsystem-initiativer.
Kilder
Chaniotakis, E., Antoniou, C., & Pereira, F. (2016). Mapping Social Media for Transportation Studies. IEEE Intelligent Systems, 31(6), 64–70. https://doi.org/10.1109/MIS.2016.98.
Gartner (2013). Big Content: The Unstructured Side of Big Data. Available online: http://blogs.gartner.com/darin-stewart/2013/05/01/big-content-the-unstructured-side-of-big-data/.
Hargreaves, Ian et. al. (Expert Group), Report: Text and Data Mining, 2014.
Miner, G. (2012): Practical text mining and statistical analysis for non-structured text data applications. 1. Aufl. Waltham, MA: Academic Press.
Tonkin, E., J.L T., Gregory (2016): Working with Text: Tools, Techniques and Approaches for Text Mining (Chandos Information Professional Series). Elsevier Ltd.
Om forfatterne og initiativtagerne:
Artiklen er forfattet af Lektor Aseem Kinra i samarbejde med en gruppe forskere og forskningsassistenter tilknyttet til Institut for Produktion og Erhvervsøkonomi på CBS. Instituttet er et af de største inden for forskning og uddannelse inden for supply chain management og logistik. Det omtalte projekt og den refererede workshop er sponsoreret af CBS competitiveness platform, hvis formål er at understøtte projekter, der øger effektiviteten hos danske virksomheder. For yderligere information, kontakt lektor Aseem Kinra på aki.om@cbs.dk