Blogg | 11 jun 2020

Massor av data – är det verkligen det vi vill ha?

Det har säkert inte undgått någon att det är data som gäller nu och ofta påpekas det att det ska vara stora mängder. Många är de presentationer där det dyker upp en bild med texten: ”Data är vår nya olja!”.

I detta blogginlägg reflekterar Stefan Palm kring på vilket sätt data kan omvandlas till information som genererar kunskap som kan användas för att generera mer kunskap. Hänger du inte med – läs nedan så gör du det strax.

Precis som med olja, pratas det inte så mycket om arbetet med att fånga upp, bearbeta och servera dessa stora mängder data. Men denna text ska inte handla om Data Engineers, som likt oljeborrare gör grovarbetet utanför strålkastarljuset. 

Data i sig är värdelöst 

Jag skulle istället vilja belysa det faktum att data i sig är tämligen värdelöst. Låt mig försöka förklara vad jag menar med ett exempel: 23.  

Med denna typ av enskild datapunkt, så är det i princip omöjligt att generera något värdefullt. 

En stor utmaning är att vi inte har en enhet kopplat till vårt data. Är det 23 kronor, grader eller antal bananer. Det gör viss skillnad. Så låt oss addera lite data: 23 grader. Vart det mer värdefullt? Nja, inte mycket. Gäller det temperatur i badvattnet, lutningen på skidbacken eller värmen i ett rum? Vi behöver koppla vårt data till ett sammanhang, för att omvandla data till information. Information gör att data får en betydelse. 

Så låt oss omvandla vår data, i form av informationen att det är 23 grader i ett rum. Men fortfarande så är denna information rätt svårtolkad, vilken temperatur brukar det vara i detta rum, vilken temperatur det är i angränsade rum eller temperaturen ute skulle vara bra att jämföra med. Vi behöver relatera vår information till något, för att skapa insikter. 

Men även om vi nu har informationen om att rummet är ovanligt varmt, det brukar vara 21 grader, troligtvis för att utetemperaturen är högre än normalt, så ligger det stora värdet i att kunna koppla denna information till kunskap. 

För vårt exempel, så är 23 grader inte önskvärt, utan kunskapen om hur vi sänker temperaturen i rummet är det som är mest värdefullt för oss just nu. I det här fallet så finns kunskapen att om man sätter igång fläkten, så sjunker temperaturen i rummet.  

Men det finns faktiskt en sak som kan skapa mer kunskap, och det kommer (oftast) genom att använda kunskap. Det kallas erfarenhet. I vårt fall betyder det att man startar fläkten när utetemperaturen höjs, innan rummet blir för varmt. 

Jag hoppas att vi med detta exempel kan enas om att data i sig inte är så värdefullt, Men vi kan omvandla data till information och från informationen kan vi generera kunskap. Och använder vi kunskapen, så får vi erfarenheter som genererar mer kunskap. Så långt hoppas jag du är med. 

Hur tar vi vara på all kunskap vi har i organisationen? 

Den sista pusselbiten är att kunskap genererar värde först när den används. Det här låter självklart, men är i realiteten en utmaning för de flesta organisationer. Hur tar vi vara på all kunskap vi har i organisationen? I många fall finns denna kunskap i huvudet på medarbetare (som byggt upp kunskap från erfarenhet enligt ovan, men det förstod du säkert).  

Men hur vi hanterar kunskap i en organisation är inte fokus för denna text, det kanske vi får anledning att återkomma till. Jag kan bara skicka med en reflektion, fundera på om de som fattar beslut har mest kunskap om det som besluten rör eller om det finns kunskap i organisationen som inte används i beslutsfattandet i dag? 

Istället vill jag sväva ut lite kring hur teknik används i hanteringen av data. Det är mer regel än undantag att samma andetag även prata om Artificiell Intelligens (AI). Jag brukar skämtsamt säga att folk säger AI, menar Machine Learning (ML) men det som löser deras problem är Analytics. Och jag väljer med flit att skriva Analytics, BI är för mig en för snäv benämning, men jag vet att det finns andra åsikter. (Tur att vi lever på en plats där man får ha olika åsikter, och att förstå varför andra tycker som de gör är en väldigt intressant form av lärandeprocess tycker jag. 

Så låt oss försöka reda ut begreppen ovan, och relatera dem till funderingarna kring data, information och kunskap. 

Analytics, är förmågan att få insikter från data. I sin bredaste utformning realiserar sig denna förmåga i form av Excel. Och fortfarande är Excel ett fantastiskt verktyg, och många organisationer nyttjar även i dag Excel i sin dagliga verksamhet. Men i och med de ökade datamängderna så ökar även mängden av nya verktyg/plattformar. De som i går briljerade med sina Data Warehouse, försöker nu överglänsa varandra med Data Lakes. Men om vi bortser från hur data hanteras, så är det här fokus på förmågan att skapa insikter. 

Vad används då Machine Learning till? Ja gränsen mellan ML och Analytics rent tekniskt är hårfin, eller egentligen överlappande. Men från ett värdeskapande perspektiv så är förväntan på ML oftast skild från Analytics. Förväntan är att ML ska kunna förutsäga framtiden. Nu vet de flesta att dessa förutsägelser kommer i form av sannolikheter, inga absoluta löften här inte. Och överlappet med Analytics blir kanske nu tydligt, en hel del av de saker man vill förutsäga går att relatera till data som ger ”enkla” (oftast linjära) algoritmer, vilket man jobbat med inom Analytics långt innan ML vart populärt. Och det är därför man brukar säga att 90% av alla Machine Learning initiativ slutar med en Analytics lösning. För mig är den stora fördelen med Machine Learning förmågan att bygga och representera kunskap. Det viktiga att förstå att olika typer av tillämpningar kräver att man representerar kunskap på olika sätt, och därför är val av algoritm och arkitektur en viktig process, särskilt när man jobbar med specifika domäner. För generella tillämpningar finns i dag ofta färdig-tränade modeller, dvs kunskapen finns inbyggd. 

Kunskap är endast värdefull när den används 

Så vad tillför då AI, jo för mig handlar det om förmågan att agera. Vi kommer tillbaka till åsikten att kunskap endast är värdefull när den används. Ibland kan det betyda att vi exekverar en bit kod, anropar ett API, eller så kan det vara så att vår AI har kognitiva förmågor och kan kommunicera via tal/bild eller påverka omgivningen fysiskt (ofta kallas det då en robot). Och ska vi vara lite ärliga, så är det relativt få AI-lösningar i produktion i dag (bortsett från industri-robotar). 

För att avsluta detta lite filosofiskt, så vill jag lyfta fram detta citat: 

The goal of forecasting is not to predict the future but to tell you what you need to know to make meaningful action in the present.” – Paul Saffo 

Det som har hänt kan vi inte göra något åt, men vi kan lära ifrån det som hänt. 

Utmaningen är att data kan ge oss insikter som är relevanta under exakt de förutsättningar som var då det datat producerades. Och är det svårt att kompensera för alla förändringar som skett under tiden mellan att data producerades och nu när du ska agera, blir det nästan omöjligt att inse alla möjliga processer som kan ha påverkat ditt data. Det är därför man vill ha en kollega som tycker statistik är kul. 

Att ha en vision om vart man är på väg är nödvändigt (enligt mig). Men framtiden är en fiktiv plats, som bara existerar i varje persons huvud. Det var någon som sa att det säkraste sättet att förutsäga framtiden är att skapa den. 

När kan man lita på sin kunskap? 

För det är endast det som sker i nuet du kan påverka direkt. 

Det svåra är att avgöra när man ska lita på sin samlade kunskap och bara reagera på saker som händer, och när man ska lägga energi på att analysera situationen, göra en konsekvensanalys, och medvetet agera. För att sedan söka feedback på sitt agerande, så kan man via erfarenheten bygga ny kunskap inför nästa gång en liknande situation uppstår. (Inser när jag skriver detta att resonemanget gäller mig som individ, men även ”en AI”.) 

Ingen människa orkar agera rationellt hela tiden, vår hjärna förbrukar för mycket energi för det. Men försök skapa dig stunder under dagen då du medvetet fattar beslut om hur du ska agera. Vissa kallar detta Mindfullness, att leva i nuet. 

Så ett bra sätt att hantera den ökade mängden av data som vår hjärna utsätts för, är att bygga kunskap. Detta görs genom att konsumera information, eller via feedback från erfarenhet. Med existerande kunskap kan vi fatta beslut utan att spendera så mycket energi, vilket gör att vi har energi över när det behövs.  

Så vad ska du lära dig i dag? 

Eller som man sa förr i tiden:  

– Det bästa hade varit att plantera äppelträdet för 10 år sedan, det näst bästa är att göra det i dag. 

Och självklart hjälper vi på Softronic till om din organisation vill bygga kunskap, eller bygga en process för att kontinuerligt jobba med ny kunskap.  

 

Relaterade länkar

Blogginlägg skrivet av Stefan Palm för Softronic AB.