Annons

Victor Galaz:Maskinerna undrar allt mer hur du mår

Jeremiah, ett interaktivt virtuellt ansikte, med sin skapareRichard Bowden på University of Surrey, England.
Jeremiah, ett interaktivt virtuellt ansikte, med sin skapareRichard Bowden på University of Surrey, England. Foto: TT

Den smarta klockan avläser din puls och andning, kameran känner igen ett riktigt leende och mikrofoner blir allt mer sensibla för skillnader i röstläge. Men vårt allt intimare umgänge med ”empatiska” system skapar också utrymme för känsloladdad desinformation.

Under strecket
Publicerad

Roboten Berti spelar ”sten, sax, påse” med en pojke på Science Museum, London.

Foto: Nils Jorgensen/TTBild 1 av 1

Det finns få historier om hur datorkod formar vår omvärld som berört mig så mycket som historien om James Vlahos och hans programmerade konversationsbot Dadbot. När Vlahos för några år sedan fick reda på att hans pappa fått obotlig lungcancer bestämde Vlahos sig för att försöka bevara minnet av sin döende 80-årige far genom att intervjua honom. Det blev flera långa samtal om faderns uppväxt i Tracy i Kalifornien, släktens rötter i Grekland, faderns passion för musik, teater, och amerikansk fotboll-laget California Golden Bears.

När dessa intervjuer en tid senare skrivits ut i över 200 sidor och lagts i pärmar, fick projektet en ny vändning. James Vlahos bestämde sig för att programmera en konversationsbot baserat på faderns historier, hans humor och unika språkliga egenheter. Även om tekniken i sig inte var särskilt avancerad blev resultatet överväldigande. Korta samtal mellan Dadbot och James Vlahos själv, hans mor och barn skapade mycket starka band med en person som långsamt tynade bort. 

I en kort film om historien bakom Dadbot (”How a man turned his dying father into AI” som går att streama på Wired.com) kan Vlahos inte hålla tårarna tillbaka när han berättar om sina återkommande samtal med kopian av sin nu bortgångne far. ”Älskar du mig?” frågar Vlahos, och lyckas inte få något vettigt svar tillbaka. En felprogrammering som oväntat framkallar en annars slumrande känslostorm. 

Annons
Annons

Att datorkod kan väcka starka känslor är ingenting nytt. Just den här typen av konversationsbotar har funnits sedan 1960-talet. Däremot har de blivit alltmer sofistikerade. Flera hälsoföretag experimenterar med botar som kombinerar maskinintelligens med psykologisk forskning för att hjälpa användaren övervaka och hantera stress eller nedstämdhet. 

Sammanvävningen mellan intelligenta maskiner och vår känslovärld är dock betydligt mer omfattande än så. Starka känsloyttringar som glädje, sorg, ilska och rädsla flyter redan i dag på en bädd av algoritmer hos sociala medier, med syfte att skapa än starkare engagemang och därmed också ges än större spridning.

De delas för att de spelar på människors rädslor och oro – och i det sista fallet till och med xenofobi.

De omfattande bränderna i Amazonas och Australien, och inte minst utbrottet av coronaviruset, visar hur fakta och känslor blir alltmer sammanvävda i dagens informationsflöden. Videoklipp från Australiens brinnande skogar, eller från en kinesisk influencer som smakar på fladdermussoppa, delas inte enbart för sitt informationsinnehåll. De delas för att de spelar på människors rädslor och oro – och i det sista fallet till och med xenofobi.  

Massmedier som tidningar och tv har givetvis alltid spelat en roll som storskalig känsloförmedlare. Framstegen inom maskinintelligens och andra tekniker gör dock att vi mycket väl kan befinna oss vid en brytpunkt där allas vår kollektiva förmåga att skapa mening och förståelse utmanas på allvar. 

Andrew McStays mycket läsvärda bok ”Emotional AI: The rise of empathic media” (Sage) rör sig elegant mellan forskning om människans känsloliv, politik och ny teknik. Tidigt i boken presenterar McStay sin tes att de medietekniker som omgärdar oss, inklusive inom press, sociala medier och reklam, inte längre bara förmedlar information passivt. De kan också läsa av och anpassa sig till människors känslotillstånd. Ett besök på en hemsida, en like på Instagram, ett besök i en butik, en avläsning från ett aktivitetsarmband eller smart klocka, skapar alla datapunkter som säger något om en individs beteende. ”Datafieringen” av våra liv kan tyckas harmlös, men lägger enligt McStay grunden för artificiellt intelligenta system som kan läsa av, klassificera och lära sig allt mer om människors känsloliv. Och framför allt, agera på den informationen. Det är exempelvis ingen slump att majoriteten av Facebooks sex reaktions-emojier (tumme upp, hjärta, skrattar, förvånad, ledsen, arg) är uppmuntrande, i ett försök att ”hålla plattformen positiv”. Som bonus gör vår flitiga användning av dessa det också enklare för den sociala mediejätten att studera användares känslotillstånd. 

Annons
Annons

Roboten Berti spelar ”sten, sax, påse” med en pojke på Science Museum, London.

Foto: Nils Jorgensen/TTBild 1 av 1

I takt med att artificiellt intelligenta system blir inbäddade i olika sorters hårdvara öppnar sig möjligheten för vad McStay kallar ”empatiska medier” – informationsmedel som läser av och interagerar med människors känsloliv på ett så trovärdigt sätt att de uppfattas som empatiska. Kameror som blir allt bättre på att läsa av ansiktsuttryck, gester och hållning. Mikrofoner som kan tolka och agera på skillnader i röstlägen. Smarta klockor eller armband som kan mäta puls, andning och kroppstemperatur. 

Roboten Berti spelar ”sten, sax, påse” med en pojke på Science Museum, London.
Roboten Berti spelar ”sten, sax, påse” med en pojke på Science Museum, London. Foto: Nils Jorgensen/TT

Det tydligaste och mest kontroversiella exemplet är tekniker med förmågan att läsa av och tolka ansiktsuttryck. Grunden lades redan i slutet på 1970-talet när forskare föreslog att det gick att knyta specifika ansiktsuttryck till grundläggande känslotillstånd som lycka, förvåning, ilska, och äckel. Tillämpningar av det så kallade Facs-systemet i tekniker som kan läsa av ansiktsuttryck har varit kontroversiell och starkt ifrågasatt, och har till och med nyligen förbjudits för användning i polisiära syften i till exempel San Francisco. Starka röster ifrågasätter möjligheten att över huvud taget koppla ansiktsuttryck eller kroppsrörelser med olika känslotillstånd.

Detta har dock inte hindrat teknikjätten Apple att försöka utveckla nästa generation av röstassistenten Siri med ansiktsigenkänning, för att läsa av och kunna svara på användarens känslotillstånd. Tillämpningsmöjligheterna är omfattande. Marknaden för ansiktsigenkänning uppskattas växa till 25 miljarder dollar år 2023. ”Smarta” reklamskyltar som läser av tittarnas känslor och reagerar beroende på personens ansiktsuttryck, och stora varuhus som experimenterar med tekniker för att läsa av kunders ansiktsuttryck vid varuhyllorna för att förbättra köpupplevelsen (”eyeq go”), är bara två ytterligare exempel på hur ”tekniker som känner” sipprar in i människors vardag. Med framväxten av den här typen av artificiellt empatiska tekniker och medier följer också, menar McStay, ett växande behov av att styra undan förtäckta intrång i våra känsloliv. Frågan är dock om det inte redan är för sent.

Annons
Annons

Marknaden för ansiktsigenkänning uppskattas växa till 25 miljarder dollar år 2023.

Stora mängder data ger inte bara företag inblick i individers känsloliv, utan gör det nu också möjligt för utomstående att söka spela på känsloskiften på kollektiv nivå. Den amerikanska forskaren Kate Starbird vid University of Washington har i en rad uppmärksammade studier visat hur desinformationskampanjer effektivt lyckas spela på de starka känslor som kännetecknar polariserade politiska frågor. Black lives matter-rörelsen som växte fram i USA i samband med dödsskjutningar av svarta skapade stor uppmärksamhet över hela världen, och visade sig senare vara digitalt infiltrerad av den ökända ryska ”trollfabriken” Internet Research Agency. Starbirds studier av konversationer i sociala medier knutna till rörelsen visar hur ryska konton som utgav sig för att vara ”vanliga” amerikanska medborgare framgångsrikt förstärkte polariseringen mellan Black lives matter-aktivister och den konservativa högern genom falsk och känsloladdad information. 

Utmaningen enligt Starbird är dock inte bara den här typen av samordnade desinformationskampanjer från en främmande makt. Det är också det faktum att digitala informationskanaler visat sig förstärka den omedvetna spridningen av felaktig, känsloladdad information, särskilt under samhällskriser.

Medieforskaren Alice Marwick menar till och med att det sätt på vilket vi alla konsumerar och delar nyheter i det digitala medielandskapet helt underminerar etablerade mediers ambitiösa försök till faktakoll. Marwick menar att vi i dag befinner oss i ett ständigt flöde av känsloinfluerade nyheter. Ett nyhetsklipp som kommenteras i en statusuppdatering, en politiskt färgad mem som delas på Instagram, en spetsig krönika som rullar förbi i Twitterflödet. Informationsdelning i en sådan kontext handlar inte primärt om faktainnehåll. Den syftar till att signalera ett känsloläge och grupptillhörighet. Marwick nämner en väninna som sett sig tvungen att konfrontera sin mamma som ständigt delade uppenbart falsk information om den dåvarande presidentkandidaten Hillary Clinton. Mammans svarade förargat: ”Jag bryr mig inte om det är fel, jag bryr mig om att jag hatar Hillary Clinton, och jag vill att alla ska veta det!”

Annons
Annons

Lyckligtvis kan vi även skönja en annan utveckling, nämligen digitala mediers förmåga att skapa vidsträckta känsloband mellan människor. Forskaren David Garcia vid Wiens medicinska universitet har i studier visat hur snabbt starka känsloyttringar sprider sig i digitala medier, särskilt vid kollektiva trauman och kriser. I samband med terrorattacken i Paris i november 2015 följde en känslovåg av rädsla, ilska och frustration i sociala medier. Intressant nog, menar Garcia, kunde man månader efteråt också finna tydliga uttryck för solidaritet, samhörighet och omtanke.

Lyckligtvis kan vi även skönja en annan utveckling, nämligen digitala mediers förmåga att skapa vidsträckta känsloband mellan människor.

Möjligtvis är det just det senare fenomenet som gör att James Vlahos Dadbot känns så trösterik. Empatiska medier sätter redan i dag människor i känslomässig förbindelse med varandra på sätt som var otänkbara för bara ett decennium sedan. Videoklipp med demonstranter som sjunger protestsånger från Santiago förnyar känslor av samhörighet hos exilchilenare över hela världen. Starka berättelser från människor som förlorat nära familjemedlemmar under coronakrisen i Kina väcker medkänsla när de översätts och delas i internationella medier.

2020-talet kan mycket väl visa sig bli ett årtionde plågat av otyglade vågor av falsk information, illvilligt utformade för att spela på våra djupaste rädslor, och utnyttja svagheter i de algoritmer som formar vårt nyhetsflöde. Men det kan också bli ett decennium där empatiska medier ger oss förunderliga nya sätt att både känna och visa omtanke, förståelse och medkänsla för varandra.

Annons
Annons
Annons
Annons
Annons