Geometriska modeller av likhet
Mikael Johannesson
30/10 2003 Högskolan i Skövde
"Under föreläsningen berättar Mikael Johannesson om betydelsen av och utmaningarna med att modellera likhet inom datavetenskapen, speciellt då inom området artificiell intelligens. Vidare kommer han att tala om hur man kan fånga upp likhet med hjälp av så kallade geometriska modeller. Mikael Johannesson är fil. dr. i kognitionsforskning och är verksam vid institutionen för datavetenskap vid Högskolan i Skövde." (Affisch)
M J berättade att han utbildade sig till systemvetare för tio år sedan. Inom datavetenskapen kom han att särskilt intressera sig för artificiell intelligens (AI) , vars mål är att en dator utför uppgifter som kräver närmast mänsklig intelligens.
Varför modellera likheter? Som expert kunde M J tycka att det är ett självklart tillvägagångssätt, men metoden är ej given. Vad är likhet? Det finns problem med begreppet likhet. Är det alltid samma likhet? Nej, slog M J fast. Det existerar ingen klar entydig definition av begreppet som får olika innebörd i olika sammanhang. Hur modellera likhet med geometriska modeller? Tanken är att programmera i dator för att kunna bedöma likheter.
Varför man gör detta har flera skäl, men M J begränsade sig här till två anledningar. Likhet är viktigt, något centralt när det gäller att jämföra skilda objekt. Förmågan att bedöma likheter är nödvändigt för att kunna dra nytta av tidigare kunskaper och erfarenheter. Likhet används för att kunna 1) generalisera/kategorisera.; 2/ klassificera.
Kunskap knyts till grupper, inte till enskilda objekt eller individer. Exempel: Om man har ett antal akvariefiskar av en viss sort behöver man inte memorera varje individ med avseende på utseende, behov av mat etc. De utgör tillsammans en kategori. Generalisering och kategorisering är således en mycket grundläggande handling. Varje enskild medlem i gruppen behandlas på samma sätt. Tillkommer nya objekt blir det fråga om klassificering; innan en sådan har gjorts saknas kunskap. Om en ny sak uppträder i en grupp märker man vid jämförelse om den liknar andra i gruppen (som i exemplet med akvariefiskar).
Modeller av likhet * kan öka kunskap om människan, * kan användas inom AI. Pedagogiska instrument och metoder utvecklas. Att generalisera, kategorisera och klassificera är faktiskt en förutsättning för att kunna lära av gjorda erfarenheter. Likhet resp. olikhet kan betraktas som två extremer på en och samma skala.
Ett exempel på användning av likhetsmodeller med klassificering ger sjukvården: En bild åskådliggjorde två benfrakturer; den ena var nödvändig att behandla, den andra krävde ingen behandling. Ett annat exempel rörde klassificering av farliga resp. ofarliga arbetsplatser. En bild visade en industridammsugare som placerad i olika miljöer i någon mån kan ange om risker föreligger eller ej. ((Symbolen för kärnkraftverk e.d. måste såvitt jag förstår förknipas med potentiell farlighet. Min anm.)) Datorstyrda robotar kan vara till god hjälp Det handlar då om likhetsbedömning som närmar sig människans bedömningsförmåga.
Mångfacetterat begrepp Inledningsvis ställdes frågan: Vad är likhet? Problem med likhet. Följande visar hur olikartad likhet kan vara: *Två färger kan likna varandra; * Två toner kan påminna om varandra; * Två personer kan likna varandra i olika avseenden, till utseende, personlighet o.s.v. * En livssituation kan vara lik eller olik en annan. Som sagt drar man nytta av tidigare erfarenheter: upplevelse av likhet mellan situationer i livet t.ex. Man kan å andra sidan förstås höra att två toner låter helt olika. Som synes är likhet svår att definiera, bl.a. därför att a) den är relativ, d.v.s. beroende på sammanhanget; b) den är variabel över tid.
För att återvända till exemplet med akvariefiskarna kan samma par av fiskarna uppfattas olika i skilda kontexter, vilket visa arr likhet är relativ. Dessutom brukar fiskar av samma slag först förefalla helt lika, men efterhand kan man upptäcka individuella olikheter. Detta illustrerar att likhet är variabel över tid, och att likhet alltså lämpligast studeras under givna förutsättningar. Exempelvis undersöks perceptuell likhet i givna sammanhang under begränsad tid.
Hur modellera likhet med hjälp av geometriska modeller? Ett exempel visar hur man söker bedöma likhet mellan skilda frukter genom att användaen geometrisk datormodell. Frukterna skiljer sig sinsemellan beträffande färg, form och storlek. Vad fångar modellen upp? Hur? Flera typer av egenskaper beskrivs med dimensioner. Dessa är tre axlar i ett 3D koordinatsystem.: 1) Storlek (vertikal axel); 2) färg (horisontell axel); 3) form (axel däremellan, markerar 3:e dimension). Man för i detta system in egenskapsvärden för de objekt vars likhet man vill undersöka. Värden för storlek etc. placeras i relation till resp. koordinat. (Figuren som jag tyvärr ej kan återge här) visade alltså positionen för storleks- resp. form- och färgvärden i koordinatsystemet.
Vad koordinaterna betyder En bild återgav i 3D ett antal olika frukter, från äpplen till apelsiner; de var ordnade utifrån koordinatsystemets likhetsmodell. I ett antal lodräta rader visades mindre à större frukter (den omvända ordningen – från större till mindre uppifrån och ner – kunde också ha valts). Det förekommer alltså olika storleksvarianter i de vertikala kolumnerna. Varje kolumn innehåller samma frukt men av olika storlek. Men i de motsvarande horisontella raderna återfinns varianter av frukter/former och med skiftande färg. ((Figur/bild klargör förstås bättre det jag en aning omständligt beskrivit. Min anm.))
Olika typer av egenskaper beskrivs således genom att egenskapsvärden för objekten sätts in i systemet. Vad modellen fångar upp och på vilket sätt syns klart i modellen. En pil från ett nytt objekt till det närmaste grannobjektet i en grupp i modellen markerar avstånd. Man finner då att mindre att mindre avstånd ger större likhet. Eller lite annorlunda uttryckt: Objekt som befinner sig nära varandra är mer lika varandra. Omvänt gäller naturligtvis att större avstånd ger mindre likhet. Sammanfattningsvis: 1) Likhet är motsatsen till avstånd. 2) Avstånd beräknas utifrån koordinaterna. En nackdel är att det ej går att rita mer än tre dimensioner. (Men denna begränsning gäller inte för datorn, ty där kan många fler dimensioner i och för sig framställas.)
Geometriska modeller och klassificering I exemplet med de två typerna av frakturer ovan kan i en datormodell kända objekt tillhöra antingen klass A (gul färg) eller klass B (blå). I systemet med de två grupperna kommer ett orangefärgat objekt in. Till vilken klass hör då det nya objektet? Tillämpar man nu närmaste grannen-metoden ser man att det ska hänföras till den gula kategorin: den kortaste linjen (pilen) från det orangefärgade går till ett objekt i den gruppen, här= klass A. Naturligtvis kan alltfler nya objekt sättas in i koordinatsystemet för att bestämma deras egenskaper. Då måste de3n ordning i vilken de införs beaktas, eftersom ordningsföljden påverkar resultatet.
Det finns andra metoder, bl.a. medelavstånds-metoden. Som namnet antyder beräknas ett medelavstånd mellan det nya objektet och alla objekten i varje grupp. Med den metoden blir emellertid utfallet ett annat: då går en pil från det nya föremålet (här: orange) till den blå gruppen (klass B). Denna linje blir då längre än i det förra fallet. Liksom vid närmaste granne-metoden kan förstås fler objekt föras in i modellen och medelvärdet räknas ut för vart och ett. Fortfarande gäller att ordningsföljden då är betydelsefull för resultatet.
Ytterligare en metod nämndes: ”ThePrototype Voronoi Tesselation”- metoden (svensk beteckning saknas). Den har en speciell status och används för vissa avståndsmätningar. Den kan sägas vara en variant på nära granne-metoden. Men med denna spelar ordningen för införandet av nya objekt ingen roll, under förutsättning att prototypen hela tiden är desamma.
Fråga: Kan man inte byta prototyp? Svar: Jo, men under hela mätningen behålls samma prototyp. Närmaste granne-metoden kan f.ö. varieras så att den omfattar ”närmaste tre grannar”. Som nämnt finns ännu fler metoder som inte tas upp här, sa M J. Människan har sedan gammalt olika metoder för klassificering/kategorisering. Vi lagrar i minnet mer abstrakta prototyper som utnyttjas vid tillfälle. M J framhöll att forskning pågår om detta.
Öppna frågor * Hur förändras likhetsbedömningen i takt med nya erfarenheter? * Hur få geometriska metoder att ta hänsyn till olika sammanhang? (flexibla metoder!) ((Här visades ytterligare minst en öppen fråga som jag dock missade. Min anm.)) M J refererade åter till akvariefiskar: man kan jämföra en familj fiskar med övriga och se att denna familj skiljer sig något från alla de andra som är (förefaller?) lika.
Slutligen rekommenderade M J den kände forskaren Peter Gärdenfors uppmärksammade bok Conceptual Spaces – The Geometry of Thought (2000). Han nämnde även sin egen doktorsavhandling: Geometry Models of Similarity. Båda finns tillgängliga för lån på Högskolan.
Fråga (Paul Hemeren): Olika dimensioner är olika viktiga, eller hur? Svar: Det är riktigt. Av storlek, form och färg är färg viktigare än de andra dimensionerna. Därför blir skalorna inte lika för alla dimensioner. Man når största effekt genom att ta hänsyn till olika betydelsefullhet. Människan gör som bekant mycket ofta en viktning av olika saker och företeelser.
Kommentar 2003
Mikael Johannessons framställning var klar och inte alls svår att förstå. Jag har åhört bara en eller annan föreläsning som tidigare som berör detta ämne. Som icke sakkunnig kan jag givetvis inte ha några särskilda synpunkter på geometriska modeller. Men jag vill här ta fasta på och kommentera en smula hur vi människor sedan gammalt användet begreppet likhet// olikhet.
Kognitionsdagarna 2003 2-3/11 avslutades med en välbesökt föreläsning av prof. Peter Gärdenfors, Lund. Ämnet var: Perceptual and functional concepts. (referat av mig). I den föreläsningen behandlades bl.a. just M J:s område. Denne nämnde helt kort prototyper och gav några exempel. Jag ska här inte vidare beröra Gärdenfors intressanta forskning utan hänvisar till mitt referat, som dock ha en del luckor då denna framställning inte alltid var helt lätt för mig att följa.
Jag håller helt med M J när han säger att likhet är något mycket centralt. Vi gör ju ständigt jämförelser mellan människor och mellan saker. Det handlar för det mesta om att skaffa sig en uppfattning, att göra en bedömning. Och då är likheter resp. olikheter ett ovärderligt verktyg, anser jag. Vi jämför alltså mer eller mindre medvetet både konkreta saker och företeelser – och inte minst människor. Det görs på gott och ont; som alltid finns ju vissa nackdelar också.
Som språkman tänker jag gärna i ordmässiga och grammatiska termer; i detta sammanhang kommer jag osökt att tänka på adjektivets komparation. Denna utgår ju från olikhet, som är motsatsen till olikhet men som enligt M J kan ses som ena ytterligheten på en skala likhet à olikhet. Exempel: stor, större, störst. Motsatser kan användas på många sätt; ett är att samma förhållande kan uttryckas språkligt olika, t.ex. ”A spelar bättre än B” = ”B spelar sämre än A”, fast tonen i utsagan är något olika.
Men komparation är inte alltid logisk: en ”äldre” dam är nog inte fullt så gammal som en ”gammal” dam. Viss kan denna s.k. absoluta komparation verka en smula förvirrande vid närmare eftertanke. Men språkliga konventioner godtas i allmänhet utan prut, hur ologiska de än må vara. En del uttryck blir omedvetet smått komiska, då exempelvis riktigt gamla personer kallas ”äldre äldre”.
Naturligtvis finns det andra sätt att jämföra där utgångspunkten är just likhet: ”Du kan göra det lika bra som han.” Vi har åtskilliga ord och uttryck som betecknar någon sorts likhet: liksom, likt, såsom, i likhet med (alla ofta förkortade till som).
Som bekant är våra bedömningar och värderingar långt ifrån alltid positiva. I ett hårdnande kulturklimat, i kölvattnet på ekonomismen m.m. blir olikheter mer iögonfallande än likheter. Vi är alla både lika och olika varandra. Jag vill tro att människor i grunden är mer lika än olika varandra. Men genom att mer se till det som skiljer än som förenar djupnar klyftorna i samhället. Ordet ”social” har många konnotationer men grundbetydelsen går tillbaka till lat. socius (gemensam; kamrat). Det är helt enkelt fråga om relationer.
Att det trots – kanske också på grund av – en långtgående ekonomisk globalisering gror djupa rädslor för det främmande och okända, är i sig oroande. Rasismen är på många håll ett faktum, och den hålls vid liv och gynnas av okunskap och fördomar. Alla har värderingar, såväl positiva som negativa. De senare grundas ofta på förutfattade meningar som i sin tur, mer eller mindre omedvetet, utgår från olikheter: ”vi” kontra ”de”. Inte underligt att allt svårare konflikter uppstår.
För att ta ett par konkreta exempel som rör mig själv: En resa till Kina för rätt länge sedan fick mig inte att speciellt känna av olikheterna mellan svensk (läs: västerländsk) kultur och kinesisk kultur.Olikheterna till trots tyckte jag likheterna mellan resp. folk övervägde. Under en annan resa, den gången till Algeriet, upplevde jag människorna och kulturen som mer annorlunda än i Kina jämfört med Sverige.Men trots detta tyckte jag att likheterna var större än skillnaderna i många avseenden.
Naturligtvis har jag generaliserat kraftigt i mina alltför kortfattat givna exempel. Min poäng är att vi alltid värderar på något sätt och att ens personliga attityd här spelar stor roll. Men jag vill samtidigt varna för att blanda ihop individ- och gruppnivå, vilket alltför ofta görs – med avskräckande resultat. Det är väldigt lätt att utifrån några få enstaka exempel dra för långtgående slutsatser om stora gruppers egenskaper, d.v.s. generalisera för mycket.
Till sist vill jag än en gång hävda att den kinesiska Yin/Yang-symbolen är genialisk. Det skulle föra för långt att här förklara den närmare; de flesta känner i varje fall till den. Observera att det inte är fråga om en antagonistisk motsättning med absolut olikhet mellan de två begreppen. Enligt denna symbolik finns inga renodlade motsatser som extremister och rabiata fanatiker tycks anse.