LibGuides: Söka och utvärdera information: Artificiell intelligens (AI)

Vad menar vi med Artificiell Intelligens?

När vi pratar om AI idag menar vi oftast chatbotar, det vill säga generativ AI. Exempel på sådana generella AI-verktyg är ChatGPT eller Microsoft Copilot vilka är till för att generera text, bild eller video. Tekniken bakom generativ AI är djup maskininlärning (deep learning). Stora språkmodeller (large language models) bygger på maskininlärning, mer specifikt en typ av neurala nätverk som kallas för transformers (det är detta som T:et i ChatGPT som står för). Den stora språkmodellen matas med oerhört stora mängder text (oftast taget direkt från internet) och lär sig vilka ord som ofta förekommer tillsammans eller kommer efter varandra. Baserat på detta genererar AI:n text som efterliknar mänskligt språk.

När man skriver med en generativ AI (promptar) tolkar språkmodellen det som man skrivit och producerar ett svar baserat på sannolikheterna den har lärt sig genom träningstexterna. På grund av detta kan man alltså inte räkna med att output från en AI presenterar sanningar, bara sannolikheter.

Testa själv! För att undersöka begränsningarna med AIn kan du testa att fråga den om något du redan vet väldigt mycket. I svaret kommer du kunna lägga märke till hur ofta AIn genererar felaktiga/tvetydliga/otillräckliga svar.

Som Chalmerstudent har du tillgång till Microsoft Copilot via en licens som upphandlats centralt. Det innebär att du kan nå en säkrare version av Copilot (tidigare Bing Chat Enterprise) än om du anävnder den fria, öppna versionen.

Läs mer om hur du aktiverar och använder Microsoft Copilot på Chalmers TopDesk.

Det är upp till kursansvarig och examinator för varje enskild kurs att bestämma om och hur AI är tillåtet att använda inom ramarna för de olika examinationsuppgifterna. Kom ihåg att fråga i början av varje kurs! Läs mer här.

Om du använder dig av AI-verktyg är det viktigt att du refererar korrekt till dessa (se referensguide för APA och IEEE) och är transparent med på vilket sätt du använt dig av dem för att producera din text/bild.

När är det lämpligt att använda generativ AI?

Olika aspekter av AI-verktyg

Eftersom output från generativ AI är baserat på träningsdata är det avgörande att känna till egenskaperna hos texterna som inkluderats. Om vi tänker oss att AIn tränats på all text som finns på internet innebär det att blogginlägg, opinionstexter, fake news, Tweets och annan tvivelaktig information också finns med. Detta innebär att all form av diskriminering, sexism, rasism, homofobi, etc som existerar ute på det fria internet också reflekteras i AIns genererade svar.

Det är även de mest återgivna åsikterna och perspektiven som genereras av AIn eftersom de stora språkmodellerna är byggda på frekvens och de mest dominanta perspektiven återkommer oftast i träningsdatan. På grund av detta går det inte att få nyanserade bilder eller analyser av samhällsfenomen, eftersom de mest marginaliserade perspektiven inte kommer fram.

När vi får tillbaka ett svar baserat på vår prompt till en generativ AI kan den genererade texten innehålla felaktigheter eller helt påhittade fakta. Detta kallas att AIn hallucinerar. Det är ett resultat av hur de bakomliggande algoritmerna fungerar, det vill säga genom statistik och sannolikheter. En AI kan hallucinera olika mycket baserat på hur den är uppbyggd (exempelvis genom hyperparametrar såsom top-p och temperatur) men kom ihåg att det alltid finns risk för hallucinationer – i alla AI-verktyg!

Om man försöker söka efter information genom generativa AI-verktyg så stöter man ofta på hallucinationer i form av påhittade referenser. Kontrollera alltid att källorna faktiskt existerar och läs igenom originaltexten innan du refererar till dessa i dina egna texter.

Det finns AI-verktyg som är framtagna för informationssökning, såsom Semantic Scholar, och dessa kan vara bra när man vill orientera sig i ett nytt ämne eller vill utvidga sin sökning bortom traditionella vetenskapliga databaser. Informationssökningsverktyg baserade på AI är dock inte lämpliga för systematiska litteraturöversikter eftersom den genererade träfflistan inte är replikerbar.

Företagen bakom de generativa AI-verktygen är oftast inte transparanta med var de har tagit texterna som utgjort träningsdatan för den stora språkmodellen. Det är troligt att vissa företag skrapat internet på texter utan upphovspersonernas tillåtelse. Eftersom träningsdatan (troligtvis) innehåller upphovsrättsskyddat material så är den genererade texten/bilden influerat av dessa, trots att upphovsrättsinnehavaren inte godkänt ett sådant användande av dennes intellektuella rättigheter.

En stor fråga är också huruvida det är ”promptaren” eller företaget bakom den stora språkmodellen (till exempel OpenAI för ChatGPT) som äger det genererade svaret från en generativ AI, alltså vem som äger den intellektuella rättigheten till outputen. Det är också viktigt att känna till att upphovsrättslagar kan skilja sig åt från olika länder, vilket blir problematiskt eftersom många av AI-företagen är baserade i USA men går att använda över hela världen.

Frågan om upphovsrätt när det gäller AI är komplex och det finns inte tillräckligt många rättsfall för att med säkerhet kunna fastslå vilken typ av användning som är acceptabel i vilka situationer ännu. Det är alltså väldigt viktigt att försiktig och fundera över hur AI-verktyg kan användas på ett etiskt sätt.

EXEMPEL: Jason M Allen och Théâtre D'opéra Spatial.

Eftersom generativ AI producerar text som är i princip oskiljaktigt från något en människa skulle kunna skriva kan det inge en känsla av att man kommunicerar med en medveten varelse. Det stämmer inte. En generativ AI är baserat på komplexa statistiska modeller och är skapade med avancerade djupinlärningstekniker som är inspirerade av neurala nätverken i en mänsklig hjärna, men den kan inte “förstå” din prompt på samma sätt som en människa kan. Prompten bryts först ner i så kallade tokens och därefter produceras ett svar baserat på träningsdatan och de statistiska modellerna. Hur sannolikt är det att detta ord följer på detta ord...

Det pågår många diskussioner kring vad som kan anses vara intelligens och hur man definierar intelligens. Det finns olika filosofiska aspekter på detta, men som användare av AI-verktyg är det helt enkelt bra att känna till begränsningarna i funktionaliteten. Man kan beskriva generativ AI som stochastic parrots vilket använder metaforen med papegojor som kan härma mänskligt tal men inte förstår vad de säger.

Generativ AI baseras på stora språkmodeller (som i sin tur är tränade på olika textsamlingar och matade med olika algoritmer) vilket gör att funktionaliteten är annorlunda från verktyg till verktyg, trots att båda är generativ AI. För att lära sig så mycket som möjligt om vad som fungerar för vardera verktyg och hur man bör prompta mest effektivt är det viktigt att inte fastna i användningen av enbart en språkmodell.

Den nuvarande versionen av ChatGPT baseras till exempel på språkmodellen GPT-4. Språkmodellen GPT-4 används också av Bing Chat Enterprise (som är betalversionen av Bing Chat). En språkmodell kan alltså användas till flera olika verktyg, även om verktygen har olika namn och ser annorlunda ut.

Ett annat exempel är att många söktjänster använder sig av sökmotorn som är utvecklad av Semantic Scholars, bland annat Research Rabbit.

Prompt engineering

Den fråga/text som du skickar in i ett AI-verktyg kallas för prompt. För att kunna generera hjälpsamma svar behöver man ofta arbeta fram en bra prompt genom att testa sig fram. Konsten/förmågan att prompta på ett effektivt sätt kallas prompt engineering.

Att interagera med en generativ AI har generellt en väldigt låg tröskel eftersom den kan tolka ett naturligt språk, men om man vill utveckla sina promptar så finns det ett antal best practice tips som man kan följa.

The CLEAR Framework

Lo, L. S. (2023). The CLEAR path: A framework for enhancing information literacy through prompt engineering. The Journal of Academic Librarianship, 49(4). https://doi.org/10.1016/j.acalib.2023.102720

Tips på olika AI-verktyg

Tänk på att AI-landskapet utvecklar sig oerhört snabbt! Det finns många hemsidor, verktyg och plugins, och det blir bara mer hela tiden. På de flesta av dessa tjänster behöver du skaffa ett konto och på många behöver du betala en prenumerera för att få tillgång till all funktionalitet. Var kritisk när du skapar konto och fundera över vilken kontroll du har över dina prompter och de genererade svaren.

Generativ AI (text, bild och video)

Informationssökning