Contentor blogg

ChatGPT på ren svenska

Skriven av Nadia Nazarbaeva | 13 feb 2024

Konsten att uttrycka sig och interagera med artificiell intelligens har spridit sig hela vägen till Sverige och det svenska språket. Hur kan ChatGPT från Open AI tillämpas på svenska och hur är dess förmågor gällande både innehållsskapande och översättning? Vi diskuterar även dess påverkan på den kreativa processen gällande skrivande. Det vill säga, vad som är bra att veta inför användandet av ChatGPT på svenska.

ChatGPT har utvecklats av OpenAI som är en välkänd och betydande aktör inom arbetet med artificiell intelligens och maskininlärning. I sitt arbete för att främja “vänlig” AI till nytta för samhället har de tagit fram produkter och teknologier som den stora språkmodellen GPT (tekniken som ChatGPT är byggd på) och bildgenereringsmodellen DALL-E. 

Open AI:s arbete påbörjades 2015 när en grupp forskare, ingenjörer och entreprenörer organiserade ett idéellt forskningsbolag med syfte att samla och utbyta kunskap om AI. Några nyckelpersoner i bolaget är och har varit Sam Altman och Elon Musk vars namn klingar bekant för många. Under åren har OpenAI arbetat för att göra sin forskning mer tillgänglig bland annat genom att via API:er ge möjlighet för utvecklare att integrera med bolagets olika modeller. Sedan 2019 har OpenAI både idéella och kommersiella aspekter. 

ChatGPT:s förmågor på svenska

Sedan slutet av november 2022 blev ChatGPT tillgänglig för allmänheten. Även om svenska är ett relativt litet språk finns ChatGPT och flera av OpenAI:s produkter tillgängliga på språket. Svenskan bjuder på utmaningar som komplex grammatik och många språkregler och undantag.  Trots det har chatboten visat sig ha en god förståelse och förmåga att kunna kommunicera på svenska. 

Alla svar som ChatGPT ger på anrop bygger på maskininlärning. Den har alltså matats med mängder av data för att kunna hitta mönster och samband och sedan anpassa sina interna algoritmer och parametrar. Hur bra svar ChatGPT kan ge om ett ämne beror alltså på hur mycket data som finns om ämnet och hur mycket av datan som den övats på. Det är därför det finns skillnader i chatbotens kompetenser på olika språk. Ett stort språk som engelska har ju enorma volymer av data för ChatGPT att tränas på, vilket naturligtvis leder till att den har bäst förmåga att kommunicera på just engelska. Jämför man med ett mindre språk där det inte finns lika mycket data att hämta är det inte konstigt att ChatGPT kommunicerar och formulerar sig på en något lägre nivå.

Även om alla svar på svenska inte alltid är hundra procent grammatiskt korrekta är de övergripande språkkunskapen och genereringen av svensk text imponerande.

Hur mycket vet ChatGPT egentligen?

Många gör misstaget att använda ChatGPT som ett lexikon -  vilket inte är så konstigt med tanke på att svaren i många fall stämmer och chatbotens argumentation för både sina korrekta och felaktiga svar. Intressant nog vet ChatGPT egentligen ingenting och den besitter inte någon kunskap i samma bemärkelse som människor gör. Baserat på sin träningsdata identifierar ChatGPT språkliga mönster och gissar sig fram till ett svar utifrån det. Svaren på anrop och frågor är alltså inte egentliga svar, utan snarare svar på hur frågan “ska” besvaras ur ett språkligt perspektiv. 

Se exemplet med ChatGPT:s svar på frågan: Vad väger tyngst, ett kilo bly eller två kilo bomull?

Svaret är välformulerat och argumenterar för sin sak, men det innehåller faktafel. Om frågan istället varit vad väger mest ett kilo bly eller ett kilo bomull hade svaret stämt. 

ChatGPT:s svar är alltså beroende av sin träningsdata. För tillfället har den endast tränats på data fram till september 2021 och det är bra att ha i åtanke då den alltså inte har tillgång till information och händelser som skett efter det. 

Det här beroendet av träningsdata gör också att ChatGPT:s förmåga att generera tillförlitliga svar kan bli påverkad av smutsiga datakällor. Det vill säga data som är ofullständig, otydlig eller felaktig. Om den övas på alldeles för mycket felaktig data och letar efter samband och mönster, produceras motsägelsefulla och inkorrekta svar. När det gäller språk där det finns mindre träningsdata jämfört med engelskan tenderar ChatGPT att “ljuga” mer. Detta gör att det är ännu viktigare att faktagranska alla svar om man använder chatboten på svenska eller något annat mindre språk.

ChatGPT till översättning

En av de funktioner som ChatGPT kan utföra är översättningar. Av alla gratis översättningsprogram är just nu Google Translate det mest dominerande. Med tanke på att ChatGPT finns tillgängligt fritt för allmänheten är det möjligt att den kan bli en värdig konkurrent bland andra gratis översättningsverktyg. När det gäller översättningar varierar chatbotens kompetens beroende på språk och framför allt tillgången till träningsdata. Mellan de språk där det finns mindre data blir översättningarna lite sämre och där det finns större tillgångar håller de en högre kvalitet. 

Det speciella med att använda ChatGPT till att översätta är att man själv som användare kan ge kontext till det som ska översättas och önskemål om tonalitet. Det är även möjligt att ge feedback till texten som genereras. Även om Google Translate än så länge gör något bättre översättningar på vissa språk, så saknar den många av de förmågor som ChatGPT har. 

Den kreativa processens påverkan

Användandet av ChatGPT kan få skeptiker att anklaga användarna av AI-modellen för att ha brist på kreativitet. Andra hävdar att den snarare kan vara ett verktyg som stimulerar och stöttar den kreativa processen. 

Det kan dock finnas vissa delar i användningen av ChatGPT som har utmaningar när det gäller kreativitet. Som vi gått igenom tidigare har den tillgängliga träningsdatan en stor påverkan. Det kan alltså påverka hur kreativa och användbara svar den kan ge på anrop som har att göra med mindre vanliga ämnen - såsom specifika nischer och lite ovanligare konstformer och stilar.

Hur kreativ ChatGPT är i sina svar hänger också mycket på hur kreativ man är som användare i anropet. Den är beroende av input och feedback för att generera kreativa svar utifrån användarens önskemål, annars finns risk att de blir repetitiva och enformiga. Detta är för att ChatGPT är programmerad att anpassa sig efter sina användares preferenser och behov. ChatGPT kan inte komma med några egna idéer, men däremot kan den vara ett hjälpmedel för användaren att utforska och ta vara på sina idéer.

Vi befinner oss i den digitala eran där kommunikation och teknik utvecklas konstant. Att använda ChatGPT och dessutom på svenska är en banbrytande möjlighet som öppnar upp många dörrar. Med kunskap om verktygets styrkor och svagheter kan det användas på ett optimalt sätt och förenkla många delar i företags processer med både översättning och innehållsskapande. 

 

Läs här  om hur Contentor interagerar med AI-drivna program som ChatGPT i sina tjänster.