På Contentor utvecklar vi ständigt vår AI integreringsmotor och hur den kan optimeras för flerspråkigt innehåll - särskilt för e-handelsföretag som är beroende av sömnlösa, högkvalitativa översättningar av produkter och annat innehåll. Eftersom nya AI-översättningsmodeller dyker upp i snabb takt inledde vi nyligen en utvärdering i samarbete med Custom.MT, för att gräva i DeepSeek och dess förmåga. Granskningen gjordes på olika språkpar och vårt huvudfokus låg på ett språkpar som är kritiskt för våra kunder men som ofta är inte så testat globalt: Svenska till norska.
Vårt mål? Att se hur väl olika AI-modeller hanterar översättningskvalitet och användbarhet.
Vi valde ut 68 olika textsegment, vilket totalt blev över 10 000 analyserade ord, från olika typer av innehåll som är relevanta för våra kunder. Översättningarna genererades med hjälp av tre AI-modeller:
De översatta texterna slumpades sedan ut och granskades blint av professionella norska lingvister, som utvärderade noggrannhet, flyt och användbarhet utifrån följande skala:
Utvärderingen avslöjade viktiga styrkor och svagheter hos de olika modellerna:
Vår analys visar att DeepSeek är en lovande modell, som för närvarande kräver mer finjustering för att matcha användbarhetsgraden för GPT-4o och Google Translate.
Vi testade också några av dessa mot vår Lexi-modell, som är vår egen version av AI-lager. Men eftersom dessa är anpassade för varje kund är de svårare att jämföra mellan segment, så de kunde inte enkelt läggas in i dessa resultat. Håll ögonen öppna för ett separat inlägg om det.
Granskningen som gjordes av Custom.MT fokuserade på fler språkpar än bara svenska - norska: Tjeckiska till ungerska, franska till italienska, turkiska till ryska, franska till tyska och engelska till japanska. Några viktiga saker att ta med sig från deras analys:
Kanske viktigast av allt är att dessa tester förstärker en kritisk trend inom AI-översättning: modeller som är open-source. Detta kan leda till att fler företag utvecklar sina egna AI-översättningsmodeller i stället för att förlita sig på traditionella kommersiella verktyg.
Men testerna visar också att DeepSeek fortfarande står inför betydande utmaningar när det gäller stabilitet, efterlevnad av instruktioner och integration för arbetsflöden med stora volymer. För företag som letar efter snabb, skalbar och tillförlitlig AI-översättning idag är modeller som GPT-4o fortfarande det bästa alternativet.
Det här testet bekräftar det vi redan visste: AI-översättning utvecklas snabbt, men företag behöver fortfarande smarta arbetsflöden, strategiska AI-val och mänsklig expertis för att säkerställa högkvalitativa resultat. Vi är glada över att ha partners som Custom.MT som utforskar olika modeller och deras prestanda på olika språk.
I takt med att nya modeller som DeepSeek dyker upp kommer landskapet att fortsätta att förändras. Men en sak är säker: De företag som investerar i att optimera AI-arbetsflöden kommer att ligga steget före på de globala marknaderna.
På Contentor arbetar vi i skärningspunkten mellan AI-innovation och mänsklig expertis. För varje kund gör vi följande:
Genom att också möjliggöra integration direkt kan vi ge kunderna tillgång till alla AI-modeller genom ett API, vilket gör det mycket enklare att byta modeller när nya dyker upp eller spännande modeller förbättras mycket. Detta gör AI-översättning till skalbara arbetsflöden, vilket gör det enklare för e-handelsföretag att hantera stora volymer flerspråkigt innehåll på ett effektivt sätt.
Vill du testa olika AI-motorer själv? Prova på AI-översättning och jämför på hub.contentor.com.