Nyt samarbejde skal udvikle sprogmodel til gavn for de små og mange
I et EU-forskningsprojekt skal Alexandra Instituttet udvikle en germansk sprogmodel. Arbejdet giver værdifuld erfaring til næste store opgave: At udvikle en dansk sprogmodel til use cases, der giver mening.
De fleste kender til og bruger allerede flittigt ChatGPT og Bard. Det er sprogmodeller i lukkede systemer, der primært er trænet på store sprog som engelsk drevet af kommercielle interesser i USA. Så nu melder EU sig på banen for de germanske sprog og for at bevare mangfoldigheden. De store systemer har nemlig en slagside, som EU og andre ikke bryder sig om. De er underlagt anden regulering og kultur, hvilket betyder, at europæerne bliver tvunget ind i systemer, der ikke lever op til europæiske værdisæt for ‘human-centered, trustworthy og democratised’ kunstig intelligens.
- Kunstig intelligens er et tog, der kører, og det kommer til at påvirke mindst 80% af arbejdsstyrken. Får vi ikke tilgodeset vores sprog, løber de andre med alle mulighederne. Vi må sikre vores sprog og yderligere opbygge vores kompetencer for at sikre egne interesser, siger Torben Blach, der er Alexandra Instituttets projektleder på det nye ambitiøse forskningsprojekt TrustLLM.
Med dette projekt kommer Alexandra Instituttets eksperter til at samarbejde med de absolut stærkeste europæiske forskere inden for sprogteknologi. Som GTS-institut er det en rolle, som instituttet tager meget seriøst. Erfaringerne skal nemlig bidrage til det nationale store stykke arbejde, der ligger foran os for med tiden at lave en dansk sprogmodel.
- Vi er nu med i den gruppe af vigtige aktører, der er gået sammen om at udvikle modellerne til de germanske sprog. Med samarbejdet opbygger vi vores kompetencer yderligere og får et førstehåndsindtryk af de data, der indsamles, og som modellerne skal trænes på, siger Torben Blach.
Med projektet etablerer EU nogle rammer og giver muligheder for, at de bedste inden for natural language-området kan arbejde sammen på tværs af EU.
Open source og AI bør gå hånd i hånd
Projektet kommer også til at kigge på både den etiske, den forskningstunge og den forretningsmæssige side af AI. Alexandra Instituttets Senior AI Specialist og ph.d. Dan Saattrup Nielsen understreger, at vi i dag ser en række begrænsninger med de modeller, der er udviklet. Derfor er den primære motivation at bruge open source-tankegangen.
Open source gør det muligt at demokratisere brugen af modeller, så de er for de mange og ikke de få. Lige nu har vi ikke nogen open source-model for det danske sprog. Derfor er vi tvunget til at bruge de amerikanske modeller. Det ønsker vi i den grad at lave om på, så ikke få men mange kan få glæde af modellerne og skabe innovation og meningsfulde use cases forklarer han.
Netop den afhængighed gør os meget sårbare, hvis de beslutter at nedlægge eller sætte prisen markant op for de modeller. Så har vi intet andet valg end at følge trop.
- Vi er afhængige af andres data og modellens struktur, som samtidig er lukket, så vi ikke kender logikken. Derfor skal vi gøre modellerne bedre og fikse de ting, som vi har set, at eksempelvis ChatGPT er skidt til. Det kan være bias, som vi gennem vores forskning skal minimere i træning af modellen. Vi skal også minimere antal gange, modellerne hallucinerer og finder på facts ud af det blå, siger Dan Saattrup Nielsen.
Fakta om TrustLLM:
Hovedmålet er at udvikle en åben, troværdig og bæredygtig sprogmodel (LLM), der i første omgang er målrettet de germanske sprog. Det skal danne grundlag for et avanceret, åbent økosystem til næste generation af modulære og udvidelige europæiske sprogmodeller, som er troværdige, bæredygtige og demokratiserede. TrustLLM-projektet og det omgivende økosystem skal muliggøre, understøtte og forbedre kontekstbevidst menneske-maskin interaktion inden for en bred vifte af anvendelser.
Partnere
LINKOPINGS UNIVERSITET (LIU) Sverige
FRAUNHOFER, Tyskland
FORSCHUNGSZENTRUM JULICH, Tyskland
LINDHOLMEN SCIENCE PARK AKTIEBOLAG, Sverige
MIOEIND EHF., Island
HASKOLI ISLANDS, Island
KØBENHAVNS UNIVERSITET, Danmark
ALEXANDRA INSTITUTTET, Danmark
NORGES TEKNISK-NATURVITENSKAPELIGE UNIVERSITET NTNU, Norge
NEDERLANDSE ORGANISATIE VOOR TOEGEPAST, Holland
Akademie für Künstliche Intelligenz, Tyskland
Finansiering
Horizon Europe Framework Programme (HORIZON) 6.9 Mio Euro.
Periode
November 2023 – Oktober 2026
Links
Alexandra Instituttet
100 eksperter under ét tag
Alexandra Instituttet hjælper offentlige og private virksomheder med at anvende den nyeste it-forskning og -teknologi. Vores udgangspunkt er samfundsmæssige problemstillinger og behov for at omsætte den nyeste forskning til innovative løsninger.
Hos os finder du stærke kompetencer inden for blandt andet computer graphics, kunstig intelligens, internet of things, big data, cybersikkerhed, interaktionsdesign og smarte produkter.
Vi arbejder i et tværfagligt miljø og er et hold af højtkvalificerede specialister, der hurtigt kan forstå din organisations og dine brugeres problemstillinger.
Følg pressemeddelelser fra Alexandra Instituttet
Skriv dig op her, og modtag pressemeddelelser på e-mail. Indtast din e-mail, klik på abonner, og følg instruktionerne i den udsendte e-mail.
Flere pressemeddelelser fra Alexandra Instituttet
AI kan finde fejl, som R&D-ingeniører overser8.5.2024 09:25:56 CEST | Pressemeddelelse
Ingeniørfirmaet RD8 hjælper fremstillingsvirksomheder med at undgå dyre designfejl. Et AI Denmark-forløb med Alexandra Instituttet har vist, at kunstig intelligens fremover kan gøre deres software til fejldetektion endnu stærkere.
Ambitiøst konsortium sætter fart på danske sprogmodeller7.5.2024 06:25:00 CEST | Pressemeddelelse
Med Alexandra Instituttet, IBM Danmark og Dansk Erhverv i spidsen går de første danske private og offentlige organisationer nu sammen om at skabe danske sprogmodeller. Modellerne bygger på ufravigelige principper om ansvarlig AI.
Deltag i dialog om jeres behov for ny teknologisk viden30.4.2024 14:30:00 CEST | Pressemeddelelse
Kunstig intelligens, digitalt sundhedsvæsen og grøn omstilling – hvor har danske virksomheder mest brug for ny viden, der bringer dem sikkert ind i fremtiden? Det har GTS-institutterne netop fremlagt deres forslag til, og de er nu i høring. Indsatserne skal løbe de næste fire år.
Stålsat på scope 3 og solide CO2-data23.4.2024 21:53:29 CEST | Pressemeddelelse
Randers Gears har produceret tandhjul og gear af stål siden 1920 og er midt i en digital og bæredygtig omstilling. Solide CO2-data fik dem til at skifte leverandør og selv blive kundernes foretrukne leverandør.
GreenTec når længere med grønne greb18.4.2024 08:16:55 CEST | Pressemeddelelse
GreenTec A/S i Kolding har produceret maskiner til pleje og vedligeholdelse af grønne arealer i over 40 år. Nu er familiefirmaet midt i en større digital og bæredygtig omstilling og har bl.a. halveret udgifterne og sparet 70 ton CO2-udslip på deres transport om året.
I vores nyhedsrum kan du læse alle vores pressemeddelelser, tilgå materiale i form af billeder og dokumenter samt finde vores kontaktoplysninger.
Besøg vores nyhedsrum