Alexandra Instituttet

Alexandra Instituttet indgår samarbejde med DR og Infomedia om udvikling af dansk sprogteknologi

Del

For at vi kan få god dansk sprogteknologi, skal vi lære computere dansk. Til det formål har vi brug for rigtig meget dansk tekst. Derfor er Alexandra Instituttet indgået i et samarbejde med DR og Infomedia, så vi kan træne computerne på danske artikler og debatindlæg.

Med afsæt i danske tekster fra DR og Infomedia er Alexandra Instituttet i gang med at udvikle modeller, der f.eks. kan gøre chatbots nemmere at kommunikere med, og som med stor præcision kan skabe overblik over trends i holdningsytringer i store mængder af data fra sociale medier. 

Ifølge Infomedias Head of Technology, Claus Lindquist Henriksen, er arbejdet med at udvikle dansk sprogteknologi en vigtig mission:

– Vi analyserer tæt på 50.000 danske tekster hver dag, og udviklingen af dansk sprogteknologi er afgørende for, at vi fortsat kan levere relevante indsigter i stadigt stigende mængder af data. Det danske sprog er meget småt i en global kontekst, og hvis vi skal kunne måle os med internationale tech-giganter inden for AI, må vi samle viden, data og teknologi i et projekt som det her. AI skal ikke kun være forbeholdt de internationale tech-giganter men også danske virksomheder med globale ambitioner, siger Claus Lindquist Henriksen.

Udnyt teknologiens muligheder på dansk

Vi møder allerede sprogteknologi mange steder i vores hverdag. Når din mail selv frasorterer spam-mails, eller din mobil foreslår det næste ord, når du er ved at skrive en besked. Men teknologierne er primært udviklet på engelsk, mens dansk som et lille sprogområde ikke har fået opmærksomhed fra de tech-giganter, der er længst fremme med sprogteknologierne.

Gennem dette samarbejde udvikler vi dansk sprogteknologi, så både det private og det offentlige kan udnytte fordelene ved at bruge teknologierne.

Med afsæt i danske tekster fra DR og Infomedia udvikler Alexandra Instituttets AI-eksperter modeller, der f.eks. kan gøre chatbots nemmere at kommunikere med, kan skabe overblik over trends i holdningsytringer i store mængder af data fra sociale medier og kan finde personer i en tekst med stor præcision.

Sidstnævnte vil blandt andet kunne bruges til at forbedre søgninger efter personer i tekster, fordi vi med modellen ikke bare leder efter et navn, men også efter hvordan en person typisk optræder grammatisk i en tekst.  Systemet vil på den måde kunne styre udenom typiske tvetydige navne som ”Hans”, ”Ane” eller ”Sten”, som også er udsagns- eller navneord. Det kan f.eks. også bruges til nemt at finde og sløre navne i en tekst, f.eks. i forhold til GDPR.

– I DR ligger vi i sagens natur inde med meget dansksproget tekst, hvorfor vi er glade for et projekt som dette. Til dels fordi det kan hjælpe os i forståelsen af store tekstmængder, men også fordi det for DR er vigtigt at være en del af videnudviklingen i samfundet, hvor vi i samarbejde med andre udvikler vores forståelse af vigtige emner, siger Cæcilie Bach Kjærulf, medieforsker i DR.

Dette projekt kan potentielt give et skub til de digitale teknologier på dansk, hvilket kan være nyttigt for en lang række virksomheder, offentlige institutioner og andre interessenter, som vil arbejde med machine learning, AI og lignende – på dansk.

Vigtigt samarbejde

Det er rigtig vigtigt for projektets mission, at både DR og Infomedia har valgt at takke ja til samarbejdet.

– Det er så vigtigt, at vi i vores arbejde har store mængder god, dansk tekst. Både så vi i Danmark kan bruge teknologierne til at forbedre vores indbyrdes kommunikation, og så vi kan bevare dansk som sprogområde med alle vores særegne kendetegn som f.eks. ironi. Der ligger meget mellem linjerne i sproget, og det er ikke en nem nød at knække at sætte det på formel, forklarer Anne Bøgh Fangel. Hun er projektleder på Dansk for Alle-projektet i Alexandra Instituttet. 

Ifølge Anne Bøgh Fangel er det en vigtig nød at knække. For hvis computeren tager alt bogstaveligt, så vil den misse de kulturelle koder i sproget, og så bliver kommunikationen ikke god nok.

FAKTA

Vi gør en dyd ud af at bruge åbne metoder og lægge vores modeller frem, så I kan få glæde af dem! Der er flere måder at følge med i vores arbejde på :

  • Start med vores hjemmeside danlp.alexandra.dk, hvor vi giver en introduktion til vores arbejde og NLP – natural language processing – og guider dig hen til den del af vores arbejde, du får mest ud af at kigge videre på. 
  • For en lidt dybere indføring i sprogteknologiens verden skal du hoppe til vores blog https://medium.com/danlp, hvor vi løbende skriver om udviklingen af sprogteknologierne – og de muligheder og udfordringer vi støder på undervejs. 

     
  • Og er du klar til at bruge sprogteknologi i dit arbejde, så er det værd at kigge nærmere på vores Github https://github.com/alexandrainst/danlp, hvor vi lægger vores modeller ud til fri afbenyttelse. De første er allerede klar – og vi vil rigtig gerne høre, hvad du synes om dem, når du har afprøvet dem. 

Hvis dansk sprogteknologi skal blive godt, skal vi arbejde sammen – så tak for at følge med!

Nøgleord

Billeder

Information om Alexandra Instituttet

Alexandra Instituttet
Åbogade 34 · Rued Langgaards Vej 7
8200 Aarhus N · 2300 København S

+45 70 27 70 12https://alexandra.dk

100 eksperter under ét tag 

Alexandra Instituttet hjælper offentlige og private virksomheder med at anvende den nyeste it-forskning og -teknologi. Vores udgangspunkt er samfundsmæssige problemstillinger og behov for at omsætte den nyeste forskning til innovative løsninger. 

Hos os finder du stærke kompetencer inden for blandt andet computer graphics, kunstig intelligens, internet of things, big data, cybersikkerhed, interaktionsdesign og smarte produkter

Vi arbejder i et tværfagligt miljø og er et hold af højtkvalificerede specialister, der hurtigt kan forstå din organisations og dine brugeres problemstillinger.

 
 

Følg pressemeddelelser fra Alexandra Instituttet

Skriv dig op her, og modtag pressemeddelelser på e-mail. Indtast din e-mail, klik på abonner, og følg instruktionerne i den udsendte e-mail.

Flere pressemeddelelser fra Alexandra Instituttet

AR-teknologi træner mejerister fra hele Norden i digital beslutningsstøtte15.9.2022 09:51:21 CEST | Pressemeddelelse

Alexandra Instituttet har i samarbejde med FORCE Technology og Kold College i Odense bygget en digital tvilling af et pasteuriseringsanlæg, som står for varmebehandling i et mejeri. Det gør op med den traditionelle måde at interagere med produktionen. I stedet for at du styrer maskinen via en skærm med knapper, så kan du gå rundt i produktionen i augmented reality og tage status på maskinernes tilstand.

Digitalt værktøj sparer tid og øger kvaliteten hos hjemmeplejefirmaer3.8.2022 14:00:43 CEST | Pressemeddelelse

Manglende overblik og koordinering er blandt de største tidsrøvere for hjemmeplejesektoren. En it-løsning, der er udviklet af Alexandra Instituttet med inddragelse af en række hjemmeservicevirksomheder, gør det langt nemmere at flytte rundt på aftalerne med borgerne. Virksomhederne har dermed kunnet vinke farvel til gule sedler, overtegnede whiteboards og et puslespil af udprintede vagtplaner.

Vi vil hylde produktionsvirksomheder, der har fremmet bæredygtighed gennem øget digitalisering – er det jer?18.5.2022 13:42:47 CEST | Pressemeddelelse

Vi vil gerne bringe jeres gode historier frem i lyset, så I produktionsvirksomheder, der allerede er godt i gang med digitalisering og bæredygtighed, kan inspirere andre virksomheder. En datadrevet bæredygtig omstilling af produktionsindustrien er ikke bare en nødvendighed, hvis vi skal reducere CO2-udledningen med 70% i 2030, det kan samtidig styrke virksomhedernes vækst og konkurrenceevne. Hvis vi får de gode historier frem i lyset, vil andre tænke ”hvis de kan, så kan jeg også” og dermed spredes ringene i vandet.

I vores nyhedsrum kan du læse alle vores pressemeddelelser, tilgå materiale i form af billeder og dokumenter samt finde vores kontaktoplysninger.

Besøg vores nyhedsrum