Alexandra Instituttet

Alexandra Instituttet indgår samarbejde med DR og Infomedia om udvikling af dansk sprogteknologi

Del

For at vi kan få god dansk sprogteknologi, skal vi lære computere dansk. Til det formål har vi brug for rigtig meget dansk tekst. Derfor er Alexandra Instituttet indgået i et samarbejde med DR og Infomedia, så vi kan træne computerne på danske artikler og debatindlæg.

Med afsæt i danske tekster fra DR og Infomedia er Alexandra Instituttet i gang med at udvikle modeller, der f.eks. kan gøre chatbots nemmere at kommunikere med, og som med stor præcision kan skabe overblik over trends i holdningsytringer i store mængder af data fra sociale medier. 

Ifølge Infomedias Head of Technology, Claus Lindquist Henriksen, er arbejdet med at udvikle dansk sprogteknologi en vigtig mission:

– Vi analyserer tæt på 50.000 danske tekster hver dag, og udviklingen af dansk sprogteknologi er afgørende for, at vi fortsat kan levere relevante indsigter i stadigt stigende mængder af data. Det danske sprog er meget småt i en global kontekst, og hvis vi skal kunne måle os med internationale tech-giganter inden for AI, må vi samle viden, data og teknologi i et projekt som det her. AI skal ikke kun være forbeholdt de internationale tech-giganter men også danske virksomheder med globale ambitioner, siger Claus Lindquist Henriksen.

Udnyt teknologiens muligheder på dansk

Vi møder allerede sprogteknologi mange steder i vores hverdag. Når din mail selv frasorterer spam-mails, eller din mobil foreslår det næste ord, når du er ved at skrive en besked. Men teknologierne er primært udviklet på engelsk, mens dansk som et lille sprogområde ikke har fået opmærksomhed fra de tech-giganter, der er længst fremme med sprogteknologierne.

Gennem dette samarbejde udvikler vi dansk sprogteknologi, så både det private og det offentlige kan udnytte fordelene ved at bruge teknologierne.

Med afsæt i danske tekster fra DR og Infomedia udvikler Alexandra Instituttets AI-eksperter modeller, der f.eks. kan gøre chatbots nemmere at kommunikere med, kan skabe overblik over trends i holdningsytringer i store mængder af data fra sociale medier og kan finde personer i en tekst med stor præcision.

Sidstnævnte vil blandt andet kunne bruges til at forbedre søgninger efter personer i tekster, fordi vi med modellen ikke bare leder efter et navn, men også efter hvordan en person typisk optræder grammatisk i en tekst.  Systemet vil på den måde kunne styre udenom typiske tvetydige navne som ”Hans”, ”Ane” eller ”Sten”, som også er udsagns- eller navneord. Det kan f.eks. også bruges til nemt at finde og sløre navne i en tekst, f.eks. i forhold til GDPR.

– I DR ligger vi i sagens natur inde med meget dansksproget tekst, hvorfor vi er glade for et projekt som dette. Til dels fordi det kan hjælpe os i forståelsen af store tekstmængder, men også fordi det for DR er vigtigt at være en del af videnudviklingen i samfundet, hvor vi i samarbejde med andre udvikler vores forståelse af vigtige emner, siger Cæcilie Bach Kjærulf, medieforsker i DR.

Dette projekt kan potentielt give et skub til de digitale teknologier på dansk, hvilket kan være nyttigt for en lang række virksomheder, offentlige institutioner og andre interessenter, som vil arbejde med machine learning, AI og lignende – på dansk.

Vigtigt samarbejde

Det er rigtig vigtigt for projektets mission, at både DR og Infomedia har valgt at takke ja til samarbejdet.

– Det er så vigtigt, at vi i vores arbejde har store mængder god, dansk tekst. Både så vi i Danmark kan bruge teknologierne til at forbedre vores indbyrdes kommunikation, og så vi kan bevare dansk som sprogområde med alle vores særegne kendetegn som f.eks. ironi. Der ligger meget mellem linjerne i sproget, og det er ikke en nem nød at knække at sætte det på formel, forklarer Anne Bøgh Fangel. Hun er projektleder på Dansk for Alle-projektet i Alexandra Instituttet. 

Ifølge Anne Bøgh Fangel er det en vigtig nød at knække. For hvis computeren tager alt bogstaveligt, så vil den misse de kulturelle koder i sproget, og så bliver kommunikationen ikke god nok.

FAKTA

Vi gør en dyd ud af at bruge åbne metoder og lægge vores modeller frem, så I kan få glæde af dem! Der er flere måder at følge med i vores arbejde på :

  • Start med vores hjemmeside danlp.alexandra.dk, hvor vi giver en introduktion til vores arbejde og NLP – natural language processing – og guider dig hen til den del af vores arbejde, du får mest ud af at kigge videre på. 
  • For en lidt dybere indføring i sprogteknologiens verden skal du hoppe til vores blog https://medium.com/danlp, hvor vi løbende skriver om udviklingen af sprogteknologierne – og de muligheder og udfordringer vi støder på undervejs. 

     
  • Og er du klar til at bruge sprogteknologi i dit arbejde, så er det værd at kigge nærmere på vores Github https://github.com/alexandrainst/danlp, hvor vi lægger vores modeller ud til fri afbenyttelse. De første er allerede klar – og vi vil rigtig gerne høre, hvad du synes om dem, når du har afprøvet dem. 

Hvis dansk sprogteknologi skal blive godt, skal vi arbejde sammen – så tak for at følge med!

Nøgleord

Billeder

Information om Alexandra Instituttet

Alexandra Instituttet
Alexandra Instituttet
Åbogade 34 · Njalsgade 76, 3. sal
8200 Aarhus N · 2300 København S

+45 70 27 70 12https://alexandra.dk

100 eksperter under ét tag 

Alexandra Instituttet hjælper offentlige og private virksomheder med at anvende den nyeste it-forskning og -teknologi. Vores udgangspunkt er samfundsmæssige problemstillinger og behov for at omsætte den nyeste forskning til innovative løsninger. 

Hos os finder du stærke kompetencer inden for blandt andet computer graphics, kunstig intelligens, internet of things, big data, it-sikkerhed, interaktionsdesign og smarte produkter. 

Vi arbejder i et tværfagligt miljø og er et hold af højtkvalificerede specialister, der hurtigt kan forstå din organisations og dine brugeres problemstillinger.

 
 

Følg pressemeddelelser fra Alexandra Instituttet

Skriv dig op her, og modtag pressemeddelelser på e-mail. Indtast din e-mail, klik på abonner, og følg instruktionerne i den udsendte e-mail.

Flere pressemeddelelser fra Alexandra Instituttet

Ny rapport: Hvor går det galt, når 80% af alle kunstig intelligens-projekter ikke bliver til noget?8.10.2020 11:44:47 CESTPressemeddelelse

Det succesfulde AI-projekt starter med en god idé. Det er afgørende, men ikke alt… Mens virksomheder forventer, at de skal bruge energi på at få den helt rigtige idé, så er færre klar over, at den egentlige udfordring oftere er at have nok data i god kvalitet og at få organisationen med på projektet. Det er en af konklusionerne i en ny rapport fra Alexandra Instituttet om anvendt kunstig intelligens, der er skrevet på baggrund af 22 danske virksomheders erfaringer med at bruge teknologien.

Virtuel konference: Digitale teknologier som løftestang for grøn omstilling5.10.2020 09:59:01 CESTPressemeddelelse

Den grønne omstilling sker ikke af sig selv. Den skal have et stort skub af os alle – politikere, borgere og virksomheder. Men kan dette skub få medvind fra digitale teknologier? Det er vi i InfinIT overbeviste om! Derfor dedikerer vi en hel dag til den agenda og spørger nogle af landets førende eksperter; Hvordan kan it tjene som løftestang for den grønne omstilling – og hvordan leder vi os derhen, hvor det rent faktisk sker?

I vores nyhedsrum kan du læse alle vores pressemeddelelser, tilgå materiale i form af billeder og dokumenter samt finde vores kontaktoplysninger.

Besøg vores nyhedsrum