Aarhus Universitet: Arts

Nu kan forskere lave tekstlæsning på epo

Del

Et nyt datacenter giver de humanistiske forskere på Aarhus Universitet mulighed for at analysere store mængder data og bruge kunstig intelligens i deres arbejde.

Foto: colourbox.com
Foto: colourbox.com

Kan man lave et computerprogram, der kan forstå tekster lige så godt som en knivskarp forsker? Ja, det kan man faktisk. Og man kan også sætte det til at læse millioner af artikler fra det 20. århundrede og komme med en analyse af, hvornår, hvordan og hvorfor tonen i den offentlige debat ændrer sig. Eller gennemtrevle patientjournaler fra psykiatrien og undersøge, om man kan forudsige, hvornår patienter bliver udsat for tvang i psykiatrien. Det er netop den slags opgaver, som det nye Center for Humanities Computing Aarhus på Aarhus Universitet har kastet sig over at løse i samarbejde med universitetets forskere.  

”Hvis en forsker fx er interesseret i kønsproblematikker og kvindebilleder i danske tekster fra 1800-tallet, så har vi udviklet en database, der kan tage højde for alle de mange semantiske varianter eller stavemåder af ordet kvinde, der findes. Det betyder, at du som forsker kan hælde 100.000 sider i databasen og lave en slags tekstlæsning på epo,” siger Kristoffer Laigaard Nielbo, der er lektor i religionsvidenskab på Aarhus Universitet og leder af det nye center, som skal hjælpe forskerne med at få fingrene i endnu flere data – på en langt mere effektiv måde.

”Vores opgave er at hjælpe forskerne med at skalere deres forskning til den datadrevne virkelighed. Alt, hvad der rimer på data og kunstig intelligens, er oppe i tiden på stort set alle felter – også den humanistiske forskning er ramt af dataflodbølgen. Men det er virkelig en tsunami af data, der strømmer imod os, og det kan den enkelte forsker ikke selv håndtere. Derfor skal vi udvikle en infrastruktur og nogle teknikker til at håndtere tsunamien og få automatiseret opgaverne, så vores forskere ikke skal bruge al deres tid på at analysere enorme mængder data,” fortæller Kristoffer Laigaard Nielbo.

Ægte intelligens driver den kunstige

Det er en væsentlig pointe for Kristoffer Laigaard Nielbo, at teknologien og den kunstige intelligens ikke er en trussel mod forskernes virke. Tværtimod, fremhæver han, er hele brugen af teknologi drevet af den viden, forskerne har – men den bliver sat i spil på en anden måde i dag.

”Traditionelt har viden været den største værdi på et universitet. Nu viser det sig så også, at de data vi genererer, indsamler og kuraterer har en enormt stor værdi for os. Det er en transformation, som kræver, at vi bygger en organisation, der kan håndtere og værdsætte de data. Hvad gør man som forsker, når man skal samarbejde med en ingeniør eller kode noget? Og hvordan navigerer man i de regler, der er om data, så man ikke gør noget ulovligt?”

Det nye Center for Humanisties Computing Aarhus holder til på Institut for Kultur og Samfund på Aarhus Universitet og samarbejder med en række forskellige netværk og nationale ressourcer. Lige nu foregår meget af centerets arbejde ’oppe i skyen’, som Kritstoffer Laigaard Nielbo siger, med henvisning til, at centeret køber sig til serverplads. Men han regner med, at udviklingen går i en retning, hvor universitetet i løbet af en årrække vil have sine egne supercomputere.  

Fra bøvl til hjælp
Centeret har groft skitseret to forskellige typer opgaver; dels at hjælpe den enkelte forsker med konkrete dataprojekter og dels at udvikle en datainfrastruktur og nogle redskaber, som håndterer de problemstillinger, forskerne møder. Det kan fx være såkaldt datamanagement, der handler om alt fra sikker opbevaring af personfølsomme data til udvikling af databaser, der muliggør mere avancerede søgninger end et klassisk regneark.

”Det virkelig interessante ved at bruge teknologien i forskning er, når vi kan udvikle metoder, som opleves som en hjælp og understøttelse og ikke som noget, der gør det hele mere besværligt. De humanistiske forskere skal ikke være teknologieksperter. De skal bare komme med deres specialviden og formulere interessante spørgsmål,” siger Kristoffer Laigaard Nielbo.

I øjeblikket er sprogteknologien et af de områder, der er i rivende udvikling. Det betyder, at fagområder som historie, litteratur- eller religionsvidenskab i stor stil rækker ud efter de digitale muligheder. Ud over at give forskerne et større datagrundlag, kan de digitale teknologier også lette deres arbejde meget konkret. Det sker blandt andet i udviklingen af digitale hjælpemider.

”Et eksempel er, at vi sammen med SDU er ved at udvikle et redskab, der kan lave tale om til tekst. Vi bygger videre på teknologier, som findes i dag, men som ikke er i stand til fx at sortere støj fra. Det vil betyde, at forskerne kan lave båndoptagelser, når de fx laver interviews, og sætte et computerprogram til at udføre det hårde arbejde med at transkribere,” fortæller Kristoffer Laigaard Nielbo

Læs mere på chcaa.io

Kontakter

Kristoffer Laiggard Nielbo, lektor
Center for Humanities Computing Aarhus
ARTS, Aarhus University, Denmark
email: kln@cas.au.dk
mobile: +45 2683 2608

Billeder

Foto: colourbox.com
Foto: colourbox.com
Download

Links

Information om Aarhus Universitet: Arts

Aarhus Universitet: Arts
Aarhus Universitet: Arts



Følg pressemeddelelser fra Aarhus Universitet: Arts

Skriv dig op her, og modtag pressemeddelelser på e-mail. Indtast din e-mail, klik på abonner, og følg instruktionerne i den udsendte e-mail.

Flere pressemeddelelser fra Aarhus Universitet: Arts

Talblinde elever skal findes med ny test3.6.2019 10:18:25 CESTPressemeddelelse

Ansatte på DPU, Aarhus Universitet og Professionshøjskolen Absalon har udviklet de første forskningsbaserede testmaterialer for talblindhed i Danmark. Målet er at få identificeret og støttet elever omkring 4. klasse, som kan være velbegavede, men som døjer med en decideret funktionsnedsættelse, når det handler om tal og grundlæggende regnefærdigheder. Der er behov for at materialerne nu afprøves mere i praksis.

I vores nyhedsrum kan du læse alle vores pressemeddelelser, tilgå materiale i form af billeder og dokumenter samt finde vores kontaktoplysninger.

Besøg vores nyhedsrum