I en læseforståelses-test, udviklet på Stanford til at teste kunstige intelligensers læsefærdigheder, har en kunstig intelligens (AI), udviklet af den kinesiske virksomhed Alibaba, nu slået mennesker.
Den kinesiske online-handels platform Alibabas AI bruger såkaldt ‘Natural Language Processing’ (NLP) til at besvare kundehenvendelser for virksomheden og til at tage læseprøver som Stanford Question Answering Dataset (SQuAD).
I testen besvarede den kunstige intelligens 100.000 spørgsmål lavet ud fra 500 Wikipedia-artikler. Den kunstige intelligens skal så finde den bid tekst i en af Wikipedia-artiklerne, som kan besvare pågældende spørgsmål.
Inden testen er AI’en trænet med et lignende dataset med et antal spørgsmål lavet ud fra Wikipedia-artikler. I denne test scorede Alibabas AI 82.440, hvilket er lidt højere end den menneskelige score på 82.304.
AI’er som Alibabas er dog stadig bedst til at besvare entydige spørgsmål og ville således endnu ikke kunne slå mennesker i alle former for læseprøver, hvis f.eks. prøven krævede, at man implicit skulle finde svaret i en tekst.
Repræsentanter for Alibaba fortæller, at deres AI-teknologi er brugbar inden for mange forskellige områder så som kundeservice, museumsomvisninger eller online svar på medicinske henvendelser.