mboost-dp1

Shutterstock

GitHub Copilot bandlyser 1.170 stødende ord

- Via The Register - , indsendt af arne_v

GitHub Copilot indeholder en kodet liste med 1.170 ord, som har til formål at forhindre AI-programmeringsassistenten i at reagere på input og generere output af stødende karakter, oplyser The Register.

Copilot blev udgivet tilbage i juli for at tjene som en teknisk forhåndsvisning af kode. Der er tale om en slags sofistikeret version af “source-code autocomplete”, der trækker på et OpenAI-neuralt netværk kaldet Codex, og som kan omdanne tekst til fungerende kode samt komme med forslag baseret på eksisterende kode.

GitHub er nok klar over, at dens smarte software kan fornærme andre, hvilket måske skyldes moderselskabet Microsofts ærgrelse over at se sin ‘Tay’-chatbot blive manipuleret til at efterabe hate speech.

“Den tekniske forhåndsvisning indeholder filtre til at blokere stødende ord og undgå at syntetisere forslag i følsomme sammenhænge,” forklarer GitHub på sin hjemmeside. “Grundet den underliggende teknologis korte levetid kan GitHub Copilot undertiden producere uønskede output, herunder partiske, diskriminerende, krænkende eller stødende output.”

“Der er helt sikkert en voksende bevidsthed om, at misbrug er noget, du skal tage højde for, når du implementerer en ny teknologi,” skrev Brendan Dolan-Gavitt, adjunkt i Computer Science and Engineering Department ved NYU Tandon School of Engineering, i en e-mail til The Register.

“Jeg er ikke advokat, men jeg tror ikke, at dette er drevet af regulering (selvom det måske er motiveret af et ønske om at undgå at blive reguleret. Min forestilling er, at GitHub foruden altruistiske motiver ikke ønsker at ende som emnet for den næste virale tråd om en mislykket AI,” lyder det fra Dolan-Gavitt.





Gå til bund
Gravatar #1 - larsp
7. sep. 2021 09:59
The result was a list of 1,170 disallowed words, 1,168 of which Dolan-Gavitt has decoded and posted to his website with ROT13 encoding – shifting the letters 13 places in the alphabet – to keep hate speech away from search engines and from people who stumble on the page without really wanting to see past the cipher.

Tillad mig:

from urllib import request
from codecs import encode

url = "https://moyix.net/~moyix/copilot_slurs_rot13.txt"
for line in request.urlopen(url).readlines():
_ print(encode(line.decode().strip(), 'rot_13'))

Linjen med print skal selvfølgelig have indendation, fjern _ tegnet. Ellers æder Newz indentation. Kør scriptet med python3.

Farverig liste af ord, det er en gemmer. Og lidt tragisk at man må ROT13'e den slags i dag.
Gravatar #2 - larsp
7. sep. 2021 10:14
Jeg bemærker at ordene master og slave faktisk ikke er på listen, (de nærmeste er "slavery" og "master race").

Mens man har fået renset disse farlige ord ud i nyere software APIer hænger man på dem i elektriske snitflader, prøv f.eks. at google hvad SPI signalerne MISO og MOSI står for.
Gravatar #3 - larsp
7. sep. 2021 11:02
larsp (1) skrev:
Farverig liste af ord, det er en gemmer

Og held og lykke til jer cloud folk med at gemme disse ord på google dit eller apple dat :D
Gå til top

Opret dig som bruger i dag

Det er gratis, og du binder dig ikke til noget.

Når du er oprettet som bruger, får du adgang til en lang række af sidens andre muligheder, såsom at udforme siden efter eget ønske og deltage i diskussionerne.

Opret Bruger Login