IBM

IBM udvikler realistisk computerstemme

3 feb. 2009 16:07 - Via Telegraph - af Pernicious , redigeret af Net_Srak , indsendt af Karthas

Når en computer skal oplæse f.eks. en tekst, så kan man tydeligt høre, at det er syntetisk tale. Det har IBM arbejdet på at gøre noget ved, og de er nu klar med en ny computerstemme, som de selv mener, er den mest realistiske, der findes.

Ifølge IBM er det næsten umuligt at høre forskel på den kunstige stemme og en rigtig person. For at gøre stemmen ekstra realistisk, er der tilføjet små pauser, hosten, suk og “øhh”.

Netop disse små lyde er meget vigtige for menneskets opfattelse af en stemme, og er med til at sætte prikken over i’et.

Andy Aaron, IBM skrev:
These sounds can be incredibly subtle, even unnoticeable, but have a profound psychological effect.

IBM forestiller sig, at deres nye talesoftware kan bruges i alt fra automatisk telefonkø-systemer til kameraer, navigationssytemer og andre håndholdte enheder.

Forside
⟨
Forum
⟨
Nyheder

Gå til bund

#1 - IT-ekspert Kejser
3. feb. 2009 16:15

Gad godt at høre en prøve på den stemme - bare for at høre om det nu også er så godt som de siger.

#2 - Møller
3. feb. 2009 16:46

Hvis jeg snakker med en robot i telefonen vil jeg da gerne vide det! Så kan man i det mindste forstå, hvis den ikke fatter hvad man siger. Og host og sprut gider jeg da heller ikke høre på, hvis det kan undgås! Så pyt med at det så måske får mig til at tro, at "personen" i den anden ende er virkelig!

Men ok, det kan da tage en turing-test til næste niveau :-)

#3 - henrikmk
3. feb. 2009 16:49

#1

Måske dette:

http://www.research.ibm.com/tts/coredemo.shtml

#4 - Emilsen
3. feb. 2009 16:52

Nogle der ved om det bliver "open source"?

#5 - ToFFo
3. feb. 2009 16:53

små pauser, hosten, suk og "øhh" i Navigations systemer? :-/

Om øhh 100 meter skal du *host host* vist nok øhh til vens... nå nu kørte du forbi...
*suk* Lav en u-vending øhh og se om du kan ramme afkørslen *host* denne gang.

#6 - donoe
3. feb. 2009 17:01

/forudser faldende priser på telefonsex

#7 - Hoej
3. feb. 2009 17:03

#3 Tak for linket. Meget interessant at høre stemmen med selvvalgt tekst.
Jeg må sige at det er et fremskridt. I en telefon ville stemmen muligvis kunne lyde som et rigtigt menneske, men afspillet af computeren, er det stadig ikke 100% perfekt. Dog nærmer det sig i forhold til tidligere text-to-speech løsninger.

#8 - fastwrite1
3. feb. 2009 17:16

Min computer skal bare IKKE lære at sige ØHH til mig!!

Jeg gør alt hvad jeg kan for netop IKKE at bruge dette ord, og så vil IBM have os til at bruge det alligevel..

øhh, siger jeg bare!

;-)

#9 - Barkane
3. feb. 2009 17:31

#8
link

#10 - Emi_one
3. feb. 2009 17:41

henrikmk (3) skrev:
#1

Måske dette:

http://www.research.ibm.com/tts/coredemo.shtml

Tak. Nu ved jeg hvordan dette navn udtales: http://en.wikipedia.org/wiki/Taumatawhakatangihang...

;-)

#11 - Mikkelpf
3. feb. 2009 17:57

Er i sikre på den der er linket til er den nyheden omhandler? Jeg synes ikke den er specielt meget bedre end denne:

http://www.research.att.com/~ttsweb/tts/demo.php

som jeg har kendt til i 2-3 år, og den har sikkert været der betydeligt længere.

#12 - DrHouseDK
3. feb. 2009 18:07

Det lyder godt nok meget som Microsoft Sam (bortset fra at det er en kvinde) - sikker på det er rigtigt link, #3?

#13 - Locturian
3. feb. 2009 18:20

Hvorfor skal der hosten og støn ind i en udtale fra en computer stemme? Synes det virkede meget godt med computeren fra Star Trek (Ja, er udemærket klar over det var en rigtig stemme) - Der var ingen "host" og "pauser", blot klar udtale i naturligt flow...

#14 - Qw_freak
3. feb. 2009 18:32

altså, mon ikke der er tale om små lette lyde som der normalt er involveret i en flydende samtale...
tror ikke det er kæmpe hosteanfald, og damer der i gps'er pludselig begynder at stønne så man tror maskinen lige fik en org**me da du kørte forbi bilhandleren, vi kommer til at høre fra stemmen!

#15 - BrianB
3. feb. 2009 18:47

Jeg er da meget imponeret over hvordan det lyder.
Jeg kunne da godt tænke mig at vide hvor meget programmet fylder og hvor meget regnekraft det kræver. Jeg tænker nemlig på at det kunne være så sejt hvis det f.eks. dukker op i mobiltelefoner og fjernsyne. Men det ville da nok være mere realistisk at bare bruge samples i små apperater.

Men nu ved jeg da hvor jeg skal finde samples hvis jeg selv skulle have lyst til at bygge små stemmer ind i diverse små-apperater, så f.eks. kaffemaskinen kunne sige "Your coffee is ready".

#16 - kg
3. feb. 2009 19:02

bare vent... snart kommer det i lokaliserede dialekter, og hvis de kombinerer der med information fra facebook kan de måske også hive lidt aldersrelevant ud af det.

telefonkøer bliver aldrig det samme... hvor det før var

"Du er nu nummer 3 i køen. Vi beklager ventetiden og værdsætter din tålmodighed. Det vil blive din tur snart"

bliver det

"Ej altså, det er bare totalt vildt snart din tur, altså. Du er, øhm, vistnok, øhm, hvad-hedder-det-nu-nåja, bare SÅ tålmodig. BTW altså, har du prøvet den der nye cd fra hende der med håret? det ser bare SLET ikke nice ud på hende, men [osv]"

#17 - b4@
3. feb. 2009 19:08

Jeg syndes at det er vildt. I min første test var jeg sku i tvivl. Senere opdagede jeg dog nogle små fejl, men det er et utroligt spring fra tidligere text-to-speech.

#18 - Redrumrd
3. feb. 2009 19:19

synes umiddelbart det her lyder bedre end hvad jeg har hørt før:
text to speech

Men den er stadig ikke helt god til at finde ud af hvor trykket skal ligge, hvis det da overhoved er den omtalte stemme som der er tale om.

#19 - krainert
3. feb. 2009 20:20

Her:
http://webtts.watson.ibm.com/cgi-bin/ttsclient30?t...
;)

#20 - Taoh Rihze
3. feb. 2009 22:25

henrikmk (3) skrev:
#1

Måske dette:

http://www.research.ibm.com/tts/coredemo.shtml

Lyder ganske ok, men ikke perfekt, prøv dog lige at få den til at sige "Rød grød med fløde".

#21 - zin
4. feb. 2009 00:10

Prøv at få den til at sige noget med "Symbiosis <mere tekst her>" eller lignende. Det failer den ret hårdt på.
Bliv ved med at prøve. En dag skal det nok være sejt at komme hjem til en PC der ønsker en velkommen... Eller siger "Aaah", ligesom dørene i HHGTG.

#22 - Pagh
4. feb. 2009 01:54

Den fejler på:
Pneumonoultramicroscopicsilicovolcanoconiosis
http://en.wikipedia.org/wiki/Pneumonoultramicrosco...

#23 - knasknaz
4. feb. 2009 11:57

Det lyder som om den er sat sammen af en masse samples. Nederen at dens download-funktion er i stykker. Nogen der har fundet ud af at ekstracte .wav filerne ud af den endnu?

#24 - myplacedk
4. feb. 2009 12:40

#23
Når jeg vælger "Download" får jeg en fejl. Men når jeg vælger "SPEAK" får jeg en wav-fil.

Forside
⟨
Forum
⟨
Nyheder

Gå til top

Opret dig som bruger i dag

Det er gratis, og du binder dig ikke til noget.

Når du er oprettet som bruger, får du adgang til en lang række af sidens andre muligheder, såsom at udforme siden efter eget ønske og deltage i diskussionerne.

Opret Bruger Login

mboost-dp1

Nyheder

Seneste kommentarer i nyheder

Seneste kommentarer i forum

IBM udvikler realistisk computerstemme