Microsoft Research Investerar bättre än mänsklig taligenkänning

$config[ads_kvadrat] not found

Microsoft представила свой... iMac

Microsoft представила свой... iMac
Anonim

Microsoft har blivit världens första företag för att utveckla program för taligenkänning som är mer exakt än människor. I papperet "Uppnå mänsklig paritet i konversationskommunikation", som publicerades måndagen, producerade mjukvaran utskrifter som innehöll en halv procent färre fel än mänskliga ansträngningar, vilket är otroligt med tanke på hur bra människor förstår talet. Genombrottet öppnar dörren för nya A.I. assistenter som är mer exakta än någonsin tidigare.

Det är imponerande hur långt tekniken har kommit på så kort tid. Det var inte för länge sen att datorns taligenkänning var en konstig nisch som verkade hopplöst avlägsen. Titta på denna demonstration av Windows Vistas talprogram från 2006:

Teamet använde National Institute of Standards and Technology (NIST) 2000-testet, som användes över hela branschen för att mäta tillförlitligheten av prenumerationer. En konversation sker mellan två deltagare via telefon, vänd för tur innan det resulterande skriptet jämförs och kontrolleras mot ordlistorna.

I växeldelen, där två främlingar talar för första gången, är den mänskliga felfrekvensen cirka 5,9 procent, medan i samtalshemsdelen, där två personer som känner varandra talar, är felprocenten cirka 11,3 procent. Microsofts mjukvara gjorde en 0,4 procent lägre felfrekvens.

Genombrottet kommer att hjälpa till med att ge nya former av nedsänkande A.I.. I augusti tog Joshua Browder studenten bort sin DoNotPay chatbot, vilket kan hjälpa hemlösa att få gratis juridisk rådgivning. Kombinerat med erkännandeutvecklingar är det enkelt att visa en framtid där människor frågar en virtuell assistent för hjälp med bostäder genom att regelbundet samtala med sin dator.

I detta skede överväger forskare hur A.I.-drevet taligenkänning kan ge smartare svar. Sensay, en ilska-upptäckande A.I. från laboratoriet bakom Siri, använder avancerade kännetecken för att upptäcka om en användare känner sig arg eller förvirrad och ändrar sina svar för att passa situationen. Att ta bort barriären för felaktigt röstigenkänning skapar spännande nya möjligheter till virtuellt hjälp.

$config[ads_kvadrat] not found