DeepMind A.I. Bridges gapet mellan robot och mänskliga röster

DeepMind StarCraft II Demonstration

Konstgjord intelligens gjorde bara robotröst mycket mer realistiska.

DeepMind, som tidigare visat kraften hos A.I. genom att slå en mänsklig spelare på Go i mars och skärpa sin krafträkning i halv juli, fokuserar nu på talssyntes.

A.I-forskningsgruppen, som ingår i Googles moderbolag Alfabet, avslöjade i morse att den har skapat en ny teknik som heter WaveNet som kan användas för att generera tal, musik och andra ljud mer exakt än tidigare.

DeepMind förklarar att många befintliga talssyntesmetoder är beroende av att "en mycket stor databas med korta talfragment spelas in från en enda högtalare och sedan rekombineras för att bilda fullständiga uttalanden." WaveNet använder å andra sidan "raw waveformen av ljudsignalen "För att skapa mer realistiska röster och ljud.

Det betyder att WaveNet arbetar med de enskilda ljuden som skapas när en människa talar istället för att använda kompletta stavelser eller hela ord. Dessa ljud körs sedan genom en "beräkningsmässigt dyr" process som DeepMind har funnit "nödvändigt för att generera komplext, realistiskt ljudande ljud" med maskiner.

Resultatet av allt det extra arbetet är en 50 procent förbättring av syntetiserat tal i amerikansk engelska och kinesisk mandarin. Här är ett exempel på talgenerering med parametrisk text-till-tal, vilket är vanligt idag, som används av DeepMind för att visa hur denna talsyntesmetod saknas:

Och här är ett exempel på samma mening som genereras av WaveNet:

När företagen fortsätter sitt arbete med naturliga språkgränssnitt kommer det att bli allt viktigare att erbjuda mer realistiska svar. WaveNet kan hjälpa till att lösa det problemet.

Pornhubs toppsökningar avslöjar överraskande länk mellan fantasi och popkultur

Pornhub, den största vuxna platsen i världen, har släppt sin årliga översvämning av data om global smutkonsumtion. Årets årliga granskning verkade först atypiskt aktuell, med en mängd fackmaterial som verkade rippat direkt från rubrikerna. Men popkultur och porr har faktiskt en varaktig rel ...

Vad är empati gapet? Varför är du sämre vid beslut än du tror

Trots den breda tillgängligheten av information gör människor fortfarande enkelt snap bedömningar i olika fall - från varandras intryck av andra till köpbeslut och till och med rösta. Ny forskning tyder på att människor inte kan förutse hur lite information de faktiskt använder när de fattar beslut.

CELLINK vill göra 3D-tryckta mänskliga organens stora affärer (och de är inte galna)

Det senaste genombrottet i skörd av grisorgan för hjärttransplantation av däggdjursarter har satt strålkastaren på många forskare runt om i världen för att hjälpa till att lösa världens kris för orgelbrist. Men det finns andra tekniker som försöker hjälpa till att lindra denna brist - lite mer ...

$config[ads_kvadrat] not found