Talmatiker använder AI för att skriva över språk, och det slår Google

VDF THASANA PART 1 MANIPURI MOVIE

Talmatik går efter Google. Den brittiska uppstarten tog omslaget av automatisk språkvetenskapare förra månaden, en kraftfull artificiell intelligens som kan lära sig vilket språk som helst för tal-till-text-transkription under några dagar. Teamet vill aktivera tekniken för alla de cirka 7000 språken i världen, med potential att omvandla liv.

Speechmatics har sedan lanseringen av lingvistiket arbetat med Omniglot, en utmaning att bygga ett språk per dag. Förra veckan slog företaget en stor milstolpe: Det har officiellt slagen Google, med totalt 72 unika språk.

Systemet använder maskininlärning för att matcha ljuddata med en transkriptionskomponent. Den använder sedan språkliga mönster från andra språk för att göra processen så enkel som möjligt, identifiera likheterna mellan ljud och grammatiska strukturer och tillämpa dem på nya språk. Processen är mycket effektiv: Som ett exempel tog talmatikers arbete på hindi bara två veckor för att nå 80 procent noggrannhet. När den slutliga produkten testades mot Googles ansträngningar gjorde den 23 procent färre misstag.

Omvänd talade med Benedikt von Thüngen, VD för talmatik, för att få veta mer.

Hur började laget ditt först med projektet?

Vi startade projektet Omniglot som en utmaning för oss själva - för att se hur många språk vi skulle kunna bygga inom sex veckor. Vi insåg ett tag tillbaka att det traditionella sättet att bygga varje språk enskilt är inte längre lönsamt när man letar efter skalan i snabb takt. Med tanke på detta måste vi tänka på vilket språk det är, hur det är strukturerat och vilka likheter det finns mellan olika språk. Vi har funnit ett sätt att använda dessa gemensamheter för att identifiera mönster och hjälpa vår AI-drivna ram, Automatic Linguist (AL), att bygga språk snabbare än någonsin - 46 på sex veckor för att vara exakta, eller om ett språk per dag i sex veckor !

Hur skiljer det sig från Googles ansträngningar?

Vårt sätt att bygga språk är en av de viktigaste aspekterna som skiljer oss från Google. Medan vi antar att de bygger sina språk enskilt (eller av det vi kallar "brute force") använder vi kraften av A.I. för att effektivisera och påskynda språkbyggande processen. Samtidigt som andra tjänster som Google fokuserar på att bygga dialekter snarare än unika språk, är vi stolta över att vi har satsat på unika språk från hela världen, inklusive områden som tidigare varit underskattade av de stora teknikbolagen.

Vad är några av de verkliga applikationerna för detta?

Vi har nu tekniken och kunskapen för att göra vår tjänst mer långtgående än någonsin tidigare och ge automatiskt talhänsyn (ASR) till alla. Detta är särskilt relevant i länder med låg läskunnighet, där förmågan att använda tidigare otillgänglig tal-till-text-teknik för att kommunicera kan göra stor skillnad för människor. Andra verkliga fall där ASR-tekniken kan hjälpa till med problem med tillgänglighet - hörsel- och / eller synskadade människor från hela världen kan nu använda en enhet så enkelt som en telefon för att interagera med dem som finns runt dem.

Förbättrar detta noggrannheten hos väldragen språk som engelska?

Eftersom vi fortsätter att utveckla flera språk, vår A.I. ramverket kommer att bli alltmer skickligt för att identifiera språkliga egenskaper och mönster. Vi kommer att använda denna kunskap för att fortsätta att förbättra vår nuvarande språkbas, inklusive engelska.

Kan det här förbättras något som Google Pixel Buds 'verktyg i realtid för översättning?

Vi ser definitivt projekt som Omniglot som hjälper till att förbättra översättningstiden i realtid framåt. Eftersom mer resurs investeras i att öka språkens räckvidd och noggrannhet, kommer vi att se fortlöpande förbättring inom översättningstjänsten.

Fungerar detta med något språk, även konstruerade språk som Klingon?

Vi har ännu inte försökt bygga några conlangs, men vi kan inte se några anledningar till att de inte skulle fungera. Eftersom dessa språk fortfarande talas av människor följer de också liknande strukturella regler och begränsningar som vardagliga språk (som antal fonem), vilket skulle ge AL tillräckligt med data för en byggnad.

Öppnar du sourcing projektet?

Nej, vi har inga planer för det på plats.

Hur fungerar licensiering?

Språken som erbjuds under projektet Omniglot är kostnadsfria och kan inte användas för kommersiella ändamål. Som sådan kommer det inte att finnas någon licensiering kopplad till dem under överskådlig framtid.

Vad är nästa steg härifrån?

Projekt Omniglot är bara början för oss. Vi vill slutligen bygga varje språk i världen, så vi kommer att arbeta hårt mot det målet!

Microsoft, Google och Apple använder deras övertygelse för att hjälpa till att rädda liv

Microsoft och Google använder alliansen av sina varumärken för att uppmuntra människor runt om i världen att rulla upp ärmarna, slita tänderna och donera blod. Företagen deltar i den globala Missing Type-kampanjen, som ber företag att ta bort bokstäverna "A", "B" och "O" från sina logotyper så att de kan ...

Boomerangs svarande använder AI för att hjälpa dig att skriva bättre e-post

Det suger när människor inte svara på e-post. Merparten av tiden detta kan tillskrivas dem som lider av e-post överbelastning - men vad händer om en del av skulden ligger hos de många människor som inte skicka meddelanden värda att svara på? Boomerang har infört ett verktyg som heter Respondable som använder artificiell intelligens till hel ...

Att använda ljud för att släcka skogsbränder kräver Super Deep Bass

Att lägga ut skogsbränder är svårt och blir svårare när västet torkar upp. Planer viks som papper med överdriven vattenvikt och brandmän befinner sig ofta fastnade. Argumenter om framtiden för förebyggande och förebyggande av brand är eskalerande och den här gången - kanske bara den här gången - blir högre kanske ...

$config[ads_kvadrat] not found