Speechmatics folosește AI pentru transcrierea limbilor și bate Google

$config[ads_kvadrat] not found

Cum Sunau Limbile Vorbite In Antichitate

Cum Sunau Limbile Vorbite In Antichitate
Anonim

Speechmatics merge după Google. Startupul britanic a luat sfârșit de săptămâna trecută lingvistul automat, o inteligență artificială puternică care poate învăța orice limbă pentru transcrierea discursului în text într-o chestiune de zile. Echipa dorește să permită tehnologia pentru fiecare dintre cele aproximativ 7.000 de limbi din lume, cu potențialul de a transforma viețile.

De la lansarea instrumentului lingvistic, Speechmatics lucrează la Omniglot, o provocare pentru a construi o limbă pe zi. Săptămâna trecută, compania a lovit un punct de reper important: a bătut oficial Google, cu 72 de limbi unice în total.

Sistemul utilizează învățarea mașinilor pentru a potrivi datele audio cu un omolog de transcriere. Apoi utilizează modele lingvistice din alte limbi pentru a face procesul cât mai direct posibil, identificând asemănările dintre sunete și structurile gramaticale și aplicându-le în noile limbi. Procesul este foarte eficient: de exemplu, lucrarea lui Speechmatics pe limba hindusă a durat doar două săptămâni pentru a atinge o precizie de 80%. Când produsul final a fost testat față de eforturile Google, acesta a făcut 23% mai puține greșeli.

Invers a vorbit cu Benedikt von Thüngen, CEO al Speechmatics, pentru a afla mai multe.

Cum ai început prima echipă să lucrezi la proiect?

Am început proiectul Omniglot ca o provocare pentru noi înșine - pentru a vedea câte limbi am putea construi în șase săptămâni. Ne-am dat seama de o vreme înapoi că abordarea tradițională a construirii fiecărei limbi în mod individual nu mai este viabilă atunci când se caută să scadă cu o rată rapidă. Având în vedere acest lucru, a trebuit să re-gândim ce este o limbă, cum este structurată și ce asemănări există între diferite limbi. Am descoperit o modalitate de a folosi acele comunități pentru a identifica modelele și pentru a ajuta cadrele noastre, Lingvista automată (AL), să construiască limbi mai repede decât oricând - 46 în șase săptămâni pentru a fi precise sau aproximativ o limbă pe zi timp de șase săptămâni !

Cum diferă aceasta de eforturile Google?

Abordarea noastră față de construirea limbajului este unul dintre aspectele principale care ne diferențiază de Google. În timp ce presupunem că își construiesc limbile în mod individual (sau prin ceea ce numim "forța bruta"), folosim puterea lui A.I. să eficientizeze și să accelereze procesul de construire a limbilor străine. În plus, în timp ce alte servicii cum ar fi Google se concentrează pe construirea dialectelor și nu pe limbile unice, suntem mândri să spunem că eforturile noastre s-au concentrat asupra unor limbi unice din întreaga lume, inclusiv zone care au fost anterior deservite de marile companii de tehnologie.

Care sunt unele dintre aplicațiile din lumea reală pentru acest lucru?

Avem acum tehnologia și cunoștințele pentru a face serviciul nostru mai mult decât oricând și a aduce recunoașterea automată a vorbirii (ASR) tuturor. Acest lucru este valabil în special în țările cu rate scăzute de alfabetizare, în care abilitatea de a utiliza tehnologia discursului în timp nedisponibil pentru a comunica poate face diferența pentru oameni. Alte cazuri în care tehnologia ASR poate ajuta la problemele de accesibilitate - persoanele cu auz și / sau persoanele cu deficiențe de vedere din întreaga lume pot folosi acum un dispozitiv la fel de simplu ca un telefon pentru a interacționa cu cei din jurul lor.

Acest lucru îmbunătățește acuratețea limbilor bine acoperite, cum ar fi limba engleză?

Pe măsură ce continuăm să dezvoltăm mai multe limbi, cadru va deveni din ce în ce mai abil în identificarea trăsăturilor și modelelor lingvistice. Vom folosi aceste cunoștințe pentru a continua perfecționarea bazei noastre actuale de limbă, inclusiv engleză.

Ați putea îmbunătăți ceva de genul instrumentelor de traducere în timp real ale Google Pixel Buds?

Cu siguranta vedem proiecte ca Omniglot care ajuta la imbunatatirea in timp real a instrumentelor de traducere in timp real. Pe măsură ce se investește mai mult resursele în extinderea acoperirii și exactității limbilor, vom vedea o îmbunătățire continuă în sectorul serviciilor de traducere.

Acest lucru funcționează cu orice limbă, chiar și cu limbi construite cum ar fi Klingon?

Încă nu am încercat să construim conglanguri, dar nu vedem niciun motiv pentru care nu ar funcționa. Deoarece aceste limbi sunt încă rostite de oameni, aceștia urmează și reguli și constrângeri structurale similare cu limbile de zi cu zi (cum ar fi numărul de foneme), ceea ce ar oferi AL date suficiente pentru o construcție.

Sunteți deschis proiectul?

Nu, nu avem planuri pentru asta.

Cum va funcționa licențiarea?

Limbile oferite în cadrul proiectului Omniglot sunt gratuite și nu pot fi utilizate în scopuri comerciale. Ca atare, nu li se va atribui nicio licență pentru viitorul previzibil.

Care sunt pașii următori de aici?

Proiectul Omniglot este doar începutul pentru noi. Vrem să construim în cele din urmă fiecare limbă din lume, așa că vom lucra din greu la acest scop!

$config[ads_kvadrat] not found