17:00 uur 25-09-2024

Dataocean AI nam deel aan het creëren van de open-source dataset GigaSpeech 2: een grootschalige, multi-domein ASR-corpus voor low-resource talen

IRVINE, Calif.–(BUSINESS WIRE)– Dataocean AI heeft samengewerkt met Shanghai Jiao Tong University, de Chinese Universiteit van Hongkong, Tsinghua University, Pengcheng Lab, AISpeech, Birch AI en Seasalt AI aan de succesvolle ontwikkeling van GigaSpeech 2. De ontwikkeling en testsets van GigaSpeech 2 zijn gelabeld door een professioneel team van Dataocean AI.

Dit persbericht bevat multimedia. Bekijk hier het volledige persbericht: https://www.businesswire.com/news/home/20240924578456/nl/

(Photo: Business Wire)

(Photo: Business Wire)

Overzicht van GigaSpeech 2

GigaSpeech 2 is een steeds groter wordende, grootschalige multi-domein en meertalige spraakherkenningscorpus ontworpen om onderzoek en ontwikkeling op gebied van spraakherkenning van low-resource talen te promoten. GigaSpeech 2 omvat grofweg 30.000 uren automatische transcriptie van audio, die het Thai, het Indonesisch en het Vietnamees dekt.

Deze bekendmaking is officieel geldend in de originele brontaal. Vertalingen zijn slechts als leeshulp bedoeld en moeten worden vergeleken met de tekst in de brontaal, die als enige rechtsgeldig is.

Contacts

contact@dataoceanai.com

Check out our twitter: @NewsNovumpr