Description | Le corpus ACSYNT est un corpus oral du français contemporain de 124 000 mots. Il est composé de trois types de documents :
• des textes lus ;
• des présentations monologuées préparées ;
• des entretiens guidés.
Chaque document ou sous-document est représenté par une série de trois fichiers distincts ayant le même nom, mais une extension distincte :
• un fichier audio au format et à l’extension WAV ( 22 kHz, 16 bits, Mono) ;
• un fichier à l’extension «TextGrid», lisible sous PRAAT, un logiciel téléchargeable permettant de visualiser simultanément le signal de parole (ou fichier son) et la transcription orthographique correspondante ;
• un fichier texte ayant l’extension TXT et qui renferme sous forme textuelle brute le contenu du fichier audio auquel il est associé. |