Αναζήτηση:
Μετάβαση

 

Μέγεθος και Είδη Λόγου του Corpus Προφορικού Λόγου του ΙΝΣ

Tο ψηφιοποιημένο τμήμα του Corpus (ηχογραφημένο/βιντεοσκοπημένο) ανέρχεται σε περίπου 190,000 MB, ενώ το απομαγνητοφωνημένο προσεγγίζει το 1,8 εκατομμύριο λέξεις.

Το υλικό έχει αντληθεί από φυσικές περιστάσεις επικοινωνίας με διαφορετικό βαθμό θεσμικότητας και περιλαμβάνει ποικίλα είδη λόγου:

  • καθημερινές συνομιλίες μεταξύ φίλων και συγγενών (δείγμα)
  • τηλεφωνικές συνδιαλέξεις μεταξύ φίλων και συγγενών (δείγμα)
  • γλωσσική διεπίδραση στη σχολική τάξη (δείγμα)
  • τηλεοπτικά δελτία ειδήσεων (δείγμα)
  • άλλες τηλεοπτικές εκπομπές (δείγμα)

Στο Corpus Προφορικού Λόγου του ΙΝΣ έχει ενσωματωθεί και το προγενέστερο αρχείο προφορικού λόγου GR-SPEECH (πρβ. Θ. Παυλίδου στις Μελέτες για την Ελληνική Γλώσσα, 22 (2002): 124-134).