Η αναγκαιότητα ύπαρξης ενός corpus προφορικού λόγου για την ελληνική γλώσσα απορρέει πρώτα απ’ όλα από τη σημασία που αποδίδει γενικά η σύγχρονη γλωσσολογία στον προφορικό λόγο έναντι του γραπτού. Παίρνοντας όμως υπόψη και τα πορίσματα της κοινωνιογλωσσολογίας, η μελέτη του προφορικού λόγου οφείλει να στηρίζεται σε γλωσσικό υλικό που συλλέγεται σε φυσικές περιστάσεις επικοινωνίας, τέτοιες δηλαδή που επιτρέπουν την αυθόρμητη και αβίαστη παραγωγή του. Το Corpus Προφορικού Λόγου του Ινστιτούτου ανταποκρίνεται σε αυτές τις απαιτήσεις. Περιλαμβάνει μόνο φυσικό προφορικό λόγο, ο οποίος μάλιστα προέρχεται από διαλογική επικοινωνία (π.χ. τηλεφωνικές συνδιαλέξεις, τηλεοπτικές συνεντεύξεις με πολιτικά πρόσωπα) και όχι μονολογική (π.χ. διαλέξεις, ανακοινώσεις). Επιπρόσθετα, μεγάλο μέρος του υλικού είναι λόγος που έχει παραχθεί κατά τη διάρκεια ιδιωτικής διεπίδρασης μεταξύ φιλικών ή/και συγγενικών προσώπων (βλ. παρακάτω).
Το Corpus Προφορικού Λόγου αναπτύχθηκε πρωταρχικά με στόχο την ποιοτική ανάλυση της γλώσσας και της γλωσσικής επικοινωνίας, κυρίως από τη σκοπιά της Ανάλυσης Συνομιλίας. Ως εκ τούτου, αποδίδεται ιδιαίτερη βαρύτητα στην απομαγνητοφώνηση του ηχογραφημένου ή βιντεοσκοπημένου υλικού ως πιστή απεικόνιση της ηχητικής πραγματικότητας. Για την Ανάλυση Συνομιλίας η απομαγνητοφώνηση δεν αποτελεί μια μηχανιστική διαδικασία, αλλά ούτε περιορίζεται στην απόδοση του περιεχομένου. Αντίθετα, η 'μετάφραση' του ήχου σε γραφή απαιτεί θεωρητική επεξεργασία και ανάλυση, προϋποθέτει ανάλογη κατάρτιση και χρήζει πολλαπλών 'διορθώσεων' από διαφορετικά άτομα.
Κατά συνέπεια, τα απομαγνητοφωνημένα κείμενα του Corpus Προφορικού Λόγου διαφοροποιούνται από τη συνήθη ορθογραφική αναπαράσταση της προφορικότητας λόγω της χρήσης πρόσθετων συμβόλων που αποδίδουν επικαλύψεις, παύσεις, προσωδιακά κ.ά. χαρακτηριστικά του λόγου (βλ. Σύμβολα απομαγνητοφώνησης). Διαφοροποιούνται επίσης μεταξύ τους ως προς τον βαθμό επεξεργασίας και την ποιότητα της απομαγνητοφώνησης.