Αξιοπιστία Δημοσκοπήσεων

Tου Ι. Πήτα, Καθηγητή ΑΠΘ

Οι δημοσκοπήσεις είναι ένα πολύ σημαντικό εργαλείο εκτίμησης της κοινής γνώμης και πρόβλεψης των εκλογικών αποτελεσμάτων. Κάθε εκλογές αναβιώνει η συζήτηση του κατά πόσον οι δημοσκοπήσεις είναι αντικειμενικές. Πρόσφατα (Νέα, 12/6/2024), ο κος Γ. Παπαχρήστου έβαλε ευθέως εναντίον σχεδόν όλων των δημοσκόπων ότι έγινανσυνειδητά δεκανίκια της ΝΔ (εκτός της Metron Analysis), υπερεκτιμώντας τα ποσοστά της πριν τις Ευρωεκλογές της 9/6/2024. Ισχύει κάτι τέτοιο;
Στον Πίνακα 1 παρουσιάζουμε την ανάλυση των αποκλίσεων των δημοσκοπήσεων για τις Ευρωεκλογές της 9/6/2024. Περιέχει α) τα επίσημα αποτελέσματα μόνον για όλα τα κοινοβουλευτικά κόμματα για τα οποία μπορέσαμε να συλλέξουμε πολιτικά tweets (αλφαβητικά ΕΛΛΗΝΙΚΗ ΛΥΣΗ, ΚΚΕ, ΜΕΡΑ25, ΝΔ, ΝΙΚΗ, ΠΑΣΟΚ-ΚΙΝΑΛ, ΠΛΕΥΣΗ ΕΛΕΥΘΕΡΙΑΣ, ΣΥΡΙΖΑ) και β) τις τελευταίες δημοσκοπήσεις πριν τις εκλογές.Παρατηρούμε ότι,όντως, όλες οι δημοσκοπήσεις, όλες εκτός από αυτή της Interview, υπερεκτίμησαν την ΝΔ. Η Metron Analysis έκανε υπερεκτίμησητης ΝΔ κατά 3.7%.Δεν είμαι πολιτικός αναλυτής να ξέρω γιατί έγινε αυτή η υπερεκτίμηση. Όμως η απόκλιση των δημοσκοπήσεων στις Ευρωεκλογές κυμάνθηκε στο 1.2%-1.49%, και είναι χαμηλότερη απότην αντίστοιχη απόκλιση 1.54%-2.17% που είχαν οι δημοσκοπήσεις στις εθνικές εκλογές της 25/6/2023, όπως φαίνεται στον Πίνακα 2. Επίσης, όλες οι δημοσκοπήσεις είχαν υπερβολική υπερεκτίμηση των ποσοστών του ΣΥΡΙΖΑ στις εθνικές εκλογές της 21/5/2023.Φαίνεται ότι οι δημοσκόποι κάνουν λάθη, αλλά όχι ντε και καλά πάντα υπέρ κάποιου συγκεκριμένου κόμματος ή υπέρ του ισχυρότερου.Τα γεγονότα αυτά είναι σε αντίφαση με τον ισχυρισμό του κου Παπαχρήστου, εκτός και αν εκείνος ξέρει κάτι παραπάνω.
Οι πιθανές αιτίες λαθών των δημοσκοπήσεων είναι:
α) μεθοδολογικά λάθη,
β) κακό/μικρό δημοσκοπικό δείγμα ή κακή ανταπόκρισή του στην δημοσκόπηση,
γ) προκατειλημμένη/υποκειμενική ανάλυση των δεδομένων,
δ) πολιτικός ή και οικονομικός επηρεασμός.
Ειδικά για τις εθνικές εκλογές της 21/5/2023, υπήρξαν δημοσκόποι που ‘δικαιολόγησαν’ την υπερεκτίμηση του ΣΥΡΙΖΑ, παραδεχόμενοι ότι πείραξαν τα συμπεράσματά τους, παρ’ όλες τις περί αντιθέτου ενδείξεις των δεδομένων, επειδή δεν πίστευαν ότι το κόμμα αυτό θα έπεφτε τόσο πολύ. Μια τέτοια παραδοχή υποκειμενικής ανάλυσης των δεδομένων καταβαραθρώνει την αξιοπιστία των δημοσκοπήσεων. Αν δεν σου αρέσουν τα νούμερα, δεν τα πειράζεις, προσπαθείς να τα ερμηνεύσεις (αν το καταφέρεις). Ενίοτε, η ανάλυση τέτοιων αναντιστοιχιών οδηγεί σε μεγάλες επιστημονικές ανακαλύψεις.
Μπορούμε να μετρήσουμε επιστημονικά την αξιοπιστία των δημοσκοπήσεων. Το Σχήμα 1παρουσιάζει το σφάλμα κάθε εταιρείας δημοσκοπήσεων σε σχέση με τις όλες τις άλλες το χρονικό διάστημα 14/6/2022-10/4/2023 [ΚΑΙ2024].Η Metron Analysisκαι η Interview φαίνεται να διαφέρουν από τις άλλες, ιδιαίτερα το πρώτο εξάμηνο του 2023. Πρόκειται για στατιστικά αποκλίνουσα συμπεριφορά (outlier). Η αιτία της διαφοράς δεν μας είναι γνωστή. Ούτε σημαίνει ντε και καλά ότι οι μεν είναι ορθότεροι/καλύτεροι από τους δε.
Η απόκλιση μεταξύ διαφορετικών εταιρειών δημοσκοπήσεων μπορεί να χρησιμοποιηθεί για την εξάλειψη ανεπιθύμητων παρενεργειών τους στην πρόβλεψη των εκλογικών αποτελεσμάτων. Μια ενδιαφέρουσα προσέγγιση γίνεται από την μέθοδο συσσωμάτωσης δημοσκοπήσεων KASSIOPE: γίνεται εκτίμηση της προκατάληψης μιας δημοσκόπησης υπέρ/κατά πολιτικών κομμάτων. Η πληροφορία αυτή χρησιμοποιείται για να σταθμίσει τις δημοσκοπήσεις κατά την συσσωμάτωση (aggregation) τους. Η KASSIOPEπέτυχε την δεύτερη καλύτερη ακρίβεια (1.24%) στις Ευρωεκλογές της 9/6/2024, όπως φαίνεται στον Πίνακα 1.
Γενικά, οι μέθοδοι συσσωμάτωσης πολλών και διαφορετικών δημοσκοπήσεων βελτιώνουν την ακρίβεια πρόβλεψης. Κάτι τέτοιο είναι, εν πολλοίς, αναμενόμενο, διότι, στατιστικά, η χρήση πολλών ανεξάρτητων μετρήσεων βελτιώνει την ακρίβεια και ελαττώνει την επίδραση προκατειλημμένων ή ανακριβών μετρήσεων.
Το Πολιτικό Βαρόμετρο έδωσε την καλύτερη πρόβλεψη των αποτελεσμάτων των Ευρωεκλογών της 9/6/2024, με ακρίβεια 1.05% (Πίνακας 1) κάνοντας πρόβλεψη λίγο πριν το κλείσιμο της κάλπης στις 9/6/2024. Επίσης έκανε την καλύτερη πρόβλεψη και των εθνικών εκλογών της 25/6/2023 (Πίνακας 2, ακρίβεια 1.09%). Η ακρίβεια αυτή είναι: α) καλύτερη από κάθε άλλη κλασσική δημοσκόπηση (οι ακρίβειές τους κυμαίνονται στο διάστημα 1.2% – 1.53%), β) ελαφρώς καλύτερη από την μέθοδο συσσωμάτωσης δημοσκοπήσεων KASSIOPE(ακρίβεια 1.24%), που μεθοδολογικά είναι εντελώς διαφορετική και ανεξάρτητη προσπάθεια από το Πολιτικό Βαρόμετρο και γ) ελαφρώς χειρότερη από το exitpollτης 9/6/2024 (ακρίβεια 0.93%). Αν, για αυστηρή σύγκριση με τις άλλες δημοσκοπήσεις, περιοριστούμε στην πρόβλεψη του Πολιτικού Βαρόμετρου τηςτελευταίας Παρασκευής7/6/2024 πριν τις Ευρωεκλογές και πάλι η ακρίβειά του είναι η καλύτερη (1.11%, Πίνακας 1).
Το Πολιτικό Βαρόμετροαναπτύχθηκε στο εργαστήριο Τεχνητής Νοημοσύνης και Aνάλυσης Πληροφοριών (AIIALab) του Τμήματος Πληροφορικής ΑΠΘ στα πλαίσια του ευρωπαϊκού έργου AI4Mediaτην περίοδο 2022-2024. Πρόκειται για ένα λογισμικό εκτίμησης της πολιτικής κοινής γνώμης με χρήση ανάλυσης πολιτικών tweets που αναφέρονται σε πολιτικά κόμματα, τα οποία συλλέγονται και αναλύονται καθημερινά. Η μεθοδολογία του παρουσιάζεται στην δημοσίευση [ΚΑΙ2024].Το Πολιτικό βαρόμετρο δίνει, μέσω της συναισθηματικής ανάλυσης των πολιτικών tweets, και άλλες πληροφορίες π.χ., για την επικοινωνιακή επίπτωση των πολιτικών κινήσεων και θέσεων των κομμάτων.
Το Πολιτικό Βαρόμετρο προέβλεψε σωστά την σειρά των κομμάτων και την εκλογική δύναμη του ΚΚΕ και της Ελληνικής Λύσης, που οι δημοσκοπήσεις υποεκτιμούσαν. Ένα σημαντικό πρόβληματου Πολιτικού Βαρόμετρου ήταν η υπερεκτίμηση της ΝΔ στις Ευρωεκλογές της 9/6/2024. Αυτό μπορεί να οφείλεται σε δύο λόγους, ίσως και στους δύο (το μελετούμε ακόμα):
1) Ελλείψει άλλης πρόσφατης αντικειμενικής αλήθειας, το Πολιτικό Βαρόμετρο εκπαιδεύτηκε να μιμείται τις προηγούμενες δημοσκοπήσεις, επομένως και τις προκαταλήψεις τους.
2) To Πολιτικό Βαρόμετρο εκπαιδεύεται να ελαχιστοποιεί το μέσο λάθος πρόβλεψης. Τα πήγε πολύ καλά στον στόχο αυτό (μόνον 1.05% μέσο λάθος πρόβλεψης, καλύτερα από τους ανταγωνιστές). Αν είχε εκπαιδευτείνα ελαχιστοποιεί το ΜΕΓΙΣΤΟ λάθος πρόβλεψης, σίγουρα θα έκανε καλύτερη πρόβλεψη για την ΝΔ (και χειρότερη για τους άλλους). Η εκλογή της ελαχιστοποίησης κατάλληλου λάθουςείναι κλασσικό πρόβλημα στην Θεωρία Βελτιστοποίησης (Optimization Theory).
Αντίστοιχο πρόβλημα υπήρξε και στις εθνικές εκλογές του 2023. Στις πρώτες εκλογές (21/5/2023), το Πολιτικό Βαρόμετρο, ελλείψει άλλης αντικειμενικής αλήθειας συνολικά, μιμήθηκε τις προηγούμενες δημοσκοπήσεις και υπερεκτίμησε τα ποσοστά του ΣΥΡΙΖΑ. Στις δεύτερες εκλογές (25/6/2023), το Πολιτικό Βαρόμετρο, χρησιμοποίησε την πρόσφατη αντικειμενική αλήθεια (αποτελέσματα πρώτων εκλογών) και ήταν πρωταθλητής ακρίβειας πρόβλεψης, έναντι των ανταγωνιστών του.
Σε σύνοψη, και οι δημοσκόποι και τα πολιτικά κόμματα πρέπει να γνωρίζουν ότι η αξιοπιστία των δημοσκοπήσεων μπορεί να αναλυθεί επιστημονικά. Για τον σκοπό αυτό μπορούμε και ποικιλία μεθόδων να αξιοποιήσουμε και ποικιλία άλλων δεδομένων, π.χ., από τα κοινωνικά μέσα. Καλόν είναι να αποφεύγονται τυχόν υποκειμενικές ερμηνείες των αριθμών ή εξωγενείς επηρεασμοί των δημοσκοπήσεων. Η αξιοπιστία τους και φερεγγυότητά τους είναι πολύ σημαντική και πρέπει να διαφυλαχθεί σαν κόρη οφθαλμού, διότι αφορά την πιο κρίσιμη δημοκρατική διαδικασία: την εκλογή βουλευτικών αντιπροσώπων.

Ι. Πήτας
Καθηγητής Τμήματος Πληροφορικής ΑΠΘ
Πρόεδρος της Διεθνούς Ακαδημίας Διδακτορικών Σπουδών στην Τεχνητή Νοημοσύνη

Βιβλιογραφία
[ΚΑΙ2024] Α. Kaimakamidis, Ι. Pitas, ‘Political Tweet Sentiment Analysis for Public Opinion Polling’, Proc. 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2024), pp. 121-125.

Εγγραφείτε στην ομάδα Magnesianews στο Viber για να λαμβάνετε ενημερώσεις.
Ακολουθήστε τη ροή Magnesianews στο Google News και μείνετε σε επαφή με ότι συμβαίνει.