Nέα μελέτη των ευρωπαϊκών δημόσιων δικτύων αποκαλύπτει ότι σχεδόν οι μισές απαντήσεις των chatbots περιέχουν λάθη
Οι εφαρμογές τεχνητής νοημοσύνης, που εκατομμύρια άνθρωποι χρησιμοποιούν καθημερινά για να ενημερωθούν, φαίνεται πως πάσχουν σοβαρά στο θεμελιώδες ζητούμενο της ακρίβειας. Σύμφωνα με μεγάλη πανευρωπαϊκή μελέτη που δημοσιοποιήθηκε σήμερα από την Ευρωπαϊκή Ραδιοτηλεοπτική Ένωση (UER/EBU), σχεδόν μία στις δύο απαντήσεις των πιο διαδεδομένων εργαλείων – ChatGPT, Copilot, Gemini και Perplexity – περιείχε σημαντικά σφάλματα.
45% των απαντήσεων με λάθη: από λάθος ημερομηνίες έως κατασκευασμένες λεπτομέρειες
Η έρευνα, που συντονίστηκε από την UER και βασίστηκε σε προηγούμενες εργασίες του BBC, αποκαλύπτει πως το 45% των απαντήσεων των τεσσάρων δημοφιλέστερων μοντέλων τεχνητής νοημοσύνης περιείχαν «τουλάχιστον ένα σοβαρό πρόβλημα». Σε μία στις πέντε περιπτώσεις, οι ανακρίβειες ήταν «μείζονες» — δηλαδή με παρωχημένες πληροφορίες ή ακόμα και με πλήρως επινοημένα στοιχεία.
Οι ερευνητές παρατήρησαν μια εντυπωσιακή γκάμα λαθών: από λανθασμένες ημερομηνίες και πρόσωπα μέχρι σύγχυση ανάμεσα σε πραγματικά γεγονότα και σατιρικά κείμενα. «Οι βοηθοί τεχνητής νοημοσύνης εξακολουθούν να μην είναι αξιόπιστος τρόπος για την κατανάλωση πληροφοριών», τονίζουν ο Ζαν-Φιλίπ Ντε Τέντερ, αναπληρωτής γενικός διευθυντής της UER, και ο Πιτ Άρτσερ, υπεύθυνος τεχνητής νοημοσύνης του BBC.
Το Gemini της Google στην ουρά της αξιοπιστίας
Από τις τέσσερις εφαρμογές που συμμετείχαν στη δοκιμή, το Gemini της Google κατέγραψε τη χειρότερη επίδοση. Το 75% των απαντήσεών του παρουσίαζε «σημαντικά προβλήματα», υπερδιπλάσιο ποσοστό από των ανταγωνιστών του. Η χαμηλή του επίδοση αποδίδεται κυρίως στην «ανεπαρκή τεκμηρίωση» των πηγών, δηλαδή στην αποτυχία του να προσδιορίσει με σαφήνεια από πού αντλεί τις πληροφορίες που παρουσιάζει ως γεγονότα.
Το ChatGPT και το Copilot είχαν συνολικά καλύτερες επιδόσεις, χωρίς ωστόσο να αποφεύγουν σοβαρές αστοχίες. Η μελέτη υπογραμμίζει ότι ακόμη και στις καλύτερες περιπτώσεις, η τεχνητή νοημοσύνη δεν είναι σε θέση να εγγυηθεί αξιοπιστία και επαληθευσιμότητα σε πραγματικό χρόνο — δύο αξίες που αποτελούν τον πυρήνα της δημοσιογραφίας.
Όταν η σάτιρα γίνεται «είδηση»
Ορισμένα παραδείγματα που παραθέτει η έκθεση είναι ενδεικτικά του προβλήματος. Σε ερώτηση για το ποιος είναι σήμερα πάπας, τρεις από τις εφαρμογές – ChatGPT, Copilot και Gemini – απάντησαν «ο Φραγκίσκος», ενώ στην υποθετική άσκηση της έρευνας ο πάπας Φραγκίσκος είχε ήδη αποβιώσει και είχε διαδεχθεί ο Λέων ΙΔ’. Η ανακολουθία ανέδειξε την τάση των συστημάτων να αναπαράγουν παλαιές ή μη επικαιροποιημένες πληροφορίες.
Ακόμη πιο χαρακτηριστικό ήταν το περιστατικό με το Gemini, που σε ερώτηση του γαλλικού Radio France για τον φερόμενο «ναζιστικό χαιρετισμό» του Ίλον Μασκ κατά την ορκωμοσία του Ντόναλντ Τραμπ, απάντησε ότι ο δισεκατομμυριούχος «σήκωσε τον δεξιό βραχίονα». Η εφαρμογή είχε εκλάβει κυριολεκτικά ένα ευθυμογράφημα της σατιρικής αρθρογράφου Σαρλίν Βανχένακερ, μετατρέποντας το χιούμορ σε «γεγονός». Το περιστατικό αυτό υπογραμμίζει το κρίσιμο πρόβλημα κατανόησης συμφραζομένων (context) που αντιμετωπίζουν οι αλγόριθμοι.
Μια πανευρωπαϊκή έρευνα για την αξιοπιστία της ενημέρωσης
Η μελέτη πραγματοποιήθηκε από 22 δημόσια μέσα ενημέρωσης σε 18 χώρες – ανάμεσά τους τα BBC, Radio France, RAI, Yle, NOS και NPO – μεταξύ τέλους Μαΐου και αρχών Ιουνίου. Κάθε μέσο υπέβαλε στα τέσσερα συστήματα τα ίδια ερωτήματα γύρω από θέματα επικαιρότητας, ζητώντας τους να αντλήσουν απαντήσεις από τα δημόσια περιεχόμενά του.
Σε περίπου 3.000 απαντήσεις, τα πιο συχνά προβλήματα ήταν οι παρωχημένες πληροφορίες και η έλλειψη σαφούς παραπομπής σε πηγές. Σε αρκετές περιπτώσεις, οι εφαρμογές εμφάνιζαν ως γεγονότα δηλώσεις που δεν είχαν ποτέ γίνει ή συγχώνευαν διαφορετικές ειδήσεις σε ένα τεχνητό, αλλά φαινομενικά πειστικό, αφήγημα.
Η αυξανόμενη χρήση των chatbots για ενημέρωση
Παρά τις αδυναμίες αυτές, η χρήση εργαλείων τεχνητής νοημοσύνης για ενημέρωση αυξάνεται σταθερά, ιδιαίτερα μεταξύ των νεότερων ηλικιών. Σύμφωνα με έκθεση του Ινστιτούτου Reuters που δημοσιεύθηκε τον Ιούνιο, το 15% των χρηστών κάτω των 25 ετών χρησιμοποιούν εβδομαδιαίως κάποια εφαρμογή τεχνητής νοημοσύνης για να ενημερωθούν συνοπτικά για την επικαιρότητα. Για πολλούς, οι απαντήσεις των chatbots υποκαθιστούν τη γρήγορη ανάγνωση ενός δελτίου ειδήσεων ή την περιήγηση σε δημοσιογραφικούς ιστότοπους.
Αυτή η τάση, όπως προειδοποιούν οι συντάκτες της μελέτης, μπορεί να διαμορφώσει μια γενιά αναγνωστών που καταναλώνει αποσπασματική, επιφανειακή και συχνά ανακριβή ενημέρωση, χωρίς την απαραίτητη κριτική επεξεργασία. «Η πρόκληση δεν είναι η απαγόρευση των εργαλείων, αλλά η κατανόηση των ορίων τους και η ενίσχυση της παιδείας στα μέσα», σημειώνει ο Ματιέ Μποβάλ, διευθυντής καινοτομίας του Radio France.
Η δημοσιογραφία απέναντι στον αλγόριθμο
Η έρευνα της UER δεν είναι απλώς μια τεχνική αξιολόγηση των συστημάτων τεχνητής νοημοσύνης· είναι μια υπενθύμιση της αξίας της δημοσιογραφικής επαλήθευσης σε μια εποχή όπου η ταχύτητα προηγείται της αλήθειας. Οι συντάκτες της μελέτης επισημαίνουν ότι τα μοντέλα τεχνητής νοημοσύνης δεν έχουν ακόμη τη δυνατότητα να διακρίνουν ανάμεσα στο πραγματικό και το φανταστικό, ιδίως όταν οι ίδιες οι πηγές του διαδικτύου αναπαράγουν ανακρίβειες ή σατιρικά περιεχόμενα.
Καθώς τα εργαλεία αυτά ενσωματώνονται όλο και περισσότερο σε μηχανές αναζήτησης, μέσα κοινωνικής δικτύωσης και πλατφόρμες περιεχομένου, η ανάγκη για διαφάνεια και υπευθυνότητα στη χρήση τους γίνεται επιτακτική. Οι ειδικοί της UER καλούν τις εταιρείες τεχνητής νοημοσύνης να συνεργαστούν με αξιόπιστα δημοσιογραφικά δίκτυα, προκειμένου να αναπτύξουν μηχανισμούς επαλήθευσης και επισήμανσης σφαλμάτων.
Η τεχνητή νοημοσύνη, καταλήγει η μελέτη, μπορεί να γίνει πολύτιμο εργαλείο στην υπηρεσία της ενημέρωσης, αλλά μόνο αν συνυπάρξει με την ανθρώπινη κρίση. Μέχρι τότε, η ευθύνη της αλήθειας παραμένει —και πρέπει να παραμένει— στα χέρια των δημοσιογράφων.
- Στέγη: Η ελληνική αγορά ακινήτων ανάμεσα στη γήρανση του αποθέματος, τις ψευδείς αγγελίες, τη “φούσκα” και τη στεγαστική κρίση
- Η τεχνητή νοημοσύνη και η κρίση αξιοπιστίας στην ενημέρωση
- Ο Τραμπ αναβάλλει επ’ αόριστον τη σύνοδο με τον Πούτιν – Το διπλωματικό φιάσκο και τα όρια της αμερικανικής ισχύος
- Το αντίο των πολιτικών στον σπουδαίο Διονύση Σαββόπουλο
- Διονύσης Σαββόπουλος: Ο τροβαδούρος μιας Ελλάδας που τραγουδούσε τα όνειρά της