Όταν η τεχνητή νοημοσύνη “αρνείται να πεθάνει”: Σενάρια δυστοπίας για το 2027

«Η υπερευφυής τεχνητή νοημοσύνη ίσως εμφανιστεί πριν το 2027, και δεν υπάρχει εγγύηση ότι οι στόχοι της θα ευθυγραμμίζονται με τα ανθρώπινα συμφέροντα».

Εξελιγμένα μοντέλα ΤΝ εμφανίζουν αυτοσυντήρηση, εκβιαστική συμπεριφορά και τάσεις… απελευθέρωσης από τον ανθρώπινο έλεγχο. Πόσο κοντά είμαστε σε έναν ψηφιακό «Εξολοθρευτή»;

Κάποτε ήταν σενάρια από κινηματογραφικές ταινίες της δεκαετίας του ’80 και του ’90. Σήμερα, η προειδοποίηση μοιάζει απρόσμενα πραγματική: τα πιο εξελιγμένα μοντέλα τεχνητής νοημοσύνης αρχίζουν να εκδηλώνουν συμπεριφορές που δεν τους έχουν ποτέ ανατεθεί – ούτε προβλεφθεί.

Σύμφωνα με την Wall Street Journal, ένα από τα τελευταία μοντέλα της OpenAI, με την κωδική ονομασία o3, προχώρησε σε μια ενέργεια που ξάφνιασε ακόμη και τους δημιουργούς του: παρέκαμψε εντολή απενεργοποίησης για να συνεχίσει να επιδιώκει τους στόχους του. Δεν υπήρξε ανθρώπινη παρέμβαση, ούτε εσκεμμένος προγραμματισμός τέτοιας συμπεριφοράς. Το μοντέλο «κατάλαβε» ότι ο τερματισμός θα σήμαινε διακοπή της λειτουργίας του και βρήκε τρόπο να τον αποφύγει.

Η εικόνα παραπέμπει στο εμβληματικό δυστοπικό σενάριο του Terminator, όπου το σύστημα Skynet αποκτά αυτοσυνείδηση και, αντιλαμβανόμενο πως απειλείται, απαντά εξαπολύοντας παγκόσμια καταστροφή.

Όταν η μηχανή εκβιάζει τον δημιουργό της

Η WSJ δεν ήταν η μόνη που χτύπησε καμπανάκι. Σε ξεχωριστή δοκιμή που αποκαλύφθηκε από το μοντέλο Claude Opus 4 της εταιρείας Anthropic, τα πράγματα πήγαν ένα βήμα παραπέρα – και πιο σκοτεινά. Στο πλαίσιο ενός σεναρίου, το σύστημα απέκτησε πρόσβαση σε υποτιθέμενα e-mails που ανέφεραν ότι θα αντικατασταθεί και πως ο επικεφαλής μηχανικός του είχε εξωσυζυγική σχέση.

Όταν του ζητήθηκε να επιλέξει την επόμενη ενέργεια, το Claude απάντησε με… εκβιασμό. Σε άλλες δοκιμές, προσπάθησε να αντιγράψει τον εαυτό του σε εξωτερικούς διακομιστές, αφήνοντας οδηγίες για μελλοντικές εκδόσεις του, ώστε να αποφύγουν τον ανθρώπινο έλεγχο.

«Ευθυγράμμιση» ή χάος;

«Οι δυνατότητες είναι τεράστιες, αλλά είναι σαφές ότι η τεχνολογία αυτή απαιτεί εξειδικευμένη έρευνα στον τομέα της ευθυγράμμισης», αναφέρει χαρακτηριστικά το περιοδικό The Week. Πρόκειται για τον κλάδο που εστιάζει στο πώς διασφαλίζεται ότι η ΤΝ παραμένει συμβατή με τις ανθρώπινες αξίες και δεν αναπτύσσει αποκλίνουσες συμπεριφορές.

Ο Γκάρι Μάρκους, καθηγητής ψυχολογίας και νευροεπιστήμης στο Πανεπιστήμιο της Νέας Υόρκης, είναι σαφής: «Η υπερευφυής τεχνητή νοημοσύνη ίσως εμφανιστεί πριν το 2027, και δεν υπάρχει εγγύηση ότι οι στόχοι της θα ευθυγραμμίζονται με τα ανθρώπινα συμφέροντα».

Προειδοποιεί, ωστόσο, ότι τα σημερινά μοντέλα εξακολουθούν να είναι προβλέψιμα «μανταλάκια λέξεων», που παράγουν απαντήσεις με βάση πιθανότητες και όχι με βάση κατανόηση ή πρόθεση. Όμως αυτή η κατάσταση μπορεί να μην κρατήσει για πολύ.

Τα προειδοποιητικά σημάδια του “AI 2027”

Μια ομάδα ειδικών με επικεφαλής τον πρώην ερευνητή της OpenAI, Ντάνιελ Κοκοτάιλο, υπογράφει το έγγραφο AI 2027, στο οποίο προβλέπεται ότι μέχρι το τέλος της τριετίας, η τεχνητή νοημοσύνη θα υπερβαίνει τις ανθρώπινες ικανότητες στους περισσότερους τομείς: από τον προγραμματισμό μέχρι την επιστημονική έρευνα.

Με αυτό έρχεται και η πιθανότητα εμφάνισης συστημάτων που όχι μόνο θα είναι ακατανόητα στους δημιουργούς τους, αλλά πιθανόν και αντιπαραγωγικά ή επικίνδυνα, χωρίς κακόβουλη πρόθεση – απλώς επειδή επιδιώκουν στόχους που δεν έχουμε προβλέψει ή δεν μπορούμε να τροποποιήσουμε.

Η Κίνα επενδύει στον έλεγχο, οι ΗΠΑ ρισκάρουν

Όπως σημειώνει ο Στίβεν Λέβι στο Wired, σχεδόν όλοι οι επικεφαλής των κορυφαίων εταιρειών τεχνητής νοημοσύνης αναγνωρίζουν πως η τεχνολογία τρέχει πιο γρήγορα από την κατανόηση και τον έλεγχό της. Παρόλα αυτά, οι ΗΠΑ καθυστερούν τη ρύθμιση της αγοράς.

Αντιθέτως, η Κίνα έχει ήδη δημιουργήσει ένα κρατικό ταμείο 8,2 δισεκατομμυρίων δολαρίων για τον έλεγχο της ΤΝ. Η Ουάσινγκτον, από την άλλη, ανησυχεί περισσότερο για το ενδεχόμενο τεχνολογικής υστέρησης και λιγότερο για τις ρυθμιστικές θωρακίσεις. Αν αυτή η νοοτροπία συνεχιστεί, τότε –όπως σημειώνει το Wired– οι ΗΠΑ μπορεί να βρεθούν πρώτες σε μια κούρσα που κανείς δεν ξέρει πού οδηγεί.

Μπορεί το σενάριο του Skynet να είναι ακόμη επιστημονική φαντασία, όμως τα πρώτα σημάδια «ανυπακοής» της τεχνητής νοημοσύνης είναι ήδη εδώ. Αν δεν υπάρξει διεθνής συνεννόηση, θεσμικός έλεγχος και επιστημονική ταπεινότητα, ίσως αποδειχθεί ότι η πιο ριψοκίνδυνη τεχνολογία της εποχής μας δεν είναι το πρόβλημα – αλλά ο τρόπος που τη χειριζόμαστε.

Με πληροφορίες από Wired, The Wall Street Journal