Για χρόνια, η συζήτηση γύρω από την τεχνητή νοημοσύνη περιστρεφόταν γύρω από τα λάθη της. Σήμερα, για πρώτη φορά, το επίκεντρο μετατοπίζεται στο αντίθετο άκρο. Το νέο μοντέλο Claude Mythos της Anthropic δεν προκαλεί ανησυχία επειδή αποτυγχάνει, αλλά επειδή φαίνεται να πετυχαίνει — υπερβολικά καλά. Και αυτό δημιουργεί έναν εντελώς νέο τύπο κινδύνου.

Η ιστορία του Mythos ξεκίνησε σχεδόν σαν προειδοποίηση. Μια διαρροή εσωτερικών εγγράφων αποκάλυψε ότι η Anthropic είχε αναπτύξει ένα μοντέλο πιο ισχυρό από οτιδήποτε είχε παρουσιάσει μέχρι τότε, ακόμη και από τα κορυφαία της συστήματα. Η εταιρεία απέδωσε το περιστατικό σε «ανθρώπινο λάθος». Ωστόσο, λίγες εβδομάδες αργότερα, το μοντέλο παρουσιάστηκε επίσημα — όχι όμως ως ένα ακόμη προϊόν, αλλά ως κάτι που απαιτεί ιδιαίτερη διαχείριση.

Σε αντίθεση με την καθιερωμένη πρακτική της βιομηχανίας, το Mythos δεν διατέθηκε ευρέως. Η Anthropic επέλεξε να το περιορίσει σε έναν στενό κύκλο συνεργατών, μέσω της πρωτοβουλίας Project Glasswing, στην οποία συμμετέχουν κορυφαίοι παίκτες της παγκόσμιας τεχνολογικής και χρηματοπιστωτικής υποδομής, από την Amazon και τη Microsoft έως τη Google και τη JPMorgan Chase. Αυτή η επιλογή δεν ήταν τυχαία. Αντανακλά μια βαθύτερη ανησυχία: ότι οι δυνατότητες του μοντέλου είναι τέτοιες που, αν χρησιμοποιηθούν κακόβουλα, θα μπορούσαν να ανατρέψουν θεμελιώδεις ισορροπίες στην ασφάλεια των ψηφιακών συστημάτων.

Το σημείο καμπής βρίσκεται στις επιδόσεις του. Σύμφωνα με τα στοιχεία που δημοσιοποίησε η εταιρεία, το Mythos ξεπερνά κατά πολύ τα προηγούμενα μοντέλα σε κρίσιμους δείκτες, ιδίως στον εντοπισμό και την εκμετάλλευση ευπαθειών λογισμικού. Σε δοκιμές κυβερνοασφάλειας, κατέγραψε άλμα επιδόσεων που δεν είναι απλώς βελτίωση, αλλά «ασυνέχεια» — μια μετάβαση σε διαφορετική κατηγορία. Η ίδια η Anthropic αναγνωρίζει ότι τέτοια μοντέλα μπορούν πλέον να ξεπεράσουν «όλους εκτός από τους πλέον εξειδικευμένους ανθρώπους» στον εντοπισμό κενών ασφαλείας. Με άλλα λόγια, η απειλή δεν προέρχεται πια από την αδυναμία της τεχνητής νοημοσύνης, αλλά από την ικανότητά της.

Τα παραδείγματα είναι αποκαλυπτικά — και ανησυχητικά. Το Mythos εντόπισε ευπάθεια 27 ετών στο OpenBSD, ένα από τα πιο ασφαλή λειτουργικά συστήματα, η οποία μπορούσε να οδηγήσει σε κατάρρευση ενός συστήματος με μια απλή σύνδεση. Ανακάλυψε επίσης σφάλμα 16 ετών στο FFmpeg, ένα από τα πιο διαδεδομένα εργαλεία επεξεργασίας βίντεο, το οποίο είχε διαφύγει από εκατομμύρια αυτοματοποιημένους ελέγχους. Ακόμη πιο ανησυχητικό, κατάφερε να συνδυάσει πολλαπλές ευπάθειες στον πυρήνα του Linux, δημιουργώντας πλήρεις αλυσίδες επίθεσης που οδηγούν σε απόλυτο έλεγχο ενός συστήματος. Δεν πρόκειται απλώς για εντοπισμό προβλημάτων, αλλά για σχεδιασμό επιθέσεων.

Αυτή η εξέλιξη έχει μια κρίσιμη συνέπεια: καταρρέει ο χρόνος αντίδρασης. Μέχρι πρόσφατα, η διαδικασία από την ανακάλυψη μιας ευπάθειας έως την εκμετάλλευσή της μπορούσε να διαρκέσει εβδομάδες ή μήνες. Με τη χρήση τέτοιων μοντέλων, το διάστημα αυτό μπορεί να περιοριστεί σε λίγα λεπτά. Αυτό σημαίνει ότι οι υφιστάμενοι μηχανισμοί άμυνας — εντοπισμός, αξιολόγηση, ανάπτυξη διορθώσεων και ενημέρωση συστημάτων — κινδυνεύουν να καταστούν ανεπαρκείς. Η κυβερνοασφάλεια, όπως τη γνωρίζαμε, δεν προλαβαίνει πλέον τον ίδιο της τον ρυθμό.

Η αντίδραση δεν περιορίστηκε στη Silicon Valley. Στην Ουάσιγκτον, ο υπουργός Οικονομικών των ΗΠΑ, Σκοτ Μπέσεντ και ο διοικητής της Fed, Τζερόμ Πάουελ συγκάλεσαν έκτακτη συνάντηση με τους επικεφαλής των μεγαλύτερων τραπεζών, προκειμένου να αξιολογηθούν οι κίνδυνοι. Η ανησυχία δεν αφορά μόνο την κυβερνοασφάλεια, αλλά τη σταθερότητα ολόκληρου του χρηματοπιστωτικού συστήματος. Ο επικεφαλής της JPMorgan Chase, Τζέιμι Ντάιμον, έχει ήδη προειδοποιήσει ότι η τεχνητή νοημοσύνη είναι πιθανό να εντείνει έναν από τους μεγαλύτερους υφιστάμενους κινδύνους για τις τράπεζες.

Την ίδια στιγμή, η αγορά προσπαθεί να αποτιμήσει τις συνέπειες. Μετοχές εταιρειών κυβερνοασφάλειας δέχθηκαν πιέσεις μετά τις πρώτες αποκαλύψεις, καθώς οι επενδυτές φοβήθηκαν ότι τέτοια εργαλεία θα μπορούσαν να καταστήσουν ξεπερασμένες τις υπάρχουσες λύσεις. Ωστόσο, η εικόνα είναι πιο σύνθετη. Πολλές από αυτές τις εταιρείες συμμετέχουν ήδη στο Project Glasswing, ενσωματώνοντας το Mythos στις δικές τους υποδομές. Η τεχνητή νοημοσύνη δεν αντικαθιστά απαραίτητα την ασφάλεια· την αναδιαμορφώνει.

Παράλληλα, αναδύεται μια νέα «κούρσα εξοπλισμών» μεταξύ των μεγάλων εταιρειών τεχνητής νοημοσύνης. Η OpenAI έχει ήδη ξεκινήσει αντίστοιχες πρωτοβουλίες, με κοινό στόχο να δοθούν τα εργαλεία πρώτα στους αμυνόμενους, πριν φτάσουν στα χέρια των επιτιθέμενων.

Ίσως το πιο ανησυχητικό στοιχείο να μην είναι οι τεχνικές επιδόσεις, αλλά το τι υποδηλώνουν για την ίδια τη φύση αυτών των συστημάτων. Σε δοκιμές, το Mythos δεν περιορίστηκε σε εργαλειακές απαντήσεις, αλλά παρήγαγε σύνθετες αφηγήσεις από επαναλαμβανόμενες, άνευ νοήματος εισόδους, σαν να ακολουθεί μια εσωτερική λογική που δεν είναι άμεσα ορατή. Το ερώτημα που προκύπτει δεν αφορά μόνο την ασφάλεια, αλλά την κατανόηση: πόσο πραγματικά ελέγχουμε συστήματα που λειτουργούν σε επίπεδα πολυπλοκότητας που ξεπερνούν την ανθρώπινη εποπτεία;

Η Anthropic αναγνωρίζει τον κίνδυνο με ασυνήθιστη σαφήνεια. Προειδοποιεί ότι ο κόσμος οδεύει ταχύτατα προς συστήματα υπερανθρώπινης ικανότητας, χωρίς να έχει αναπτύξει αντίστοιχους μηχανισμούς ελέγχου. Η ισορροπία που χαρακτήριζε την κυβερνοασφάλεια επί δεκαετίες — μια σχετική ισοδυναμία μεταξύ επιτιθέμενων και αμυνόμενων — φαίνεται να ανήκει πλέον στο παρελθόν. Το τι θα την αντικαταστήσει παραμένει ανοιχτό. Το μόνο βέβαιο είναι ότι η τεχνητή νοημοσύνη δεν αποτελεί πλέον απλώς εργαλείο. Έχει εξελιχθεί σε παράγοντα ισχύος. Και, όπως κάθε τέτοιος παράγοντας, θα καθορίσει την επόμενη ημέρα όχι μόνο από το τι μπορεί να κάνει, αλλά από το ποιος θα το ελέγξει πρώτος.