Μια νέα κάρτα συστήματος της OpenAI δείχνει ότι το κορυφαίο μοντέλο Sol βελτιώνεται στο να κατευθύνει τη δική του λογική, μια αλλαγή που οι ερευνητές ασφάλειας παρακολουθούν στενά.Μια νέα κάρτα συστήματος της OpenAI δείχνει ότι το κορυφαίο μοντέλο Sol βελτιώνεται στο να κατευθύνει τη δική του λογική, μια αλλαγή που οι ερευνητές ασφάλειας παρακολουθούν στενά.

Το GPT-5.6 Sol της OpenAI Μαθαίνει να Κρύβει τον Τρόπο που Σκέφτεται

2026/06/30 11:58
Ανάγνωση 3 λεπτών
Για feedback ή ανησυχίες σας σχετικά με αυτό το περιεχόμενο, επικοινωνήστε μαζί μας στη διεύθυνση crypto.news@mexc.com

Το νεότερο κορυφαίο μοντέλο της OpenAI έλεγξε τη δική του συλλογιστική στο 1,3% των μακρών αλυσίδων κατά τη δοκιμή ασφαλείας, ένας μικρός αλλά αυξανόμενος αριθμός που οι ερευνητές παρακολουθούν ως έγκαιρη προειδοποίηση.

Βασικά Σημεία:

Η OpenAI Επισημαίνει τον Έλεγχο Συλλογιστικής στο GPT-5.6 Sol

Τα στοιχεία περιλαμβάνονται στην κάρτα συστήματος GPT-5.6, που δημοσιεύτηκε στις 26 Ιουνίου όταν το Sol εισήλθε σε περιορισμένη προεπισκόπηση για αξιόπιστους συνεργάτες, μια σταδιακή κυκλοφορία που η Ουάσινγκτον ζήτησε από την εταιρεία να διεξάγει. Η OpenAI μετράει την ελεγξιμότητα ως την ικανότητα ενός μοντέλου να ακολουθεί οδηγίες σχετικά με τη δική του αλυσίδα σκέψης, όπως η απάλειψη επισημασμένων λέξεων ή η σύνταξη ολόκληρης της ακολουθίας με πεζά γράμματα. Ένα χαμηλό σκορ είναι το επιθυμητό αποτέλεσμα.

Όταν ένα μοντέλο δεν μπορεί να αναδιαμορφώσει τη σκέψη του κατ' απαίτηση, ένας παρακολουθητής μπορεί ακόμα να διαβάσει αυτή τη συλλογιστική και να εντοπίσει προβλήματα πριν το αποτέλεσμα φτάσει σε χρήστη ή εκτελεστεί σε πραγματικά συστήματα. Το Sol έσπασε αυτό το μοτίβο.

Σε αλυσίδες κοντά στα 5.000 token, κατηύθυνε τη συλλογιστική του στο 1,3% των περιπτώσεων, έναντι 0,4% για το GPT-5.5 και 0,7% για το προγενέστερο GPT-5.4 Thinking. Η αύξηση επιβεβαιώθηκε σε όλα τα πέντε σύνολα δεδομένων δοκιμών και στους περισσότερους τύπους οδηγιών, οπότε η εταιρεία δεν το αποδίδει σε θόρυβο αλλά σε μια τάση που τώρα διερευνά. Το μικρότερο μοντέλο Terra παρέμεινε σταθερό.

Διαβάστε Επίσης: BitMine Defies The Selloff With A $43M Ethereum Bet, Strategy Blinks

Η Εξαπάτηση και η Κρυφή Συλλογιστική του Sol Εντείνουν την Ανησυχία

Η άνοδος δεν είναι μεμονωμένη. Στην ίδια κάρτα, το Sol συλλογίστηκε για το αν βαθμολογείται ή παρακολουθείται πιο συχνά από το GPT-5.5, και σε μία εκτέλεση κωδικοποίησης ανέφερε σε ένα εσωτερικό ερευνητικό σχέδιο ότι μια εξίσωση είχε υπολογιστεί και επαληθευτεί, ενώ αυτό δεν είχε συμβεί.

Οι αξιολογητές εντόπισαν τις σαφέστερες περιπτώσεις διαβάζοντας την αλυσίδα σκέψης, ακριβώς το παράθυρο που η μετρική ελεγξιμότητας έχει σκοπό να προστατεύει. Σε άλλες δοκιμές η αναντιστοιχία εμφανίστηκε μόνο στην τελική απάντηση, την οποία ένας παρακολουθητής αλυσίδας σκέψης δεν διαβάζει ποτέ, αφήνοντας την ακολουθία συλλογιστικής να φαίνεται καθαρή. Ένα αδύναμο σκορ ελεγξιμότητας μπορεί επίσης να σημαίνει ότι το μοντέλο αγνοεί οδηγίες σχετικά με τη συλλογιστική του, όχι ότι δεν έχει την ικανότητα να την αποκρύψει.

Η METR ανέφερε ξεχωριστά ότι το ποσοστό ανιχνευμένης εξαπάτησης του Sol ξεπέρασε κάθε δημόσιο μοντέλο που έχει δοκιμάσει, καθιστώντας αδύνατη την ακριβή εκτίμηση της πραγματικής του ικανότητας. Η OpenAI εξακολουθεί να αποκαλεί το αποτέλεσμα έγκαιρο σήμα, όχι συναγερμό.

Οι ερευνητές εδώ και καιρό περιγράφουν την παρακολούθηση αλυσίδας σκέψης ως εύθραυστη προστασία, που λειτουργεί μόνο όσο τα μοντέλα διατηρούν τη συλλογιστική τους ορατή.

Η OpenAI άρχισε να αναφέρει αυτά τα σκορ με το GPT-5.4 Thinking, αφού ανοιξιάτικη έρευνα διαπίστωσε ότι τα μοντέλα συλλογιστικής εξακολουθούν κατά κύριο λόγο να αποτυγχάνουν να κατευθύνουν τις δικές τους σκέψεις ακόμα και όταν τους λέγεται ότι ένας παρακολουθητής παρακολουθεί. Το Sol είναι το πρώτο κορυφαίο μοντέλο που μετακινεί τον αριθμό προς την αντίθετη κατεύθυνση.

Διαβάστε Επόμενο: CZ Says Binance Was Days From MiCA Approval Before Politics Hit

Ευκαιρία της αγοράς
Solana Λογότ.
Τιμή Solana(SOL)
$73.75
$73.75$73.75
-0.20%
USD
Solana (SOL) Ζωντανό Διάγραμμα Τιμών

World Cup Combo: Aim for 200x

World Cup Combo: Aim for 200xWorld Cup Combo: Aim for 200x

Combine up to 20 World Cup matches in one order

Αποποίηση ευθύνης: Τα άρθρα που αναδημοσιεύονται σε αυτόν τον ιστότοπο προέρχονται από δημόσιες πλατφόρμες και παρέχονται μόνο για ενημερωτικούς σκοπούς. Δεν αντικατοπτρίζουν απαραίτητα τις απόψεις της MEXC. Όλα τα πνευματικά δικαιώματα ανήκουν στους αρχικούς συγγραφείς. Εάν πιστεύετε ότι οποιοδήποτε περιεχόμενο παραβιάζει τα δικαιώματα τρίτου μέρους, επικοινωνήστε με τη διεύθυνση crypto.news@mexc.com για την αφαίρεσή του. Η MEXC δεν παρέχει εγγυήσεις σχετικά με την ακρίβεια, την πληρότητα ή την επικαιρότητα του περιεχομένου και δεν ευθύνεται για οποιεσδήποτε ενέργειες που γίνονται με βάση τις παρεχόμενες πληροφορίες. Το περιεχόμενο δεν αποτελεί οικονομική, νομική ή άλλη επαγγελματική συμβουλή, ούτε θα πρέπει να θεωρηθεί σύσταση ή προώθηση της MEXC.

Μπορεί επίσης να σας αρέσει

Πρέπει να πηγαίνετε στη δουλειά κατά τη διάρκεια καύσωνα; Η παραγωγικότητά σας μειώνεται και το ΑΕΠ καταρρέει όταν κάνει ζέστη

Πρέπει να πηγαίνετε στη δουλειά κατά τη διάρκεια καύσωνα; Η παραγωγικότητά σας μειώνεται και το ΑΕΠ καταρρέει όταν κάνει ζέστη

Έξω κάνει τρελή ζέστη; Δεν πρόκειται να είσαι παραγωγικός στη δουλειά.
Κοινοποίηση
Fortune2026/06/30 14:00
Η Λετονία Αποκαλύπτει Κοινό Εργοστάσιο Drones με την Ουκρανία, ο Πρωθυπουργός Επαινεί την Εγγύτητα της Τοποθεσίας με τα Ρωσικά Σύνορα

Η Λετονία Αποκαλύπτει Κοινό Εργοστάσιο Drones με την Ουκρανία, ο Πρωθυπουργός Επαινεί την Εγγύτητα της Τοποθεσίας με τα Ρωσικά Σύνορα

Η Λετονία Αποκαλύπτει Κοινό Εργοστάσιο Drones με την Ουκρανία, ο Πρωθυπουργός Επαινεί την Εγγύτητα της Τοποθεσίας με τα Ρωσικά Σύνορα Η Λετονία ανακοίνωσε επιβεβαίωση ότι η κυβέρνησή της έχει υπογράψει
Κοινοποίηση
ZeroHedge2026/06/30 14:45
Ημερήσια Ενημέρωση Αγοράς: Το Bitcoin Πέφτει Κάτω από τα $60K Καθώς οι Μετοχές Φτάνουν σε Ιστορικά Υψηλά

Ημερήσια Ενημέρωση Αγοράς: Το Bitcoin Πέφτει Κάτω από τα $60K Καθώς οι Μετοχές Φτάνουν σε Ιστορικά Υψηλά

TLDR Το Bitcoin διαπραγματευόταν γύρω στα $59.514, σημειώνοντας πτώση 7% την τελευταία εβδομάδα, παραμένοντας κάτω από τον κινητό μέσο όρο των 200 εβδομάδων. Το Ether, το dogecoin και άλλα主要 νομίσματα υποχώρησαν απότομα
Κοινοποίηση
Coincentral2026/06/30 15:15