Το GPT-4, η πιο πρόσφατη έκδοση του chatbot τεχνητής νοημοσύνης ChatGPT, μπορεί να περάσει εξετάσεις λυκείου και νομικής σχολής με βαθμολογίες που κατατάσσονται στο 90th percentile και διαθέτει νέες δυνατότητες επεξεργασίας που δεν ήταν δυνατές με την προηγούμενη έκδοση.
Τα στοιχεία από τις βαθμολογίες των δοκιμών του GPT-4 κοινοποιήθηκαν στις 14 Μαρτίου από τον δημιουργό OpenAI, αποκαλύπτοντας ότι μπορεί επίσης να μετατρέπει εισόδους εικόνας, ήχου και βίντεο σε κείμενο, καθώς και να χειρίζεται «πολύ πιο λεπτές οδηγίες» πιο δημιουργικά και αξιόπιστα.
«Περνάει σε μια simulated bar exam με βαθμολογία γύρω από το 10% των κορυφαίων υποψηφίων», πρόσθεσε το OpenAI. «Αντίθετα, η βαθμολογία του GPT-3.5 ήταν περίπου στο χαμηλότερο 10%.
Τα στοιχεία δείχνουν ότι το GPT-4 πέτυχε βαθμολογία 163 στο 88th percentile στις εξετάσεις LSAT — οι φοιτητές του κολεγίου πρέπει να περάσουν στις Ηνωμένες Πολιτείες για να γίνουν δεκτοί στη νομική σχολή.
Η βαθμολογία του GPT4 θα το έθετε σε καλή θέση για να γίνει δεκτό σε μια κορυφαία νομική σχολή 20 και είναι μόνο λίγες μονάδες λιγότερο από τις αναφερόμενες βαθμολογίες που απαιτούνται για την αποδοχή σε σχολές κύρους όπως το Χάρβαρντ, το Στάνφορντ, το Πρίνστον ή το Γέιλ.
Η προηγούμενη έκδοση του ChatGPT σημείωσε μόνο 149 στο LSAT, τοποθετώντας το στο χαμηλότερο 40%.
Το GPT-4 σημείωσε επίσης βαθμολογία 298 στα 400 στην Ενιαία Εξέταση Δικηγόρων — μια δοκιμασία που πραγματοποιήθηκε από πρόσφατα πτυχιούχους φοιτητές νομικής που τους επιτρέπει να ασκήσουν το επάγγελμα του δικηγόρου σε οποιαδήποτε δικαιοδοσία των ΗΠΑ.
Η παλιά έκδοση του ChatGPT δυσκολεύτηκε σε αυτό το τεστ, τερματίζοντας στο κάτω 10% με βαθμολογία 213 στα 400.
Όσον αφορά τις εξετάσεις SAT Evidence-Based Reading & Writing και SAT Math από μαθητές γυμνασίου των ΗΠΑ για τη μέτρηση της ετοιμότητάς τους στο κολέγιο, το GPT-4 βαθμολογήθηκε στο 93rd και 89th percentile, αντίστοιχα.
Το GPT-4 διέπρεψε και στις «σκληρές» επιστήμες, σημειώνοντας πολύ πάνω από το μέσο όρο βαθμολογίες εκατοστιαίου επιπέδου στην AP Βιολογία (85-100%), τη Χημεία (71-88%) και τη Φυσική 2 (66-84%).
Ωστόσο, η βαθμολογία του AP Calculus ήταν αρκετά μέτρια, κατατάσσοντας στο 43rd και 59th percentile
Ένας άλλος τομέας όπου έλειπε το GPT-4 ήταν οι εξετάσεις αγγλικής λογοτεχνίας, με βαθμολογίες από το 8th έως το 44th percentile σε δύο ξεχωριστά τεστ.
Η OpenAI είπε ότι οι GPT-4 και GPT-3.5 πήραν αυτές τις δοκιμές από τις πρακτικές εξετάσεις 2022-2023 και ότι «καμία ειδική εκπαίδευση» δεν λήφθηκε από τα εργαλεία επεξεργασίας γλώσσας:
«Δεν κάναμε συγκεκριμένη εκπαίδευση για αυτές τις εξετάσεις. Μια μειοψηφία των προβλημάτων στις εξετάσεις φάνηκε από το μοντέλο κατά τη διάρκεια της εκπαίδευσης, αλλά πιστεύουμε ότι τα αποτελέσματα είναι αντιπροσωπευτικά».
Τα αποτελέσματα προκάλεσαν φόβο και στην κοινότητα του Twitter.
Ο Nick Almond, ο ιδρυτής του FactoryDAO, είπε στους 14.300 οπαδούς του στο Twitter στις 14 Μαρτίου ότι το GPT4 πρόκειται να «τρομάξει τους ανθρώπους» και θα «καταρρεύσει» το παγκόσμιο εκπαιδευτικό σύστημα.
Ο πρώην διευθυντής του Coinbase, Conor Grogan, είπε ότι εισήγαγε live Ethereum smart contract στο GPT-4 και το chatbot επεσήμανε αμέσως πολλά «security vulnerabilities» και περιέγραψε τον τρόπο exploited του κώδικα:
Προηγούμενοι έλεγχοι smart contracts στο ChatGPT διαπίστωσαν ότι η πρώτη του έκδοση ήταν επίσης ικανή να εντοπίσει σφάλματα κώδικα σε λογικό βαθμό επίσης.
Ο Rowan Cheung, ο ιδρυτής του ενημερωτικού δελτίου τεχνητής νοημοσύνης The Rundown , μοιράστηκε ένα βίντεο του GPT που μεταγράφει έναν ψεύτικο ιστότοπο που σχεδιάστηκε με το χέρι σε ένα κομμάτι χαρτί σε κώδικα.
Για περισσότερα ενημερωμένα νέα, βρείτε μας στο Twitter και στις Ειδήσεις Crypto ή εγγραφείτε στο κανάλι μας στο YouTube .
Ποια είναι η γνώμη σας για το συγκεκριμένο θέμα; Αφήστε μας το σχόλιο σας από κάτω! Πάντα μας ενδιαφέρει η γνώμη σας!
Author: Dimitrios Alexandridis
Article: https://cointelegraph.com/news/chatgpt-v4-aces-the-bar-sats-and-can-identify-exploits-in-eth-contracts