Ένα πρωτοποριακό νέο σύστημα τεχνητής νοημοσύνης τύπου ChatGPT που εκπαιδεύτηκε με τις ιστορίες ζωής πάνω από ένα εκατομμύριο ανθρώπων, είναι εξαιρετικά ακριβές στην πρόβλεψη της ζωής κάποιου καθώς και του κινδύνου πρόωρου θανάτου, σύμφωνα με μια νέα μελέτη.
Το μοντέλο τεχνητής νοημοσύνης εκπαιδεύτηκε με τα προσωπικά δεδομένα του πληθυσμού της Δανίας και αποδείχθηκε ότι προβλέπει τις πιθανότητες θανάτου των ανθρώπων με μεγαλύτερη ακρίβεια από οποιοδήποτε άλλο υπάρχον σύστημα, δήλωσαν οι επιστήμονες του Τεχνικού Πανεπιστημίου της Δανίας (DTU).
Στη μελέτη, οι ερευνητές ανέλυσαν τα δεδομένα υγείας και αγοράς εργασίας για 6 εκατομμύρια Δανούς που συλλέχθηκαν από το 2008 έως το 2020, συμπεριλαμβανομένων πληροφοριών σχετικά με την εκπαίδευση των ατόμων, τις επισκέψεις σε γιατρούς και νοσοκομεία, τις διαγνώσεις που προέκυψαν, το εισόδημα και το επάγγελμα.
life2vec: Το νέο γλωσσικό μοντέλο, μοιάζει με το ChatGPT
Οι επιστήμονες μετέτρεψαν το σύνολο δεδομένων σε λέξεις για να εκπαιδεύσουν ένα μεγάλο γλωσσικό μοντέλο με την ονομασία «life2vec», παρόμοιο με την τεχνολογία που βρίσκεται πίσω από εφαρμογές τεχνητής νοημοσύνης όπως το ChatGPT. Μόλις το μοντέλο τεχνητής νοημοσύνης έμαθε τα μοτίβα στα δεδομένα, μπορούσε να ξεπεράσει άλλα προηγμένα συστήματα και να προβλέψει αποτελέσματα όπως η προσωπικότητα και ο χρόνος θανάτου με μεγάλη ακρίβεια, σύμφωνα με την μελέτη, η οποία δημοσιεύτηκε στο περιοδικό Nature Computational Science την Τρίτη.
Οι ερευνητές πήραν τα δεδομένα μιας ομάδας ατόμων από το σύνολο ηλικίας 35 έως 65 ετών – οι μισοί από τους οποίους πέθαναν μεταξύ 2016 και 2020 – και ζήτησαν από το σύστημα τεχνητής νοημοσύνης να προβλέψει ποιος θα ζήσει και ποιος θα πεθάνει. Διαπίστωσαν ότι οι προβλέψεις του ήταν κατά 11% ακριβέστερες από εκείνες οποιουδήποτε άλλου υπάρχοντος μοντέλου τεχνητής νοημοσύνης ή από τη μέθοδο που χρησιμοποιούν οι ασφαλιστικές εταιρείες ζωής για την τιμολόγηση των συμβολαίων.
«Αυτό που είναι συναρπαστικό είναι να θεωρήσουμε την ανθρώπινη ζωή ως μια μακρά ακολουθία γεγονότων, παρόμοια με το πώς μια πρόταση σε μια γλώσσα αποτελείται από μια σειρά λέξεων» δήλωσε ο συγγραφέας της μελέτης Σουν Λέχμαν από το DTU.
Ποιες ομάδες ατόμων συνδέονται με υψηλότερο κίνδυνο θανάτου
«Αυτό είναι συνήθως το είδος της εργασίας για την οποία χρησιμοποιούνται τα μοντέλα μετασχηματιστών στην τεχνητή νοημοσύνη, αλλά στα πειράματά μας, τα χρησιμοποιούμε για να αναλύσουμε αυτό που αποκαλούμε ακολουθίες ζωής, δηλαδή γεγονότα που έχουν συμβεί στην ανθρώπινη ζωή» δήλωσε ο Λέχμαν.
Χρησιμοποιώντας το μοντέλο, οι ερευνητές αναζήτησαν απαντήσεις σε γενικά ερωτήματα, όπως οι πιθανότητες να πεθάνει ένας άνθρωπος μέσα σε 4 χρόνια. Διαπίστωσαν ότι οι απαντήσεις του μοντέλου συνάδουν με τα υπάρχοντα ευρήματα, όπως ότι όταν λαμβάνονται υπόψη όλοι οι άλλοι παράγοντες, τα άτομα σε ηγετική θέση ή με υψηλό εισόδημα έχουν περισσότερες πιθανότητες να επιβιώσουν, ενώ το να είναι κανείς άνδρας, ειδικευμένος ή να έχει ψυχική διάγνωση συνδέεται με υψηλότερο κίνδυνο θανάτου.
«Χρησιμοποιήσαμε το μοντέλο για να απαντήσουμε στο θεμελιώδες ερώτημα: Σε ποιο βαθμό μπορούμε να προβλέψουμε γεγονότα στο μέλλον σας με βάση τις συνθήκες και τα γεγονότα στο παρελθόν σας;» είπε ο δρ. Λέχμαν. «Επιστημονικά, αυτό που μας συναρπάζει δεν είναι τόσο η ίδια η πρόβλεψη, όσο οι πτυχές των δεδομένων που επιτρέπουν στο μοντέλο να παρέχει τόσο ακριβείς απαντήσεις» πρόσθεσε.
Το μοντέλο θα μπορούσε επίσης να προβλέψει με ακρίβεια τα αποτελέσματα ενός τεστ προσωπικότητας σε ένα τμήμα του πληθυσμού καλύτερα από τα υπάρχοντα συστήματα τεχνητής νοημοσύνης. «Το πλαίσιό μας επιτρέπει στους ερευνητές να εντοπίσουν νέους πιθανούς μηχανισμούς που επηρεάζουν τα αποτελέσματα της ζωής και τις σχετικές δυνατότητες για εξατομικευμένες παρεμβάσεις» έγραψαν οι ερευνητές στη μελέτη.
Μπορεί κάποιος να θέσει το ερώτημα: «Θα πεθάνω μέσα σε τέσσερα χρόνια;»
Θεωρώντας κάθε μέρος της ζωής σας σαν να ήταν λέξεις σε μια πρόταση, το life2vec προβλέπει πού θα καταλήξει η ιστορία με βάση όσα έχουν γραφτεί μέχρι στιγμής.
Ακριβώς όπως οι χρήστες του ChatGPT ζητούν να γράψει ένα τραγούδι, ποίημα ή δοκίμιο, οι επιστήμονες μπορούν να θέσουν στο life2vec απλές ερωτήσεις όπως «θάνατος εντός τεσσάρων ετών;» για ένα συγκεκριμένο άτομο. Και με βάση τα πληθυσμιακά δεδομένα τους, προέβλεψε σωστά ποιος θα είχε πεθάνει μέχρι το 2020 σε περισσότερα από τα 3/4 των περιπτώσεων.
Με τον ίδιο τρόπο που το ChatGPT και άλλα μεγάλα γλωσσικά μοντέλα εκπαιδεύτηκαν με βάση σωρεία υπαρχόντων γραπτών έργων, το life2vec διδάχθηκε με δεδομένα από τη ζωή των ανθρώπων, που γράφτηκαν ως μια σειρά από προτάσεις πλούσιες σε δεδομένα.
Αυτές περιλαμβάνουν προτάσεις όπως «Τον Σεπτέμβριο του 2012, ο Φρανσίσκο έλαβε είκοσι χιλιάδες δανικές κορώνες ως φύλακας σε ένα κάστρο στην Ελσινόρη» ή «Κατά τη διάρκεια του τρίτου έτους της στο γυμνάσιο, η Ερμιόνη παρακολούθησε πέντε μαθήματα επιλογής».
Ο Λέχμαν και η ομάδα του ανέθεσαν διαφορετικά σημεία σε κάθε πληροφορία και όλα αυτά τα δεδομένα χαρτογραφήθηκαν σε σχέση μεταξύ τους.
Οι κατηγορίες στις ιστορίες ζωής των ανθρώπων καλύπτουν όλο το φάσμα των ανθρώπινων εμπειριών: ένα κάταγμα στο αντιβράχιο αντιπροσωπεύεται ως S52- η εργασία σε καπνοπωλείο κωδικοποιείται ως IND4726, το εισόδημα αντιπροσωπεύεται από 100 διαφορετικά ψηφιακά σημεία- και η «αιμορραγία κατά τον τοκετό» είναι O72.
Πολλές από αυτές τις σχέσεις είναι διαισθητικές, όπως το επάγγελμα και το εισόδημα – ορισμένες εργασίες αποφέρουν περισσότερα χρήματα.
Αλλά αυτό που κάνει το life2vec είναι να χαρτογραφεί τον τεράστιο αστερισμό των παραγόντων που συνθέτουν τη ζωή ενός ατόμου, επιτρέποντας σε κάποιον να του ζητήσει να κάνει μια πρόβλεψη με βάση εκατομμύρια άλλους ανθρώπους και πολλούς πολλούς παράγοντες.
Κάνει ακόμη και προβλέψεις για την προσωπικότητα των ανθρώπων
Μπορεί επίσης να κάνει προβλέψεις για την προσωπικότητα των ανθρώπων.
Για να γίνει αυτό, ο Λέχμαν και η ομάδα του εκπαίδευσαν το μοντέλο να προβλέπει τις απαντήσεις των ανθρώπων σε ερωτήσεις ενός τεστ προσωπικότητας. Το τεστ ζητά από τους ερωτηθέντες να βαθμολογήσουν 10 στοιχεία με βάση το πόσο συμφωνούν, στοιχεία όπως «Το πρώτο πράγμα που κάνω πάντα σε ένα νέο μέρος είναι να κάνω φίλους» ή «Σπάνια εκφράζω τις απόψεις μου σε ομαδικές συναντήσεις».
Γιατί δε θα πρέπει να χρησιμοποιηθεί από ασφαλιστικές εταιρείες
Ωστόσο, οι επιστήμονες προειδοποιούν ότι το μοντέλο δεν θα πρέπει να χρησιμοποιείται από ασφαλιστικές εταιρείες ζωής λόγω ηθικών ανησυχιών.
«Σαφώς, το μοντέλο μας δεν θα πρέπει να χρησιμοποιηθεί από μια ασφαλιστική εταιρεία, διότι η όλη ιδέα της ασφάλισης είναι ότι, μοιράζοντας την έλλειψη γνώσης για το ποιος θα είναι ο άτυχος που θα χτυπηθεί από κάποιο περιστατικό, ή το θάνατο, ή την απώλεια του σακιδίου σας, μπορούμε κατά κάποιο τρόπο να μοιραστούμε αυτό το βάρος», δήλωσε ο δρ. Λέχμαν στο New Scientist.
Υπάρχουν και ηθικά ζητήματα
Οι ερευνητές προειδοποιούν επίσης ότι υπάρχουν και άλλα ηθικά ζητήματα γύρω από τη χρήση του life2vec, όπως η προστασία ευαίσθητων δεδομένων, η προστασία της ιδιωτικής ζωής και ο ρόλος της μεροληψίας στα δεδομένα. «Τονίζουμε ότι το έργο μας είναι μια εξερεύνηση του τι είναι δυνατό, αλλά θα πρέπει να χρησιμοποιείται μόνο σε πραγματικές εφαρμογές υπό κανονισμούς που προστατεύουν τα δικαιώματα των ατόμων», ανέφεραν.