DeepSeek: Τι είναι και γιατί αλλάζει τα δεδομένα του κλάδου της τεχνητής νοημοσύνης

Καθώς οι επικεφαλής των μεγαλύτερων εταιρειών τεχνητής νοημοσύνης συγκεντρώθηκαν στις ελβετικές Άλπεις την περασμένη εβδομάδα, όλα τα βλέμματα ήταν στραμμένα προς τα ανατολικά. Σε συζητήσεις σε πάνελ και ιδιωτικές συνομιλίες στο περιθώριο του Παγκόσμιου Οικονομικού Φόρουμ στο Νταβός, τα στελέχη της τεχνολογίας τόνισαν την ανάγκη οι ΗΠΑ και οι σύμμαχοί τους να κατασκευάσουν περισσότερα κέντρα δεδομένων και να επιτύχουν τη σωστή ισορροπία στους κανονισμούς για να παραμείνουν μπροστά από την Κίνα στην ανάπτυξη της τεχνητής νοημοσύνης.

«Είμαστε πιθανότατα ένα χρόνο και πλέον μπροστά στα μοντέλα», δήλωσε στο Bloomberg News η Ρουθ Πόρατ, πρόεδρος και επικεφαλής επενδύσεων της Alphabet Inc. Αλλά, προσέθεσε, «δεν είναι δεδομένο» ότι οι ΗΠΑ διατηρούν το πλεονέκτημά τους.

Ακόμη και αυτό μπορεί να ήταν υπερβολικά αισιόδοξο. Μέσα σε λίγες ημέρες, μια σχετικά άγνωστη κινεζική νεοφυής επιχείρηση τεχνητής νοημοσύνης με την ονομασία DeepSeek κυκλοφόρησε ένα νέο μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα με την ονομασία R1 που μπορεί να μιμηθεί τον τρόπο με τον οποίο οι άνθρωποι σκέφτονται. Η εταιρεία δήλωσε ότι το R1 ανταγωνίστηκε ή ξεπέρασε τα κορυφαία αμερικανικά μοντέλα σε μια σειρά από βιομηχανικά κριτήρια αναφοράς, συμπεριλαμβανομένων των μαθηματικών εργασιών και των γενικών γνώσεων – και κατασκευάστηκε με ελάχιστο κόστος. Μέχρι το Σαββατοκύριακο, η DeepSeek είχε αναρριχηθεί στην κατάταξη του Chatbot Arena, ενός πίνακα κατάταξης για τα συστήματα τεχνητής νοημοσύνης και εξέχουσες προσωπικότητες της τεχνολογίας όπως ο Μαρκ Άντρεεσεν αποκαλούσαν το προϊόν «η στιγμή Σπούτνικ της τεχνητής νοημοσύνης».

Οι πρώτες αντιδράσεις

Τώρα, οι επιπτώσεις από την κυκλοφορία του R1 εξαπλώνονται γρήγορα στις ΗΠΑ, καθώς η τεχνολογική βιομηχανία προσπαθεί να κατανοήσει πώς η DeepSeek τα κατάφερε και αν η νεοφυής εταιρεία το έκανε τόσο φθηνά όσο ισχυρίζεται. Ήδη, υπάρχουν υποψίες ότι η κινεζική νεοσύστατη εταιρεία κατασκεύασε το chatbot της με βάση τη δυτική τεχνολογία, παρακάμπτοντας το τεράστιο κόστος ανάπτυξης μεγάλων γλωσσικών μοντέλων.

Στο Σαν Φρανσίσκο, στελέχη και υπάλληλοι αναλύουν επειγόντως την τεχνολογία της DeepSeek. Κάποιοι από το προσωπικό του OpenAI προσπαθούν να καταλάβουν πώς ακριβώς η DeepSeek μπόρεσε να κυκλοφορήσει ένα τέτοιο μοντέλο, σύμφωνα με πηγές του Bloomberg. Ένα άλλο άτομο δήλωσε ότι υπάρχει η αίσθηση στην εταιρεία ότι η OpenAI πρέπει να λάβει πολύ σοβαρά υπόψη της τις εξελίξεις, καθώς αποτελούν ευκαιρία για καινοτομία και βελτίωση των υφιστάμενων μοντέλων της. Ο διευθύνων σύμβουλος της OpenAI, Σαμ Άλτμαν, δήλωσε πρόσφατα στους υπαλλήλους ότι η κυκλοφορία του R1 σηματοδοτεί μια σημαντική αλλαγή του τοπίου για την επιχείρηση.

«Το R1 της DeepSeek είναι ένα εντυπωσιακό μοντέλο», έγραψε ο Άλτμαν στην πρώτη δημόσια αντίδρασή του στο X. »Εμείς προφανώς θα παραδώσουμε πολύ καλύτερα μοντέλα αλλά είναι πολύ καλό να έχουμε έναν νέο ανταγωνιστή!»

Η Meta Platforms Inc. που επίσης επικεντρώνεται σε μοντέλα τεχνητής νοημοσύνης ανοιχτού κώδικα, έχει δημιουργήσει μια ομάδα που επικεντρώνεται στην ανάλυση του DeepSeek για να κατανοήσει καλύτερα πώς κατασκευάστηκε και τι μπορεί να κάνει. Η εταιρεία έχει συγκροτήσει παρόμοιες ομάδες εργασίας για την αξιολόγηση άλλων σημαντικών ανταγωνιστών, όπως το μοντέλο GPT-4 της OpenAI και το Gemini της Google.

Σχεδόν εν μία νυκτί, η DeepSeek ανέτρεψε πολλές από τις υποθέσεις εντός της Silicon Valley σχετικά με τα οικονομικά της δημιουργίας τεχνητής νοημοσύνης, καθώς και τις καλύτερες μεθόδους για την ανάπτυξη της τεχνολογίας και την έκταση του προβαδίσματος των ΗΠΑ έναντι των ανταγωνιστών στην Κίνα. Κατά το μεγαλύτερο μέρος των τελευταίων δύο και πλέον ετών από τότε που το ChatGPT ξεκίνησε την παγκόσμια φρενίτιδα της τεχνητής νοημοσύνης, η βιομηχανία στοιχημάτισε ότι ο δρόμος για την καλύτερη τεχνητή νοημοσύνη εξαρτάται σε μεγάλο βαθμό από τις μεγάλες δαπάνες για πιο προηγμένα τσιπ από εταιρείες όπως η Nvidia Corp. και τα ολοένα και πιο μεγάλα κέντρα δεδομένων για τη στέγαση τους.

Ο πρόεδρος των ΗΠΑ Ντόναλντ Τραμπ εξέφρασε την ικανοποίησή του για την εξέλιξη αυτή ως «καλή, επειδή δεν χρειάζεται να ξοδέψoυμε τόσα χρήματα». Ο ηγέτης της βιομηχανίας Nvidia, οι μετοχές της οποίας δέχθηκαν τεράστιο πλήγμα από το ντεμπούτο του DeepSeek, το εξήρε επίσης ως «εξαιρετική εξέλιξη της τεχνητής νοημοσύνης».

Η αντίδραση της αγοράς

Οι επιπτώσεις στην αγορά ήταν συγκλονιστικές. Το κατόρθωμα της DeepSeek οδήγησε σε πτώση σχεδόν 1 τρισεκατομμυρίου δολαρίων στις αμερικανικές και ευρωπαϊκές μετοχές τεχνολογίας τη Δευτέρα 28 Ιανουαρίου, καθώς οι επενδυτές αμφισβήτησαν τα σχέδια δαπανών ορισμένων από τις μεγαλύτερες εταιρείες της Αμερικής. Μόνο η πτώση της μετοχής της Nvidia, της εταιρείας κατασκευής τσιπ τεχνητής νοημοσύνης, διέγραψε περίπου 589 δισεκατομμύρια δολάρια σε χρηματιστηριακή αξία, το μεγαλύτερο πλήγμα στην ιστορία του αμερικανικού χρηματιστηρίου.

Ορισμένες από τις μεγαλύτερες τεχνολογικές εταιρείες της Ιαπωνίας δέχτηκαν πιέσεις τη δεύτερη ημέρα. Η Advantest, κατασκευάστρια εταιρεία εξοπλισμού ελέγχου τσιπ, προμηθευτής της Nvidia, έχασε 10% επιπλέον μετά από πτώση τη Δευτέρας κατά 9%, ενώ η SoftBank Group, επενδυτής τεχνολογικών νεοφυών επιχειρήσεων διολίσθησε κατά 5%. Στην Ευρώπη την Τρίτη, οι μετοχές της ολλανδικής εταιρείας ημιαγωγών ASML η οποία έκλεισε με πτώση 7,1% τη Δευτέρα, υποχώρησε 1%, αντιστρέφοντας ένα πρώιμο ράλι, ενώ οι μετοχές της Schneider Electric, της ASM International και της Infineon υποχώρησαν κατά 1,2%-4,7%.

Στις ΗΠΑ, η Broadcom υποχώρησε 17,4% τη Δευτέρα, ενώ η υποστηρικτής του ChatGPT, Microsoft, υποχώρησε 2,1% και η Alphabet έκλεισε με πτώση 4,2%. Ο δείκτης ημιαγωγών της Φιλαδέλφειας σημείωσε πτώση 9,2% – τη μεγαλύτερη ποσοστιαία πτώση του από τον Μάρτιο του 2020.

Σύμφωνα με τους αναλυτές της JPMorgan, η τάση της Τεχνητής Νοημοσύνης θα συνεχίσει να οδηγεί τα εταιρικά αποτελέσματα και τα αποτελέσματα της αγοράς. Ωστόσο, ο συνεχιζόμενος ανταγωνισμός και η καινοτομία θα δημιουργήσουν νικητές και ηττημένους. Η εταιρεία ενθαρρύνει τους επενδυτές να αναζητούν ευκαιρίες, διατηρώντας παράλληλα ένα συνολικό χαρτοφυλάκιο που είναι ανθεκτικό στους πιθανούς κλυδωνισμούς που μπορεί να προκύψουν.

Ορισμένοι τρόποι για να διασφαλιστεί η ανθεκτικότητα του χαρτοφυλακίου θα μπορούσαν να περιλαμβάνουν τον έλεγχο του συνολικού τους σχεδίου, τη σωστή διαφοροποίηση, μια συνεπή προσέγγιση στην επανεξισορρόπηση και την υπενθύμιση ότι η μεταβλητότητα της χρηματιστηριακής αγοράς είναι φυσιολογική.

Εν τω μεταξύ, στην Ουάσινγκτον, οι αρχές προσπαθούν να βρουν την καλύτερη οδό για να ανακόψουν την πρόοδο της Κίνας σε μια τεχνολογία που ορισμένοι θεωρούν ζωτικής σημασίας για τον στρατό και την οικονομία της, δεδομένου ότι οι περιορισμοί των εξαγωγών τσιπ της κυβέρνησης Μπάιντεν δεν ήταν αρκετοί. Ο Ντέιβιντ Σακς, ο τσάρος των crypto και της τεχνητής νοημοσύνης του προέδρου Ντόναλντ Τραμπ, δήλωσε ότι το DeepSeek δείχνει ότι ο παγκόσμιος αγώνας για την τεχνητή νοημοσύνη θα είναι πολύ ανταγωνιστικός – ενώ κατηγόρησε τη διοίκηση Μπάιντεν για ρύθμιση που «εμπόδισε» την ανάπτυξη της τεχνητής νοημοσύνης.

Περιπλέκοντας περαιτέρω τα πράγματα, η ανανεωμένη αβεβαιότητα σχετικά με τις μεγάλες επενδύσεις ΤΝ έρχεται μόλις λίγες ημέρες αφότου ο Τραμπ ξεκίνησε μια κοινοπραξία 100 δισεκατομμυρίων δολαρίων από την OpenAI, την SoftBank Group Corp. και την Oracle Corp. για την ενίσχυση της ανταγωνιστικότητας των ΗΠΑ με επενδύσεις σε κέντρα δεδομένων και άλλες υποδομές. Τώρα, υπάρχουν νέα ερωτήματα σχετικά με τη λογική των τεράστιων εξόδων για την τεχνητή νοημοσύνη.

Η άνοδος της DeepSeek

Ο 40χρονος Λιάνγκ Γουενφένγκ δημιούργησε τη DeepSeek το 2023 ως παρακλάδι του τμήματος τεχνητής νοημοσύνης του hedge fund του, Zhejiang High-Flyer Asset Management.

Ο Λιάνγκ μπόρεσε να αξιοποιήσει κάποια τοπικά ταλέντα. Είχε αρχίσει να αποθηκεύει περίπου 10.000 GPUs A100 της Nvidia – μια παλαιότερη έκδοση μιας βασικής τεχνολογίας για την εκπαίδευση συστημάτων ΤΝ- πριν οι ΗΠΑ επιβάλουν περιορισμούς στις εξαγωγές. Οι περισσότεροι από τους κορυφαίους ερευνητές του ήταν νέοι απόφοιτοι κορυφαίων κινεζικών πανεπιστημίων.

Η DeepSeek κυκλοφόρησε γρήγορα μια σειρά από μοντέλα τεχνητής νοημοσύνης ανοιχτού κώδικα, ξεκινώντας με το DeepSeek LLM στα τέλη του 2023. Δύο πιο προηγμένα μοντέλα – το V2 και το V3 – κυκλοφόρησαν στα μέσα και στα τέλη του 2024, αντίστοιχα. Ωστόσο, ήταν το μοντέλο R1 της DeepSeek, που κυκλοφόρησε στα μέσα Ιανουαρίου, που πραγματικά καινοτόμησε.

Όπως μερικά από τα τελευταία μοντέλα από το OpenAI, την Google και την Anthropic, το R1 έχει σκοπό να αναπαράγει τον τρόπο με τον οποίο οι άνθρωποι μερικές φορές αναλογίζονται τα προβλήματα, δαπανώντας χρόνο για να υπολογίσουν μια απάντηση πριν απαντήσουν σε ερωτήματα χρηστών. Η έκδοση της DeepSeek διαφέρει, ωστόσο, ως προς την αποτελεσματικότητά της. Η ομάδα πίσω από αυτήν επινόησε κάποιες απλές αλλά βασικές καινοτομίες, όπως η εξεύρεση τρόπων για να αξιοποιήσουν περισσότερο τα τσιπ υπολογιστών στα οποία είχαν πρόσβαση. Ένα άλλο επίτευγμα: στηρίχθηκε σε μεγάλο βαθμό σε μια τεχνική γνωστή ως ενισχυτική μάθηση, η οποία επιβραβεύει ένα σύστημα για τις σωστές απαντήσεις και το τιμωρεί για τις λανθασμένες.

Η εφαρμογή της DeepSeek αποδείχθηκε δημοφιλής στους Αμερικανούς χρήστες, εν μέρει χάρη σε ένα συμπαθητικό, κάπως αμήχανο chatbot που δείχνει με μεγάλη λεπτομέρεια πώς σκοπεύει να απαντήσει στην ερώτηση ενός ατόμου πριν παρουσιάσει τα αποτελέσματα. Η προσέγγιση περιλαμβάνει πολύ περισσότερες λεπτομέρειες από ό,τι τα τελευταία μοντέλα συλλογισμού του OpenAI. Επιπλέον, σε αντίθεση με το OpenAI, το οποίο χρεώνει έως και 200 δολάρια το μήνα για απεριόριστη πρόσβαση στα πιο προηγμένα μοντέλα συλλογισμού του, μεταξύ άλλων χαρακτηριστικών, η DeepSeek προσφέρει προς το παρόν την υπηρεσία της δωρεάν. Αλλά η DeepSeek λογοκρίνει επίσης θέματα που θα ήταν ευαίσθητα στην Κίνα.

Ο Άλτμαν, εν τω μεταξύ, έχει πει στους υπαλλήλους της OpenAI ότι η startup του προσπαθεί να καταλάβει αν και σε ποιο βαθμό οι επιδόσεις του μοντέλου της DeepSeek είναι αποτέλεσμα χρήσης των μοντέλων της OpenAI – δηλαδή, χρησιμοποιώντας τα αποτελέσματα της τεχνητής νοημοσύνης της εν λόγω εταιρείας για να εκπαιδεύσει ένα διαφορετικό μοντέλο ώστε να έχει παρόμοιες δυνατότητες – ή αν αντιπροσωπεύει μια ανεξάρτητη ερευνητική ανακάλυψη.

Ο Λιάνγκ, από την πλευρά του, έχει υποδείξει ότι το κόστος και η συγκέντρωση κεφαλαίων δεν είναι το κύριο μέλημά του. Αντίθετα, το εμπόδιο για περαιτέρω πρόοδο, δήλωσε ο Λιάνγκ σε συνέντευξή του στο κινεζικό πρακτορείο 36kr, είναι οι περιορισμοί των ΗΠΑ στην πρόσβαση στα καλύτερα τσιπ.

DeepSeek: Τι είναι και γιατί αλλάζει τα δεδομένα του κλάδου της τεχνητής νοημοσύνης

TikTok υπό εξαγορά: Η Amazon καταθέτει πρόταση λίγο πριν το deadline των ΗΠΑ

Κίνα: Πιέζει τους νέους να γίνουν εργάτες για να καλύψουν τις κενές θέσεις στα εργοστάσια

Σε ...ελεύθερη πτώση Wall Street και πετρέλαιο από τους δασμούς Τραμπ – Κίνδυνος ύφεσης για τις ΗΠΑ

DeepSeek: Τι είναι και γιατί αλλάζει τα δεδομένα του κλάδου της τεχνητής νοημοσύνης

Οι πρώτες αντιδράσεις

Η αντίδραση της αγοράς

Η άνοδος της DeepSeek

Related Posts

TikTok υπό εξαγορά: Η Amazon καταθέτει πρόταση λίγο πριν το deadline των ΗΠΑ

Κίνα: Πιέζει τους νέους να γίνουν εργάτες για να καλύψουν τις κενές θέσεις στα εργοστάσια

Σε ...ελεύθερη πτώση Wall Street και πετρέλαιο από τους δασμούς Τραμπ – Κίνδυνος ύφεσης για τις ΗΠΑ