Η πρόοδος που έχει επιδείξει η DeepSeek δείχνει ότι η κούρσα έχει αρχίσει όσον αφορά τον ανταγωνισμό ΗΠΑ-Κίνας στον τομέα της τεχνητής νοημοσύνης.
Σε μια σειρά συνεντεύξεων κατά τη διάρκεια της Συνόδου Κορυφής για τη Δράση Τεχνητής Νοημοσύνης στη Γαλλία, ηγέτες πολλών μεγάλων τεχνολογικών εταιρειών δήλωσαν στο CNBC ότι η εμφάνιση της DeepSeek αποδεικνύει ότι η Κίνα δεν μπορεί να μην υπολογίζεται ως σοβαρός παίκτης όταν πρόκειται για την καινοτομία της τεχνητής νοημοσύνης.
Τον περασμένο μήνα, η DeepSeek σόκαρε τις παγκόσμιες αγορές με ένα τεχνικό έγγραφο σύμφωνα με το οποία ένα από τα νέα μοντέλα τεχνητής νοημοσύνης της δημιουργήθηκε με συνολικό κόστος λιγότερο από 6 εκατομμύρια δολάρια – πολύ λιγότερο από τα δισεκατομμύρια δολάρια που ξοδεύουν οι παίκτες των Βig Tech και τα δυτικά εργαστήρια τεχνητής νοημοσύνης, όπως η OpenAI και η Anthropic.
Η DeepSeek υποστηρίζει ότι το νέο μοντέλο R1 ήταν σε θέση να ανταγωνιστεί την απόδοση του παρόμοιου μοντέλου o1 του OpenAI – μόνο που χρησιμοποιεί μια φθηνότερη, λιγότερο ενεργοβόρα διαδικασία.
Αυτό οδήγησε τους ειδικούς να αμφισβητήσουν την επικρατούσα σοφία στη Δύση τα τελευταία χρόνια, η οποία είναι ότι η Κίνα βρίσκεται πίσω από τις ΗΠΑ στην ανάπτυξη της τεχνητής νοημοσύνης λόγω των εξαγωγικών περιορισμών που δυσκολεύουν τις επιχειρήσεις της χώρας να αποκτήσουν πιο προηγμένες μονάδες επεξεργασίας γραφικών της Nvidia ή GPU.
Ο Ριντ Χόφμαν, συνιδρυτής του LinkedIn και εταίρος στην εταιρεία επιχειρηματικών κεφαλαίων Greylock Partners, δήλωσε ότι το νέο μοντέλο της DeepSeek είναι «μια μεγάλη υπόθεση που δείχνει ότι το παιχνίδι έχει αρχίσει».
Παρά ταύτα, κορυφαία στελέχη της TN δεν είναι πεπεισμένα ότι το DeepSeek αποτελεί κάποιου είδους ουσιαστικό κίνδυνο για τις επιχειρήσεις των εργαστηρίων ΤΝ όπως η OpenAI και η Anthropic.
Ενώ οι εμπειρογνώμονες συμφωνούν στο σύνολό τους ότι οι πρόοδοι της DeepSeek στον τομέα της τεχνητής νοημοσύνης ήταν εντυπωσιακές, έχουν εκφραστεί αμφιβολίες σχετικά με τους ισχυρισμούς της κινεζικής επιχείρησης σχετικά με το κόστος.
Η έκθεση διαπίστωσε ότι τα έξοδα έρευνας και ανάπτυξης της DeepSeek και τα έξοδα που σχετίζονται με την ιδιοκτησία είναι σημαντικά και ότι η δημιουργία «συνθετικών δεδομένων» για την εκπαίδευση του μοντέλου θα απαιτούσε «σημαντική ποσότητα υπολογιστών».
Αυτή η τεχνική, γνωστή ως «απόσταξη», περιλαμβάνει την αξιολόγηση της ποιότητας των απαντήσεων που παράγει ένα νεότερο μοντέλο από πιο ισχυρά μοντέλα ΤΝ.
Είναι ένας ισχυρισμός στον οποίο έχει αναφερθεί και η ίδια η OpenAI, λέγοντας στο CNBC σε δήλωσή της τον περασμένο μήνα ότι εξετάζει αναφορές ότι η DeepSeek μπορεί να έχει χρησιμοποιήσει «ακατάλληλα» δεδομένα από τα μοντέλα της για την ανάπτυξη του μοντέλου ΤΝ της, μια μέθοδος που αναφέρεται ως «απόσταξη».
Ο Βίκτορ Ριπαρμπέλι, διευθύνων σύμβουλος της πλατφόρμας βίντεο ΤΝ, Synthesia, δήλωσε ότι παρόλο που το DeepSeek αμφισβήτησε το μοντέλο της δύσης, η υπόθεση ότι οι εταιρείες θα μετατοπίσουν ξαφνικά σημαντικά ποσά του φόρτου εργασίας ΤΝ είναι λανθασμένη.
Η Μέρεντιθ Γουίτακερ, πρόεδρος του Signal Foundation, δήλωσε ότι η ανάπτυξη του DeepSeek δεν μετακινεί πολύ τη βελόνα για τη βιομηχανία, καθώς η δυναμική της αγοράς εξακολουθεί να είναι ευρέως υπέρ των μεγαλύτερων μοντέλων ΤΝ. Το Signal Foundation είναι ένα μη κερδοσκοπικό ίδρυμα που υποστηρίζει την εφαρμογή κρυπτογραφημένων μηνυμάτων Signal.