Το DeepSeek μόλις απέδειξε ότι η Λίνα Καν είχε δίκιο
Η Καν προειδοποίησε ότι η προστατευτική πολιτική υπέρ των τεχνολογικών μονοπωλίων δεν θα έβλαπτε μόνο όλους εμάς, αλλά και τα ίδια. Τώρα, αυτά εξαλείφονται.
Οι μετοχές των αμερικανικών τεχνολογικών εταιρειών καταρρέουν, καθώς η Κίνα φαίνεται να αποκαλύπτει ότι οι αμερικανικές εταιρείες που δραστηριοποιούνται στον τομέα της τεχνητής νοημοσύνης είναι υπερβολικά υπερτιμημένες. Πρόκειται για μια προβλέψιμη συνέπεια του τρόπου με τον οποίο η αμερικανική κυβέρνηση έχει προσεγγίσει τη Silicon Valley και το αντίστροφο. Αυτό δεν είναι ένα θέμα που καλύπτουμε συνήθως, αλλά δεν εμπιστευόμαστε πλήρως τα αμερικανικά μέσα ενημέρωσης να πουν αυτή την ιστορία με ακρίβεια.
Όποιος ακολουθούσε την υπόθεση έστω και περιστασιακά, είδε πώς εξελίχθηκε. Οι αμερικανικές τεχνολογικές εταιρείες, με την υποστήριξη της ομοσπονδιακής κυβέρνησης (και του Πενταγώνου), κατέκτησαν μια κυρίαρχη παγκόσμια θέση μέσω της πραγματικής καινοτομίας. Η Microsoft, το Facebook, η Apple, η Google και η Amazon αναδιαμόρφωσαν τον κόσμο. Η Microsoft, μία από τις πρώτες μεγάλες εταιρείες που αναδύθηκαν, προσπάθησε να σταματήσει αυτή την καινοτομία αγοράζοντας και/ή συντρίβοντας τους ανταγωνιστές της, αλλά οι ΗΠΑ την μήνυσαν το 1998 για παραβίαση των αντιμονοπωλιακών νόμων. Η κυβέρνηση Μπους διευθέτησε την υπόθεση, αποσύροντας την προσπάθεια διάσπασης της εταιρείας.
Αυτό που ακολούθησε ήταν μια διακομματική αγκαλιά προς τις μεγάλες τεχνολογικές εταιρείες: οι εποχές Μπους και Ομπάμα είδαν απεριόριστη ανάπτυξη και συγχωνεύσεις. Καθώς οι τεχνολογικές εταιρείες έβλεπαν μικρότερες επιχειρήσεις να καινοτομούν, τις αγόραζαν, τις κατέστρεφαν και απορροφούσαν μέρος του προσωπικού τους.
Ένα κίνημα κατά των μονοπωλίων άρχισε να αναδύεται, οδηγώντας σε αγωγές κατά του Facebook, της Amazon, της Google και της Apple την τελευταία δεκαετία. Η Λίνα Καν, ως πρόεδρος της Ομοσπονδιακής Επιτροπής Εμπορίου υπό τον πρώην Πρόεδρο Τζο Μπάιντεν, έγινε λαϊκή ηρωίδα, καθώς προειδοποιούσε ότι η απληστία και η συγκέντρωση δύναμης δεν έβλαπταν μόνο τους καταναλωτές και τους εργαζόμενους, αλλά τελικά θα έβλαπταν και τις ίδιες τις εταιρείες λόγω έλλειψης ανταγωνισμού. “Η ιστορία μας δείχνει ότι η διατήρηση ανοικτών, δίκαιων και ανταγωνιστικών αγορών, ιδίως σε σημεία τεχνολογικής αιχμής, είναι ένας βασικός τρόπος για να διασφαλιστεί ότι η Αμερική επωφελείται από την καινοτομία που αυτά τα εργαλεία μπορούν να καταλύσουν,” δήλωσε η Khan το 2023.
Τώρα, έχει γίνει σαφές ότι η «τάφρος» που δημιούργησαν οι ΗΠΑ για να προστατεύσουν τις εταιρείες τους από τον εσωτερικό ανταγωνισμό, τελικά επέτρεψε σε αυτές να ατροφήσουν. Κατάντησαν νωθρές και επαναπαύτηκαν μέσα στα κάστρα τους. Το βάρος τους μετατοπίστηκε από την τεχνολογική καινοτομία στις λογιστικές αλχημείες, μετατρέποντας πλασματικούς δείκτες σε οικονομικές αποτιμήσεις αποκομμένες από την πραγματικότητα.
Τώρα, η DeepSeek έχει αποκαλύψει την απάτη. Με ένα απειροελάχιστο κλάσμα των πόρων και χωρίς πλήρη πρόσβαση στην αμερικανική τεχνολογία ημιαγωγών, η κινεζική εταιρεία DeepSeek έχει ταπεινώσει τη Silicon Valley. Ενώ η OpenAI ξεκίνησε ως μη κερδοσκοπικός οργανισμός με σκοπό να κάνει την τεχνητή νοημοσύνη ευρέως διαθέσιμη, ο επικεφαλής της, Σαμ Άλτμαν, κατάφερε να τη μετατρέψει σε κερδοσκοπική εταιρεία και να την αποκόψει.
Κατά τραγική ειρωνεία, είναι η DeepSeek που τώρα εκπληρώνει την αρχική αποστολή της OpenAI, παρέχοντας ένα μοντέλο ανοιχτού κώδικα που απλώς λειτουργεί καλύτερα από οτιδήποτε άλλο υπάρχει στην αγορά. Παρακάτω παραθέτουμε ένα σύνολο ερωταπαντήσεων (FAQ) με λεπτομέρειες σχετικά με το DeepSeek.
Στο μεταξύ, στις Ηνωμένες Πολιτείες, ο Τραμπ γιορτάζει (ίσως υπερβάλλοντας) μια επένδυση ύψους 500 δισεκατομμυρίων δολαρίων στο Τέξας για την ενίσχυση της υπολογιστικής ισχύος AI, η οποία φαίνεται να έχει καταστεί παρωχημένη – ή τουλάχιστον πολύ λιγότερο χρήσιμη – χάρη στην καινοτομία του DeepSeek. Παράλληλα, ο Τραμπ στελεχώνει την κυβέρνησή του με υποστηρικτές των κρυπτονομισμάτων (crypto bros), τεχνολογικούς μεγιστάνες που αρνούνται να αποχωρήσουν από τα συμφέροντά τους και μάλιστα λάνσαρε τη δική του απάτη-κρυπτονόμισμα. Οι ανώτεροι τεχνολογικοί του σύμβουλοι, όπως ο Ίλον Μασκ, έχουν εκτεταμένες εμπορικές σχέσεις με την Κίνα. Δεν χρειάζεται να ταλαιπωρηθεί πολύ κανείς για να δει ποια χώρα πρόκειται να κερδίσει αυτή τη μάχη.
Το κοινωνικό συμβόλαιο μεταξύ της αμερικανικής κυβέρνησης και της Silicon Valley – στο οποίο οι Αμερικανοί πολίτες έγιναν ακούσια μέρη – ήταν απλό: Θα επιτρέπαμε σε μια χούφτα τεχνολογικών επιχειρηματιών (tech bros) να γίνουν ασύλληπτα πλούσιοι, με αντάλλαγμα να χτίσουν μια τεχνολογική βιομηχανία που θα διατηρούσε την παγκόσμια κυριαρχία των ΗΠΑ. Αντί γι’ αυτό, οι επιχειρηματίες αυτοί παραβίασαν τη συμφωνία. Πήραν τα χρήματα, αλλά αντί να συνεχίσουν να καινοτομούν και να ανταγωνίζονται, δημιούργησαν μονοπώλια για να αποκλείσουν τον ανταγωνισμό – επιστρατεύοντας μέχρι και τη βοήθεια των αμερικανικών κρατικών υπηρεσιών ασφαλείας για να εμποδίσουν την Κίνα να έχει πρόσβαση στην τεχνολογία μας. Όμως, δεν μπορούσαν να αποφύγουν τον ανταγωνισμό για πάντα. Η Λίνα Καν είχε δίκιο. Και τώρα φτάσαμε εδώ.
Οι επιπτώσεις θα είναι τεράστιες εάν η μεταφορά πλούτου από τις ΗΠΑ στην Κίνα συνεχιστεί με τον ίδιο ρυθμό. Είναι κοινότοπο να λέμε ότι οι περισσότεροι άνθρωποι δεν κατέχουν μεμονωμένες μετοχές, αλλά αυτό υποτιμά την έκθεση που όλοι έχουμε σε αυτή την απάτη. Βρίσκεται στους ατομικούς λογαριασμούς συνταξιοδότησής μας (IRA, 401k), ενώ η άνοδος αυτών των μετοχών αποτελούσε σχεδόν το σύνολο της ανάπτυξης της χρηματιστηριακής αγοράς τα τελευταία χρόνια. Και αν η Κίνα καταστεί ολοένα και περισσότερο ο τόπος όπου θα εργάζονται οι πιο φιλόδοξοι ερευνητές και προγραμματιστές, δεν είναι δύσκολο να φανταστούμε πού θα οδηγήσει αυτό.
Παρακάτω ακολουθεί μια ανάλυση για το DeepSeek που ζήτησα από τον ανταποκριτή μας, Waqas Ahmed, να ετοιμάσει.
Ε: Τι είναι το DeepSeek και γιατί προκαλεί πτώση στις μετοχές;
Α: Η κινεζική εταιρεία DeepSeek κυκλοφόρησε ένα μοντέλο AI εξίσου ισχυρό με οποιοδήποτε αμερικανικό αντίστοιχο και το έκανε ανοιχτού κώδικα. Αυτό άλλαξε ριζικά τα οικονομικά και πολιτικά δεδομένα της αναδυόμενης βιομηχανίας AI, την οποία μέχρι τώρα έλεγχε ένα ολιγοπώλιο αμερικανικών εταιρειών τεχνολογίας που προσπαθούσαν να καθιερώσουν τα Μεγάλα Γλωσσικά Μοντέλα (Large Language Models – LLMs) ως την καθοριστική τεχνολογική καινοτομία του αιώνα.
Υπάρχουν πολλές αναφορές ότι το DeepSeek κόστισε μόνο περίπου 6 εκατομμύρια δολάρια για να αναπτυχθεί, αν και το ποσό αυτό δεν περιλαμβάνει το κόστος έρευνας και ανάπτυξης. Παρά τους ελέγχους εξαγωγών, το DeepSeek κατάφερε να αξιοποιήσει σημαντικό αριθμό από τα προηγμένα τσιπ που οι ΗΠΑ προσπαθούσαν να κρατήσουν εκτός της Κίνας. Παρόλα αυτά, η έκπληξη για την αμερικανική βιομηχανία ήταν τεράστια.
Ε: Τι είναι τα Μεγάλα Γλωσσικά Μοντέλα (Large Language Models – LLMs) και πώς απογειώθηκαν;
Α: Ένα επιστημονικό άρθρο του 2017 με τίτλο “Attention is all you need” αποτέλεσε σημείο καμπής για τη βιομηχανία AI. Το άρθρο περιέγραφε μια μέθοδο δημιουργίας ενός μοντέλου μηχανικής μάθησης που μπορούσε να παράγει κείμενο παρόμοιο με το ανθρώπινο, χρησιμοποιώντας μια αρχιτεκτονική που ονομάζεται “transformers” (μετασχηματιστές). Αυτοί οι «μετασχηματιστές» βελτίωσαν σημαντικά μια κατηγορία μοντέλων που ονομάζονται Μεγάλα Γλωσσικά Μοντέλα (LLMs). Τα LLMs εκπαιδεύονται σε τεράστιες ποσότητες κειμένων – βιβλία, άρθρα, email, συνταγές, οτιδήποτε – και δημιουργούν μαθηματικές αναπαραστάσεις των σχέσεων μεταξύ δισεκατομμυρίων λέξεων και φράσεων.
Πριν από το 2017, τα LLM δεν ήταν πολύ χρήσιμα, αλλά οι «μετασχηματιστές» το άλλαξαν αυτό. Με την επεξεργασία μεγάλων ποσοτήτων κειμένου με τη χρήση της αρχιτεκτονικής των μετασχηματιστών, τα μοντέλα αυτά μπορούσαν πλέον να «μάθουν» τι σημαίνουν οι λέξεις σε διαφορετικά συμφραζόμενα και να ανιχνεύσουν αποχρώσεις που οι υπολογιστές δεν είχαν ποτέ πριν καταφέρει, επιτρέποντας στα μοντέλα αυτά να εξάγουν εξαιρετικά χρήσιμο κείμενο ως απάντηση σε μια προτροπή ή ερώτηση του χρήστη.
Ε: Πώς ξεκίνησε η μανία γύρω απ’ την τεχνητή νοημοσύνη;
Α: Η OpenAI έγινε η πρώτη αμερικανική εταιρεία που απέδειξε ότι αν πάρεις ένα στιγμιότυπο από όλο το γνωστό διαδίκτυο και όλα τα ψηφιοποιημένα βιβλία που υπάρχουν χωρίς να ανησυχείς πολύ για το νόμο περί πνευματικών δικαιωμάτων, μπορείς να δημιουργήσεις ένα μοντέλο τόσο καλό ώστε η παραγωγή του να είναι σχεδόν αδύνατο να διακριθεί από εκείνη ενός γραφειοκράτη της Ουάσιγκτον με μέτρια νοημοσύνη. Ωστόσο, το OpenAI έδειξε, ότι το μοντέλο του θα μπορούσε να εκπαιδευτεί ώστε να έχει εξειδίκευση σε διάφορους τομείς και να μπορεί να δώσει εμπεριστατωμένες απαντήσεις σε πολύ συγκεκριμένες ερωτήσεις. Το μοντέλο του πέρασε εξετάσεις κωδικοποίησης, δικηγορικές εξετάσεις και αποφοίτησε από σχολή διοίκησης επιχειρήσεων. Τα αποτελέσματα ήταν τόσο συγκλονιστικά που το OpenAI βγήκε και ισχυρίστηκε ότι αξίζει ένα δισεκατομμύριο δολάρια και ότι το μέλλον της ανθρωπότητας εξαρτάται από αυτό.
Ε: Ποια είναι η τρέχουσα κατάσταση της βιομηχανίας τεχνητής νοημοσύνης (Artificial Intelligence – AI);
Α: Η OpenAI, που ανήκει εν μέρει στη Microsoft, ήταν η πρώτη που κυκλοφόρησε ένα σημαντικό LLM ως προϊόν, το ChatGPT τον Νοέμβριο του 2022. Λίγο αργότερα, η Meta κυκλοφόρησε το δικό της μοντέλο, LLaMa, και η Google κυκλοφόρησε το Gemini. Και οι τρεις εταιρείες είχαν τεράστιες ποσότητες κειμένου για να εκπαιδεύσουν τα μοντέλα τους, αλλά ένα LLM χρειάζεται ένα άλλο κρίσιμο συστατικό: υπολογιστική ισχύ για να επεξεργαστεί αυτό το κείμενο και στη συνέχεια να παράγει απαντήσεις σε ερωτήματα χρηστών. Η κορυφαία εταιρεία που κατασκευάζει τις υπολογιστικές μηχανές είναι η Nvidia, οι μετοχές της οποίας αυξήθηκαν εκθετικά ως απάντηση όταν ακολούθησε πόλεμος LLM με επικεφαλής τους OpenAI/Microsoft, Google και Meta.
Οι υπολογιστικές μηχανές ονομάζονται GPUs-Graphic Processing Units. Αρχικά είχαν εφευρεθεί για την επεξεργασία γραφικών υπολογιστών για παιχνίδια, όπως η απόδοση τρισδιάστατων μοντέλων. Αργότερα έγιναν δημοφιλείς επειδή οι δυνατότητες παράλληλης επεξεργασίας τους τις καθιστούσαν ιδανικές για την εξόρυξη κρυπτονομισμάτων. Τώρα, αποδεικνύεται ότι είναι επίσης εξαιρετικές στην επεξεργασία δεδομένων τεχνητής νοημοσύνης για παρόμοιους λόγους. Η Nvidia έχει ουσιαστικά περιέλθει σε μια αλματώδη ανάπτυξη, καθώς διαφορετικές αγορές ανακαλύπτουν νέες χρήσεις για το προϊόν της.
Τα τελευταία χρόνια, η Meta, η Google, η Microsoft και η OpenAI κατάφεραν να συγκεντρώσουν εκατοντάδες χιλιάδες από τις πιο προηγμένες GPU και να τύχουν προνομιακής μεταχείρισης τόσο από την Nvidia όσο και από τον προμηθευτή της, τον παγκόσμιο πρωτογενή κατασκευαστή ημιαγωγών TSMC.
Η αμερικανική βιομηχανία τεχνολογίας έχει κάνει σημαντικά βήματα για να ευθυγραμμιστεί γύρω από την τεχνητή νοημοσύνη. Οι εταιρείες εξαγοράζουν νεοφυείς επιχειρήσεις, προσλαμβάνουν κορυφαίους ερευνητές ΤΝ και διοχετεύουν πόρους για την ανάπτυξη των ιδιόκτητων πρωτογενών μοντέλων ΤΝ τους (που ονομάζονται θεμελιώδη μοντέλα), δημιουργώντας μια ροή επενδύσεων στην ΤΝ και σε συναφείς τεχνολογίες, όπως η υπολογιστική νέφους, η προηγμένη κατασκευή τσιπ και η υποδομή δεδομένων. Όλα αυτά είναι μια προσπάθεια να εξασφαλίσουν την κυριαρχία σε αυτό που ισχυρίζονται ότι είναι το επόμενο σύνορο της τεχνολογικής καινοτομίας.
Ε: Πώς εμπλέκεται η Κίνα;
Α: Στο πλαίσιο της ευρύτερης προσπάθειάς της να περιορίσει την Κίνα, η κυβέρνηση των ΗΠΑ έχει αναλάβει την αποστολή να εμποδίσει τις κινεζικές εταιρείες να γίνουν ηγέτες σε διάφορους τομείς της τεχνολογίας. Το έχει κάνει αυτό ασκώντας έλεγχο στις παγκόσμιες αλυσίδες εφοδιασμού, προστατεύοντας έτσι τις αμερικανικές εταιρείες τεχνολογίας από τον ανταγωνισμό. Οι ΗΠΑ εμπόδισαν την είσοδο της Huawei στις Ηνωμένες Πολιτείες ακριβώς τη στιγμή που ξεπερνούσε την Apple για να γίνει ο δεύτερος μεγαλύτερος κατασκευαστής smartphone στον κόσμο· εμπόδισαν τις ευρωπαϊκές χώρες να εγκαταστήσουν υποδομές 5G που κατασκευάζει η Huawei, όταν ήταν σαφώς πιο οικονομικές· και πιο πρόσφατα, πέρασαν νομοθεσία για την απαγόρευση του TikTok, μιας κινεζικής εφαρμογής μέσων κοινωνικής δικτύωσης που είχε γίνει μαζικά δημοφιλής στις Ηνωμένες Πολιτείες και της οποίας τον αλγόριθμο συστάσεων καμία αμερικανική εφαρμογή μέσων κοινωνικής δικτύωσης δεν είχε καταφέρει να ξεπεράσει.
Ο ισχυρισμός των ΗΠΑ ότι η Huawei και άλλες κινεζικές εταιρείες τεχνολογίας είναι άρρηκτα συνδεδεμένες με τη γεωπολιτική στρατηγική της Κίνας και θέτουν τις δυτικές εταιρείες και τους ανθρώπους σε αυξημένο κίνδυνο παρακολούθησης και εταιρικής κατασκοπείας είναι, φυσικά, θεμελιωμένος στην πραγματικότητα. Η DeepSeek δεν κρύβει το πόσα δεδομένα συλλέγει στην πλατφόρμα της, συμπεριλαμβανομένων ακόμη και των πληκτρολογήσεών σας:
Συλλέγουμε ορισμένες πληροφορίες σχετικά με τη συσκευή και τη σύνδεση δικτύου όταν έχετε πρόσβαση στην Υπηρεσία. Αυτές οι πληροφορίες περιλαμβάνουν το μοντέλο της συσκευής σας, το λειτουργικό σας σύστημα, τα μοτίβα ή τους ρυθμούς πληκτρολόγησης, τη διεύθυνση IP και τη γλώσσα του συστήματος. Συλλέγουμε επίσης πληροφορίες σχετικά με την υπηρεσία, διαγνωστικές πληροφορίες και πληροφορίες απόδοσης, συμπεριλαμβανομένων αναφορών σφαλμάτων και αρχείων καταγραφής επιδόσεων. Σας εκχωρούμε αυτόματα ένα αναγνωριστικό συσκευής και ένα αναγνωριστικό χρήστη. Όταν συνδέεστε από πολλές συσκευές, χρησιμοποιούμε πληροφορίες όπως το αναγνωριστικό συσκευής και το αναγνωριστικό χρήστη για να αναγνωρίζουμε τη δραστηριότητά σας σε όλες τις συσκευές, ώστε να σας προσφέρουμε μια απρόσκοπτη εμπειρία σύνδεσης και για λόγους ασφαλείας.
Ωστόσο, επειδή το DeepSeek είναι ανοιχτού κώδικα και μπορεί να εκτελεστεί τοπικά σε ξεχωριστή συσκευή, η αδιάκριτη ματιά του προέδρου Xi Jinping μπορούν να αποτραπεί.
Η διατήρηση της παγκόσμιας τεχνολογικής κυριαρχίας είναι μία από τις βασικές ανησυχίες που έχουν επανειλημμένα επικαλεστεί οι υπεύθυνοι χάραξης πολιτικής των ΗΠΑ και έχουν προσδιορίσει την Τεχνητή Νοημοσύνη ως κρίσιμη τεχνολογία για τη διατήρηση αυτής της κυριαρχίας. Το 2018, όταν η αμερικανική κυβέρνηση βρισκόταν στη διαδικασία απαγόρευσης της Huawei, συνειδητοποίησε ότι θα έπρεπε να κάνει το ίδιο και με τις μεταγενέστερες τεχνολογίες, όπως τα τσιπ ημιαγωγών, το κύριο συστατικό που χρησιμοποιείται στις CPU και τις GPU. Η σοβαρή έλλειψη τσιπ λόγω των διαταραχών της παγκόσμιας αλυσίδας εφοδιασμού κατά τη διάρκεια του Covid-19 έδειξε ότι τα προηγμένα τσιπ αποτελούν σημαντικό κόμβο ελέγχου της παγκόσμιας αλυσίδας εφοδιασμού και σπάνιο πόρο. Μέχρι το 2022 η κυβέρνηση Μπάιντεν είχε επιβάλει εκτεταμένες κυρώσεις στην Κίνα, σταματώντας την εξαγωγή αυτών των τσιπ στη χώρα και εμποδίζοντας τις κινεζικές εταιρείες τεχνητής νοημοσύνης να έχουν πρόσβαση στις πιο πρόσφατες και αποδοτικές GPU. Ταυτόχρονα, πέρασε τον νόμο CHIPS, επιδοτώντας την εθνική παραγωγή ημιαγωγών με πάνω από 50 δισεκατομμύρια δολάρια.
Ε: Γιατί όλοι ξαφνικά ασχολούνται τόσο πολύ με την τεχνητή νοημοσύνη;
Α: Το φρενήρες μάρκετινγκ και το επίπεδο προώθησης από την αμερικανική βιομηχανία τεχνητής νοημοσύνης έχει προκαλέσει ένα είδος φρίκης στους λιγότερο τεχνικά καταρτισμένους κυβερνητικούς υπεύθυνους χάραξης πολιτικής. Πολλοί γνώστες της βιομηχανίας ισχυρίστηκαν ότι η πρόοδος των LLM θα μπορούσε σύντομα να οδηγήσει στη δημιουργία της Γενικής Τεχνητής Νοημοσύνης (ΓΤΝ / Artificial General Intelligence – AGI), ουσιαστικά ενός υπολογιστή που σκέφτεται σαν άνθρωπος και είναι καλός σε πολλές διαφορετικές εργασίες. Ορισμένοι έχουν ήδη κρούσει τον κώδωνα του κινδύνου ότι μπορεί να γίνει κακός και να αποκτήσει συνείδηση. Αλλά ακόμη και οι επικριτές της έχουν συμφωνήσει ότι οι LLM είναι μια τεχνολογία που θα αλλάξει το παιχνίδι και θα αλλάξει ριζικά τον τρόπο με τον οποίο αλληλεπιδρούμε με τους υπολογιστές.
Ε: Γιατί είναι τόσο θυμωμένοι οι τεχνολογικοί επιχειρηματίες (tech bros);
Α: Οι μεγάλες εταιρείες τεχνολογίας έχουν επίσης πει στην κυβέρνηση και τους επενδυτές ότι η δημιουργία τεχνητής νοημοσύνης είναι πάρα πολύ ακριβή. Την πρώτη εβδομάδα της θητείας του, ο πρόεδρος των ΗΠΑ Ντόναλντ Τραμπ ανακοίνωσε επενδύσεις 500 δισεκατομμυρίων δολαρίων στον ιδιωτικό τομέα στην τεχνητή νοημοσύνη στο πλαίσιο ενός έργου που ονομάζεται Stargate – μια συνεργασία μεταξύ της OpenAI, της Softbank και της Oracle.
Στο παρελθόν ο ιδρυτής του OpenAI Σαμ Άλτμαν είχε υποστηρίξει ότι θα χρειαζόταν έως και 7 τρισεκατομμύρια δολάρια για να δημιουργήσει την τεχνητή νοημοσύνη των ονείρων του και συγκέντρωσε επενδύσεις χρησιμοποιώντας αυτόν τον στόχο. Για καλύτερη αντίληψη του μεγέθους, κανένας άνθρωπος σε ολόκληρη την ιστορία του κόσμου δεν έχει ξοδέψει ποτέ αυτό το ποσό χρημάτων για ένα και μόνο πράγμα. Αλλά το κρυφό μήνυμα φαίνεται να είναι αυτό: πρόκειται για μια μαγική τεχνολογία και μια δύναμη πιο ισχυρή από οποιαδήποτε άλλη που έχει δει ποτέ ο κόσμος, χρειαζόμαστε αστρονομικά ποσά για να την κατασκευάσουμε και χρειαζόμαστε την προστασία της αμερικανικής κυβέρνησης ενώ το κάνουμε.
Και μετά ήρθε μια μικροσκοπική κινεζική εταιρεία που έσκασε αυτή τη φούσκα με το μικρό σχέδιό της. Χρησιμοποίησε υπολογιστική ισχύ αξίας 5,5 εκατομμυρίων δολαρίων για να το κάνει αυτό, χρησιμοποιώντας μόνο 2.048 H800 GPUs της Nvidia που είχε η κινεζική εταιρεία επειδή δεν μπορούσε να αγοράσει τις ανώτερες GPU H100 ή A100 που οι αμερικανικές εταιρείες συγκεντρώνουν κατά εκατοντάδες χιλιάδες.
Για πληρέστερη εικόνα, η Meta AI είχε θέσει ως στόχο την κατοχή ενός cluster 600.000 H100 GPUs μέχρι το τέλος του 2024. Ο Elon Musk διαθέτει 100.000 GPUs, ενώ η OpenAI εκπαίδευσε το μοντέλο GPT-4 σε περίπου 25.000 GPUs A100. Εν τω μεταξύ, η DeepSeek ιδρύθηκε από τον κινέζο διαχειριστή hedge fund High Flyer που ήθελε να αξιοποιήσει τη δική του συστοιχία GPUs των 10.000 H800, σύμφωνα με τα κινεζικά μέσα ενημέρωσης.
Η DeepSeek, σύμφωνα με τις φήμες, προσέλαβε μια πραγματικά νεαρή ομάδα και την ώθησε να καινοτομήσει και να αξιοποιήσει στο έπακρο το περιορισμένο υλικό της. Κυκλοφόρησαν το μοντέλο DeepSeek-V3 τον περασμένο μήνα, ένα μοντέλο που ξεπερνά το OpenAI GPT-4 και όλα τα άλλα μοντέλα του κλάδου στα περισσότερα benchmarks (τεστ επιδόσεων). Δεν υπάρχει κάποια σημαντική εξέλιξη στη βασική τεχνολογία, απλώς χρησιμοποιούν το υλικό αποτελεσματικά και εκπαιδεύουν καλύτερα το μοντέλο τους.
Οι τεχνολογικοί επιχειρηματίες (tech bros) έχουν ξινίσει επειδή αυτό βλάπτει την εικόνα τους. Αυτό που περιπλέκει ακόμη περισσότερο τα πράγματα είναι ότι η DeepSeek έχει κυκλοφορήσει το μοντέλο και τις μεθόδους εκπαίδευσής της ως λογισμικό ανοικτού κώδικα, πράγμα που σημαίνει ότι ο καθένας μπορεί να δει πώς έφτιαξαν το μοντέλο τους και να αναπαράγει τη διαδικασία. Αυτό σημαίνει επίσης ότι οι χρήστες μπορούν να εγκαταστήσουν τα μοντέλα DeepSeek στα δικά τους μηχανήματα και να τα τρέξουν στις δικές τους GPUs, όπου φαίνεται να έχουν πολύ καλή απόδοση.
Ε: Πώς αντιδρούν οι tech bros;
Α: Αν και υπήρξε μια σημαντική μεταστροφή του κλίματος προς την κατεύθυνση του «ήρθε το τέλος», ορισμένοι εξακολουθούν να υποστηρίζουν ότι «τώρα είναι η στιγμή μας» και ότι αυτή είναι «μια στιγμή ανάλογη του Σπούτνικ για την Τεχνητή Νοημοσύνη». Άλλοι δεν ήταν τόσο μεγαλόψυχοι.
«Το deepseek είναι μια κρατική ψυχολογική επιχείρηση του κινεζικού κομμουνιστικού κόμματος + οικονομικός πόλεμος για να καταστήσει την αμερικανική τεχνητή νοημοσύνη ασύμφορη. Προσποιούνται ότι το κόστος ήταν χαμηλό για να δικαιολογήσουν τον καθορισμό χαμηλών τιμών και ελπίζουν ότι όλοι θα στραφούν σε αυτό, βλάπτουν την ανταγωνιστικότητα του AI στις ΗΠΑ, μην τσιμπήσετε το δόλωμα», έγραψε στο Twitter ο Neal Khosla, γιος του επενδυτή Vinod Khosla. Η Khosla Ventures έχει συγκεντρώσει περισσότερα από 400 εκατομμύρια δολάρια για την OpenAI και είναι ένας από τους μεγαλύτερους επενδυτές στην εταιρεία.
«Η DeepSeek είναι μια κλήση αφύπνισης για την Αμερική», δήλωσε ο Alexandr Wang, ιδρυτής της εταιρείας τεχνητής νοημοσύνης «Scale AI», και κάποιος που έχει κατηγορήσει πιο συγκεκριμένα την DeepSeek ότι κρύβει μια μυστική κρυψώνα με 50.000 H100 GPUs.
«Οι κατηγορίες/εμμονές σχετικά με τη χρήση H100 από την DeepSeek ακούγονται σαν μια ομάδα πλούσιων παιδιών να ξεπεράστηκε από μια ομάδα φτωχών παιδιών, στα οποία δεν επιτρεπόταν καν να φορέσουν παπούτσια», έγραψε στο Twitter η Jen Zhu, επενδύτρια στο AI, “και τώρα τα πλούσια παιδιά απαιτούν έρευνα για το αν χρησιμοποιήθηκαν παπούτσια αντί να προπονηθούν σκληρότερα για να βελτιωθούν”.
Ε: Γιατί το χρηματιστήριο καταρρέει;
Α: Ενώ το DeepSeek v3 έχει κυκλοφορήσει εδώ και σχεδόν ένα μήνα, τα νέα αρχίζουν να φτάνουν στην αγορά μόλις τώρα. Οι μετοχές της Nvidia υποχώρησαν σχεδόν 15% πριν το άνοιγμα της αγοράς τη Δευτέρα, χάνοντας περίπου 420 δισεκατομμύρια δολάρια από την κεφαλαιοποίησή της και προκαλώντας μια αιματοχυσία σε όλες τις μετοχές ημιαγωγών που θα μπορούσε να διαγράψει 1 τρισεκατομμύριο δολάρια από το χρηματιστήριο σε μία μόνο ημέρα. Όταν κυκλοφόρησε στα τέλη Δεκεμβρίου, ο Andrej Karpathy, ένας σημαντικός επιστήμονας στον τομέα, σχολίασε την εκπληκτική αποτελεσματικότητά του, αλλά οι επιπτώσεις του να κυκλοφορήσει μια άγνωστη κινεζική εταιρεία ένα θεμελιώδες μοντέλο ανοιχτού κώδικα απογειώθηκαν μόνο όταν η Silicon Valley άρχισε να δοκιμάζει το DeepSeek στους προσωπικούς υπολογιστές της και το DeepSeek ανέβηκε στην πρώτη θέση των κατεβασμένων εφαρμογών.
Κατά τραγική ειρωνεία, το ότι τα tech bros φρίκαραν και επέδειξαν πρωτόγνωρα επίπεδα εμμονικής άρνησης συμβάλλει στην ζωτικότητα του DeepSeek.
Μετάφραση: Γιώργος Σωτήρχος
Επιμέλεια: Antapocrisis
Πηγή: https://www.dropsitenews.com/p/deepseek-openai-lina-khan-sam-altman

Ryan Grim – Ρεπόρτερ του Intercept, συμπαρουσιαστής του Counter Points, παρουσιαστής του Deconstructed podcast, συγγραφέας των “We’ve Got People” και “This Is Your Country On Drugs”, δημοσιογράφος στο Drop Site News
Waqas Ahmed – Δημοσιογράφος της δημοσιογραφικής ιστοσελίδας Drop Site News