Λιανγκ Γουένφενγκ, ο 40χρονος ιδρυτής της DeepSeek που εκθρόνισε το ChatGPT

04/02/2025 14:22

Του ΝΙΚΟΥ ΒΑΣΙΛΕΙΑΔΗ

Όταν το ChatGPT εισέβαλε στον κόσμο της τεχνητής νοημοσύνης (AI), ακολούθησε ένα αναπόφευκτο ερώτημα: μήπως θα ήταν πρόβλημα για την Κίνα, τον μεγαλύτερο τεχνολογικό αντίπαλο της Αμερικής;

Δύο χρόνια μετά, ένα νέο μοντέλο τεχνητής νοημοσύνης από την Κίνα αντιστρέφει αυτό το ερώτημα: μπορούν οι ΗΠΑ να σταματήσουν την κινεζική καινοτομία;

Για λίγο φάνηκε πως το Πεκίνο αδυνατούσε να απαντήσει στο ChatGPT, το οποίο δεν είναι διαθέσιμο στην Κίνα, και η Ουάσιγκτον ήταν σίγουρη ότι τουλάχιστον όσον αφορά την τεχνολογική εξέλιξη βρισκόταν πολύ μπροστά από τους Κινέζους ανταγωνιστές της, και ήθελε να το διατηρήσει έτσι, με την κυβέρνηση Μπάιντεν να αυξάνει τους περιορισμούς που απαγορεύουν την εξαγωγή προηγμένων τσιπ και τεχνολογίας στην Κίνα.

Αυτός είναι ο λόγος για τον οποίο η κυκλοφορία του DeepSeek ήταν μια τεράστια έκπληξη για τη Silicon Valley και τον κόσμο. Η κινεζική εταιρεία ισχυρίζεται ότι το ισχυρό της μοντέλο είναι πολύ φθηνότερο από τα δισεκατομμύρια που έχουν ξοδέψει οι αμερικανικές εταιρείες για την τεχνητή νοημοσύνη, και λέει αλήθεια. Πώς λοιπόν μια ελάχιστα γνωστή εταιρεία -της οποίας ο ιδρυτής χαιρετίζεται στα κινεζικά μέσα κοινωνικής δικτύωσης ως «ήρωας AI»- το κατάφερε αυτό;

Η πρόκληση

Όταν οι ΗΠΑ απαγόρευσαν στους κορυφαίους κατασκευαστές τσιπ στον κόσμο, όπως η Nvidia, να πουλήσουν προηγμένη τεχνολογία στην Κίνα, ήταν σίγουρα ένα πλήγμα. Αυτά τα τσιπ είναι απαραίτητα για τη δημιουργία ισχυρών μοντέλων τεχνητής νοημοσύνης που μπορούν να εκτελέσουν μια σειρά από εργασίες, από την απάντηση βασικών ερωτημάτων έως την επίλυση σύνθετων μαθηματικών προβλημάτων. Ο ιδρυτής του DeepSeek, Λιανγκ Γουένφενγκ, περιέγραψε την απαγόρευση εξαγωγής των αμερικανικών τσιπ ως την «κύρια πρόκλησή» τους σε συνεντεύξεις στα μέσα ενημέρωσης.

Όμως πολύ πριν από την απαγόρευση, το DeepSeek είχε φροντίσει να αποκτήσει ένα «σημαντικό απόθεμα» τσιπ Nvidia A100 -οι εκτιμήσεις κυμαίνονται από 10.000 έως 50.000- σύμφωνα με το MIT Technology Review.

Τα κορυφαία μοντέλα τεχνητής νοημοσύνης στη Δύση χρησιμοποιούν περίπου 16.000 εξειδικευμένα τσιπ. Ωστόσο, η DeepSeek εκπαίδευσε το δικό της μοντέλο τεχνητής νοημοσύνης χρησιμοποιώντας 2.000 τέτοια τσιπ και χιλιάδες άλλα τσιπ χαμηλότερης ποιότητας – κάτι που κάνει το προϊόν της φθηνότερο. Η DeepSeek ισχυρίζεται ότι εκπαίδευσε το μοντέλο r1, με το οποίο δουλεύει το Chatbot της, για λιγότερο από 6 εκατ. δολάρια, ένα πόσο δραματικά χαμηλότερο από τα πολλά δισ. που έχουν επενδύσει οι δυτικές εταιρείες σε αντίστοιχα μοντέλα.

Το σοκ για τη Δύση ήταν μεγάλο. Μάλιστα κάποιοι, συμπεριλαμβανομένου του Αμερικανού δισεκατομμυριούχου τεχνολογίας Έλον Μασκ, αμφισβήτησαν αυτόν τον ισχυρισμό, υποστηρίζοντας ότι η κινεζική εταιρεία δεν μπορεί να αποκαλύψει πόσα από τα προηγμένα τσιπ χρησιμοποίησε πραγματικά λόγω των περιορισμών. Ωστόσο, όλοι, και ιδιαίτερα οι ειδικοί, λένε ότι η απαγόρευση της Ουάσιγκτον έφερε προκλήσεις και ευκαιρίες στην κινεζική βιομηχανία τεχνητής νοημοσύνης.

Ανάγκασε τις κινεζικές εταιρείες, όπως η DeepSeek, να καινοτομήσουν, ώστε να μπορούν να κάνουν περισσότερα με λιγότερα. Οι περιορισμοί πάντα θέτουν προκλήσεις, και στην περίπτωση της DeepSeek τόνωσαν τη δημιουργικότητα και την ανθεκτικότητα, ευθυγραμμίζοντάς την με τους ευρύτερους στόχους πολιτικής της Κίνας για την επίτευξη τεχνολογικής ανεξαρτησίας.

Η δεύτερη μεγαλύτερη οικονομία στον κόσμο, η Κίνα, έχει επενδύσει πολλά στη μεγάλη τεχνολογία -από τις μπαταρίες που τροφοδοτούν ηλεκτρικά οχήματα και ηλιακούς συλλέκτες μέχρι την τεχνητή νοημοσύνη- μετατρέποντας τη χώρα σε τεχνολογική υπερδύναμη, μια φιλοδοξία του προέδρου Σι Τζινπίνγκ.

Η κυκλοφορία του νέου μοντέλου του DeepSeek στις 20 Ιανουαρίου, όταν ο Ντόναλντ Τραμπ ορκιζόταν πρόεδρος των ΗΠΑ, ήταν η ξεκάθαρη πρόκληση-απάντηση της Κίνας στον μεγαλοϊδεατισμό του Ντόναλντ Τραμπ, και στην ανακοίνωσή του για επενδύσεις έως και 500 δις. δολάρια σε υποδομές για την τεχνητή νοημοσύνη, με την επιχείρηση Stargate.

Ο χρόνος και ο τρόπος που επέλεξαν να απαντήσουν οι Κινέζοι φανερώνει ότι οι έλεγχοι των εξαγωγών δεν λειτουργούν και πως η Αμερική δεν είναι ο μοναδικός παγκόσμιος ηγέτης στην τεχνητή νοημοσύνη. Έχει αντίπαλο που τη συναγωνίζεται στα ίσα, με την κινεζική κυβέρνηση να έχει δώσει κίνητρα για την ανάπτυξη μοντέλων τεχνητής νοημοσύνης, προσφέροντας υποτροφίες και επιχορηγήσεις έρευνας και ενθαρρύνοντας συνεργασίες μεταξύ πανεπιστημίων και βιομηχανίας.

Το Κινεζικό Εθνικό Εργαστήριο Μηχανικής για τη «Βαθιά Μάθηση» και άλλες πρωτοβουλίες που υποστηρίζονται από το κράτος έχουν βοηθήσει στην εκπαίδευση χιλιάδων ειδικών της τεχνητής νοημοσύνης και η Κίνα έχει πολλούς έξυπνους μηχανικούς να προσλάβει για να πετύχει τον σκοπό της.

Το ταλέντο

Ας δούμε για παράδειγμα την ομάδα του DeepSeek. Τα κινεζικά μέσα ενημέρωσης λένε ότι αποτελείται από λιγότερο από 140 άτομα, τα περισσότερα από τα οποία είναι αυτά που το Διαδίκτυο με περηφάνια έχει δηλώσει ως «εγχώρια ταλέντα» από ελίτ κινεζικών πανεπιστημίων, μια νέα γενιά που αντί να φιγουράρουν ως πολυεκατομμυριούχοι σνομπ που επιθυμούν να ελέγχουν τον κόσμο γύρω τους, δίνουν προτεραιότητα στη θεμελιώδη έρευνα και τη μακροπρόθεσμη τεχνολογική πρόοδο σε σχέση με τα γρήγορα κέρδη.

Τα κορυφαία πανεπιστήμια της Κίνας δημιουργούν μια ταχέως αναπτυσσόμενη δεξαμενή ταλέντων τεχνητής νοημοσύνης, όπου ακόμη και οι μάνατζερ είναι συχνά κάτω των 35 ετών, νέα παιδιά που, έχοντας μεγαλώσει κατά τη διάρκεια της ταχείας τεχνολογικής ανόδου της Κίνας, έχουν βαθιά κίνητρα ώστε να κατακτήσουν την αυτοδυναμία στην καινοτομία.

Ο ιδρυτής και διευθύνων σύμβουλος εξάλλου της DeepSeek, Λιανγκ Γουένφενγκ, είναι ένα τέτοιο παράδειγμα – ο 40χρονος μεγάλωσε στην επαρχία Γκουανγκντόνγκ, στη νότια Κίνα, όπου οι γονείς του εργάζονταν ως δάσκαλοι δημοτικού σχολείου, σύμφωνα με ένα τοπικό πρακτορείο. Σπούδασε Μηχανική Υπολογιστών σε προπτυχιακό και μεταπτυχιακό επίπεδο στο Πανεπιστήμιο Zhejiang στο Χανγκτσόου, ένα τεχνολογικό κέντρο στην ανατολική Κίνα όπου εδρεύει ο όμιλος Alibaba, ο κινεζικός γίγαντας του ηλεκτρονικού εμπορίου.

Το 2015, ο Λιανγκ ίδρυσε τη High-Flyer, ένα hedge fund που κάνει επενδύσεις με βάση τα μαθηματικά και την τεχνητή νοημοσύνη και το 2023 ίδρυσε την DeepSeek, μια εταιρεία με έδρα τη Χανγκζού. Σε ένα άρθρο άνθρωποι που τον γνωρίζουν λένε ότι μοιάζει «περισσότερο με geek (κομπιουτεράς) παρά με αφεντικό».

«Τα κριτήρια επιλογής μας ήταν πάντα το πάθος και η περιέργεια», είπε. «Η επιθυμία πολλών ανθρώπων να κάνουν έρευνα υπερβαίνει κατά πολύ την ανησυχία τους για τα χρήματα», υποστηρίζει ο Λιανγκ περιγράφοντας τι ψάχνει στους υποψήφιους υπαλλήλους.

Τα κινεζικά Μέσα τον περιγράφουν ως «τεχνικό ιδεαλιστή» – αφού επιμένει να διατηρεί το DeepSeek ως πλατφόρμα ανοιχτού κώδικα. Στην πραγματικότητα, οι ειδικοί πιστεύουν ότι αυτή ακριβώς η ακμάζουσα κουλτούρα ανοιχτού κώδικα επέτρεψε σε πολλές άλλες νέες νεοφυείς επιχειρήσεις να συγκεντρώσουν πόρους και να προχωρήσουν πιο γρήγορα.

Σε αντίθεση με τις μεγαλύτερες κινεζικές εταιρείες τεχνολογίας, η DeepSeek έδωσε προτεραιότητα στην έρευνα, η οποία επέτρεψε περισσότερους πειραματισμούς, σύμφωνα με ειδικούς και ανθρώπους που εργάζονταν στην εταιρεία. «Τα κορυφαία 50 ταλέντα σε αυτόν τον τομέα μπορεί να μη βρίσκονται στην Κίνα, αλλά μπορούμε να δημιουργήσουμε τέτοιους ανθρώπους εδώ», είχε δηλώσει ο Λιανγκ σε συνέντευξή του στο 36Kr, μια δημόσια εισηγμένη κινεζική εταιρεία πολυμέσων που εστιάζει στην τεχνολογία και στα οικονομικά νέα.

Αλλά οι ειδικοί αναρωτιούνται πόσο βαθύτερα μπορεί να πάει το DeepSeek στην ανάπτυξη της τεχνητής νοημοσύνης συνεχίζοντας να χρησιμοποιεί προηγμένα τσιπ για να εξακολουθήσει να βελτιώνει το μοντέλο. Πολλοί εκτιμούν ότι «οι νέοι περιορισμοί των ΗΠΑ ενδέχεται να περιορίσουν την πρόσβαση σε δεδομένα Αμερικανών χρηστών, επηρεάζοντας δυνητικά τον τρόπο με τον οποίο κινεζικά μοντέλα όπως το DeepSeek μπορούν να γίνουν παγκόσμια» και λένε ότι οι ΗΠΑ εξακολουθούν να έχουν ένα τεράστιο πλεονέκτημα, όπως, την τεράστια ποσότητα υπολογιστικών πόρων.

Αλλά, προς το παρόν, το DeepSeek απολαμβάνει τη δόξα που επάξια κέρδισε, εκθρονίζοντας το ChatGPT, για να γίνει η πιο δημοφιλής δωρεάν εφαρμογή στις ΗΠΑ και στο Ηνωμένο Βασίλειο στο App Store της Apple.

Οι νέοι ήρωες AI

Η ξαφνική φήμη του έκανε τον κ. Λιανγκ ορατό στα κοινωνικά μέσα της Κίνας, όπου τον χειροκροτούν ως έναν από τους «τρεις ήρωες της τεχνητής νοημοσύνης» από τη νότια επαρχία Γκουανγκντόνγκ, η οποία συνορεύει με το Χονγκ Κονγκ. Οι άλλοι δύο είναι ο Ζιλίνγκ Γιανγκ, κορυφαίος ειδικός στο Πανεπιστήμιο Tsinghua, και ο Κάιμινγκ Χε, ένας Κινέζος επιστήμονας υπολογιστών που ερευνά πρωτίστως την όραση υπολογιστών και τη βαθιά μάθηση, αναπληρωτής καθηγητής στο Ινστιτούτο Τεχνολογίας της Μασαχουσέτης και γνωστός ως ένας από τους δημιουργούς του υπολειπόμενου νευρωνικού δικτύου.

Το DeepSeek χαροποίησε το κινεζικό Διαδίκτυο ενόψει της Σεληνιακής Πρωτοχρονιάς, της μεγαλύτερης γιορτής της χώρας. Είναι καλά νέα για μια πολιορκημένη οικονομία και μια βιομηχανία τεχνολογίας που προετοιμάζεται για περαιτέρω δασμούς και την πιθανή πώληση της επιχείρησης της TikTok στις ΗΠΑ.

Ένα «μείγμα σοκ και ενθουσιασμού, ιδιαίτερα στην κοινότητα ανοιχτού κώδικα», είναι ο τρόπος με τον οποίο ο Ουέι Σαν, κύριος αναλυτής τεχνητής νοημοσύνης στην Counterpoint Research, περιέγραψε την αντίδραση της διεθνούς κοινότητας, αναγκάζοντας τον πρόεδρο των ΗΠΑ, Ντόναλντ Τραμπ, να ομολογήσει πως «θα πρέπει να είναι κάλεσμα αφύπνισης για τις βιομηχανίες μας ότι πρέπει να είμαστε απολύτως επικεντρωμένοι στον ανταγωνισμό για να κερδίσουμε», μετά τα ρίγη που προκάλεσε στη Wall Street και τη «βουτιά» που έκαναν οι μετοχές της Nvidia και της OpenAI.

Ο Λιανγκ εκφράζει την αισιοδοξία του για την ικανότητα της Κίνας να αμφισβητήσει αμερικανικούς γίγαντες όπως η OpenAI, δεν παραλείπει όμως να τονίζει ότι η χώρα πρέπει να παίρνει περισσότερες πρωτοβουλίες και να μεταβεί σταδιακά στο να γίνει ηγέτης της βιομηχανίας, αντί να συνεχίσει να ακολουθεί τα χνάρια των άλλων.

«Συχνά, λέμε ότι υπάρχει ένα χάσμα ενός ή δύο ετών μεταξύ της κινεζικής και της αμερικανικής τεχνητής νοημοσύνης, αλλά το πραγματικό χάσμα είναι μεταξύ της πρωτοτυπίας και της μίμησης. Αν αυτό δεν αλλάξει, η Κίνα θα είναι πάντα ακόλουθος», δηλώνει σε συνέντευξή του στο 36Kr ταράζοντας τα νερά στη Wall Street, η οποία τώρα ανησυχεί για το κατά πόσον η Κίνα είναι σε θέση να ηγηθεί της παγκόσμιας κούρσας εξέλιξης τεχνητής νοημοσύνης, στην οποία επί χρόνια κυριαρχούσαν αμερικανικές εταιρείες.

Οπως δημοσιεύθηκε στην εφημερίδα Μπαμ στο Ρεπορτάζ

ΣΧΕΤΙΚΑ

Λιανγκ Γουένφενγκ, ο 40χρονος ιδρυτής της DeepSeek που εκθρόνισε το ChatGPT

eXclusive

eTop