Η κινεζική εταιρεία τεχνολογίας Alibaba κυκλοφόρησε την Τετάρτη (29/01) μια νέα έκδοση του μοντέλου τεχνητής νοημοσύνης, το Qwen 2.5, το οποιο, όπως ισχυρίζεται ξεπερνά σε δυνατότητες τον ανταγωνιστή του DeepSeek-V3.
Όπως αναφέρει το Reuters, η κυκλοφορία του Qwen 2.5-Max την πρώτη ημέρα του κινεζικού νέου έτους, όταν οι περισσότεροι Κινέζοι δεν δουλεύουν, υποδηλώνει την πίεση που άσκησε και στο εσωτερικό της Κίνας, η μετεωρική άνοδος της νεοσύστατης DeepSeek, τις τελευταίες τρεις εβδομάδες.
«Το Qwen 2.5-Max ξεπερνάει σχεδόν σε όλα τα GPT-4o, DeepSeek-V3 και Llama-3.1-405B», αναφέρει η Alibaba σε ανακοίνωση που δημοσίευσε στον επίσημο λογαριασμό της στο WeChat.
Η κυκλοφορία του βοηθού τεχνητής νοημοσύνης της DeepSeek στις 10 Ιανουαρίου, καθώς και η κυκλοφορία του μοντέλου R1 στις 20 Ιανουαρίου, έχει σοκάρει τη Σίλικον Βάλεϊ και έχει προκαλέσει πτώση των μετοχών τεχνολογίας.
Η τεράστια επιτυχία της DeepSeek ανάγκασε τους εγχώριους ανταγωνιστές της να αναβαθμίσουν τα δικά τους μοντέλα τεχνητής νοημοσύνης. Δύο ημέρες μετά την κυκλοφορία του DeepSeek-R1, η ιδιοκτήτρια εταιρεία του TikTok, ByteDance, κυκλοφόρησε μια ενημέρωση για το κορυφαίο μοντέλο τεχνητής νοημοσύνης της, το οποίο, όπως ισχυρίστηκε, ξεπερνά το o1 της OpenAI.
Ο προκάτοχος του μοντέλου V3 της DeepSeek, το DeepSeek-V2, πυροδότησε πόλεμο τιμών των μοντέλων τεχνητής νοημοσύνης στην Κίνα μετά την κυκλοφορία του τον περασμένο Μάιο. Το γεγονός ότι το DeepSeek-V2 ήταν ανοιχτού κώδικα και εξαρετικά φθηνό ανάγκασε τη μονάδα cloud της Alibaba να ανακοινώσει μείωση τιμών έως και 97% σε γκάμα μοντέλων.
Ενώ μεγάλες κινεζικές εταιρείες τεχνολογίας όπως η Alibaba έχουν εκατοντάδες χιλιάδες υπαλλήλους, η DeepSeek λειτουργεί σαν ερευνητικό εργαστήριο, στελεχωμένο κυρίως από νέους πτυχιούχους και διδακτορικούς φοιτητές από κορυφαία κινεζικά πανεπιστήμια.
ΠΗΓΗ: Reuters
www.ertnews.gr