DeepSeek: Κυκλοφόρησε αναβαθμισμένο μοντέλο τεχνητής νοημοσύνης V3.1

Το V3.1 της DeepSeek δεν είναι ατό που περίμεναν οι επαΐοντες της βιομηχανίας

Η κινεζική νεοσύστατη εταιρεία τεχνητής νοημοσύνης DeepSeek κυκλοφόρησε την Πέμπτη το DeepSeek-V3.1, ένα αναβαθμισμένο μοντέλο με υβριδική δομή συμπερασμάτων και ταχύτερη ταχύτητα «σκέψης», ανέφερε η εταιρεία σε ανακοίνωση που δημοσιεύτηκε στο WeChat.

Η εταιρεία θα προσαρμόσει επίσης το κόστος χρήσης του API του μοντέλου, μιας πλατφόρμας που επιτρέπει στους προγραμματιστές άλλων εφαρμογών και προϊόντων ιστού να ενσωματώνουν τα μοντέλα AI της, ξεκινώντας από τις 6 Σεπτεμβρίου, σύμφωνα με την ανακοίνωση.

Κάτι κατώτερο των προσδοκιών

Αλλά η αναβάθμιση που κυκλοφόρησε η DeepSeek, η V3.1, δεν είναι όλα όσα περίμενε η ΑΙ κοινότητα, καθώς παρέλειψε εμφανώς οποιαδήποτε ετικέτα R1 από το chatbot της, οδηγώντας σε εικασίες σχετικά με την κατάσταση του υποσχόμενου μοντέλου R2.

Η έκδοση V3.1 περιλαμβάνει βελτιώσεις όπως ένα διευρυμένο παράθυρο περιβάλλοντος 128K token για τη διατήρηση περισσότερων πληροφοριών ανά αλληλεπίδραση, αλλά στερείται σημαντικής καινοτομίας πέρα ​​από αυτό. Οι παρατηρητές σημειώνουν ότι η απουσία του R1 υποδηλώνει ότι η DeepSeek μπορεί να αναδιαμορφώνει το χρονοδιάγραμμά της ή να αλλάζει εστίαση.

Οι παρατηρητές του κλάδου επισημαίνουν το κενό που άφησε αυτή η ενημέρωση, ειδικά υπό το φως των καθυστερήσεων που αναφέρθηκαν για το μοντέλο R2, το οποίο έχει αντιμετωπίσει τεχνικά προβλήματα λόγω προβλημάτων υλικού και προκλήσεων εκπαίδευσης με εγχώρια τσιπ. Οι ανταγωνιστές κερδίζουν πλέον έδαφος ως αποτέλεσμα.

Δεδομένου ότι δεν υπάρχει επίσημη δήλωση από την DeepSeek και μιας πιο λιτής από το συνηθισμένο ανακοίνωσης, που παραδόθηκε μόνο σε μια ομάδα χρηστών του WeChat, οι αναλυτές αμφισβητούν εάν η εταιρεία επανεξετάζει την αλληλουχία προϊόντων της ή αποκρύπτει καθυστερήσεις στην κυκλοφορία του συλλογιστικού μοντέλου R2 επόμενης γενιάς.

Πηγή: ot.gr

Διαβάστε επίσης: Αυξάνονται τα περιστατικά ψύχωσης της τεχνητής νοημοσύνης

ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΑ