Η Google ανακάλυψε το μοντέλο Gemma AI, που βασίζεται σε τεχνολογίες κοινές στο chatbot Gemini

Η Google ανακοίνωσε τη δημοσίευση του Gemma, ενός μεγάλου μοντέλου γλώσσας μηχανικής εκμάθησης που δημιουργήθηκε χρησιμοποιώντας τεχνολογίες που χρησιμοποιούνται για την κατασκευή του μοντέλου chatbot Gemini, το οποίο επιχειρεί να ανταγωνιστεί το ChatGPT. Το μοντέλο είναι διαθέσιμο σε τέσσερις παραλλαγές, που καλύπτουν 2 και 7 δισεκατομμύρια παραμέτρους, σε βασικές και βελτιστοποιημένες προβολές διαλόγου. Οι επιλογές με 2 δισεκατομμύρια παραμέτρους είναι κατάλληλες για χρήση σε καταναλωτικές εφαρμογές και διαθέτουν αρκετή CPU για την επεξεργασία τους. Οι επιλογές με 7 δισεκατομμύρια παραμέτρους απαιτούν πιο ισχυρό υλικό και GPU ή TPU.

Μεταξύ των τομέων εφαρμογής του μοντέλου Gemma είναι η δημιουργία συστημάτων διαλόγου και εικονικών βοηθών, η δημιουργία κειμένου, η δημιουργία απαντήσεων σε ερωτήσεις που γίνονται σε φυσική γλώσσα, η περίληψη και γενίκευση του περιεχομένου, η επεξήγηση της ουσίας των εννοιών και των όρων, η διόρθωση λαθών. στο κείμενο, βοήθεια στην εκμάθηση γλωσσών. Υποστηρίζει τη δημιουργία διαφόρων τύπων δεδομένων κειμένου, όπως ποίηση, κώδικα σε γλώσσες προγραμματισμού, επανεγγραφή έργων με άλλα λόγια και δημιουργία γραμμάτων χρησιμοποιώντας ένα πρότυπο. Ταυτόχρονα, το μοντέλο έχει σχετικά μικρό μέγεθος, επιτρέποντάς του να χρησιμοποιηθεί στον δικό σας εξοπλισμό με περιορισμένους πόρους, για παράδειγμα, σε συνηθισμένους φορητούς υπολογιστές και υπολογιστές.

Το μοντέλο άδειας επιτρέπει τη δωρεάν χρήση και διανομή όχι μόνο σε ερευνητικά και προσωπικά έργα, αλλά και σε εμπορικά προϊόντα. Επιτρέπεται επίσης η δημιουργία και δημοσίευση τροποποιημένων εκδόσεων του μοντέλου. Ταυτόχρονα, οι όροι χρήσης απαγορεύουν τη χρήση του μοντέλου για την εκτέλεση κακόβουλων ενεργειών και απαιτούν, όποτε είναι δυνατόν, να χρησιμοποιείτε την πιο πρόσφατη έκδοση του Gemma στα προϊόντα σας.

Η υποστήριξη για εργασία με μοντέλα Gemma έχει ήδη προστεθεί στην εργαλειοθήκη Transformers και στην Εργαλειοθήκη Responsible Generative AI. Για να βελτιστοποιήσετε το μοντέλο, μπορείτε να χρησιμοποιήσετε το πλαίσιο Keras και τα backends για TensorFlow, JAX και PyTorch. Είναι επίσης δυνατή η χρήση του Gemma με τα πλαίσια MaxText, NVIDIA NeMo και TensorRT-LLM.

Το μέγεθος του περιβάλλοντος που λαμβάνεται υπόψη από το μοντέλο Gemma είναι 8 χιλιάδες μάρκες (ο αριθμός των διακριτικών που μπορεί να επεξεργαστεί το μοντέλο και να θυμάται κατά τη δημιουργία κειμένου). Για σύγκριση, το μέγεθος περιβάλλοντος για τα μοντέλα Gemini και GPT-4 είναι 32 χιλιάδες μάρκες και για το μοντέλο GPT-4 Turbo είναι 128 χιλιάδες. Το μοντέλο υποστηρίζει μόνο αγγλικά. Όσον αφορά τις επιδόσεις, το μοντέλο Gemma-7B είναι ελαφρώς κατώτερο από το μοντέλο LLama 2 70B Chat και λίγο πιο μπροστά από τα μοντέλα DeciLM-7B, PHI-2 (2.7B) και Mistral-7B-v0.1. Στη σύγκριση της Google, το μοντέλο Gemma-7B είναι ελαφρώς μπροστά από τα LLama 2 7B/13B και Mistral-7B.

Η Google ανακάλυψε το μοντέλο Gemma AI, που βασίζεται σε τεχνολογίες κοινές στο chatbot Gemini


Πηγή: opennet.ru

Προσθέστε ένα σχόλιο