Στην πρόσφατη εκδήλωση Google I/O, που πραγματοποιήθηκε στην Καλιφόρνια, η Google έκανε σημαντικές ανακοινώσεις σχετικά με τις νέες εφαρμογές τεχνητής νοημοσύνης, με επίκεντρο το Gemini, το πιο προηγμένο μοντέλο AI της εταιρείας. Πριν ένα χρόνο, η Google είχε παρουσιάσει τα σχέδιά της για το Gemini, μια οικογένεια πολυτροπικών μοντέλων AI ικανών να συλλογίζονται με τη χρήση κειμένου, εικόνων, βίντεο, κώδικα και άλλων.

Στο φετινό Google I/O, η Google παρουσίασε τις νέες λύσεις AI που προσφέρει το Gemini στα προϊόντα, την έρευνα και την υποδομή της, τονίζοντας τη συμβολή του στη δημιουργία νέων εμπειριών για τους χρήστες και την αύξηση της χρησιμότητας των προϊόντων της. Όλα τα προϊόντα της Google με περισσότερους από δύο δισεκατομμύρια χρήστες είναι φτιαγμένα με την τεχνολογία Gemini.
Η Google ανακοίνωσε επίσης νέες δυνατότητες και εφαρμογές του Gemini, όπως:
- Επέκταση των AI Overviews στην Αναζήτηση: Με το νέο προσαρμοσμένο μοντέλο Gemini, ικανό για συλλογισμό πολλαπλών βημάτων και πολυτροπικότητα, οι χρήστες θα μπορούν να κάνουν σύνθετες ερωτήσεις και να προσαρμόζουν τα αποτελέσματα αναζήτησης με τη χρήση βίντεο.
- Παρουσίαση του Ask Photos: Χάρη στις πολυτροπικές δυνατότητες του Gemini, οι χρήστες του Google Photos μπορούν να αναζητούν συγκεκριμένες αναμνήσεις ή να ανακαλούν πληροφορίες από τις συλλογές τους απλά ρωτώντας το Ask Photos.
- Νέοι τρόποι αλληλεπίδρασης στο Workspace: Οι δυνατότητες του Gemini επεκτείνονται σε περισσότερους χρήστες και ενσωματώνονται στο πλαϊνό πλαίσιο του Gmail, των Docs, του Drive, των Slides και των Sheets, ενώ λειτουργίες του Gemini προστίθενται και στην εφαρμογή Gmail για κινητά.
- Gemini για Android: Η τεχνολογία AI ενσωματώνεται απευθείας στο λειτουργικό σύστημα Android, παρέχοντας βοήθεια στις ασκήσεις με το Circle to Search και δυναμικές προτάσεις για το περιεχόμενο στην οθόνη.
Η Google παρουσίασε επίσης το Gemini 1.5 Pro, το μεγαλύτερο από οποιοδήποτε ευρέως διαθέσιμο chatbot, που θα είναι διαθέσιμο στους συνδρομητές του Gemini Advanced σε περισσότερες από 35 γλώσσες. Το Gemini 1.5 Pro μπορεί να κατανοήσει πληροφορίες από μεγάλα αρχεία PDF, κώδικα και βίντεο, παρέχοντας στους χρήστες του Live τη δυνατότητα να συνομιλούν με φυσικές φωνές και να διακόπτουν με ερωτήσεις.

Επιπλέον, η Google συνεργάζεται με τη δημιουργική κοινότητα για να υποστηρίξει τη δημιουργική διαδικασία με παραγωγική τεχνητή νοημοσύνη, παρουσιάζοντας το Veo για τη δημιουργία βίντεο υψηλής ευκρίνειας, το Imagen 3 για τη μετατροπή κειμένου σε εικόνα, και το Music AI Sandbox για δημιουργία μουσικής.
Η εταιρεία παρουσίασε επίσης το Trillium, το TPU 6ης γενιάς, το οποίο προσφέρει βελτίωση 4,7 φορές στην υπολογιστική απόδοση ανά τσιπ σε σύγκριση με την προηγούμενη γενιά, το TPU v5e, το οποίο θα είναι διαθέσιμο στους πελάτες Cloud αργότερα μέσα στη χρονιά.

Τέλος, η Google δίνει έμφαση στην υπεύθυνη καινοτομία, αναπτύσσοντας τεχνολογίες όπως το “AI-assisted red teaming” και το SynthID για την αναγνώριση περιεχομένου που δημιουργείται από AI, με στόχο να καταστήσει την Τεχνητή Νοημοσύνη χρήσιμη για όλους. Η αποστολή της Google είναι να οργανώσει τις πληροφορίες του κόσμου και να τις καταστήσει προσβάσιμες με τρόπο που να είναι πραγματικά χρήσιμος για τους χρήστες. Το Gemini είναι το μέσο που θα βοηθήσει την Google να πετύχει αυτόν τον στόχο.

