Google met à niveau Vertex AI pour suivre le rythme du boom de l'IA générative

Blog

MaisonMaison / Blog / Google met à niveau Vertex AI pour suivre le rythme du boom de l'IA générative

Feb 04, 2024

Google met à niveau Vertex AI pour suivre le rythme du boom de l'IA générative

Plus de la moitié des PDG dans le monde expérimentent l’IA pour générer du texte, des images et d’autres formes de données, selon une récente enquête conjointe de Fortune et Deloitte. Pendant ce temps, un tiers des organisations sont

Plus de la moitié des PDG dans le monde expérimentent l’IA pour générer du texte, des images et d’autres formes de données, selon une récente enquête conjointe de Fortune et Deloitte. Parallèlement, un tiers des organisations utilisent « régulièrement » l’IA générative dans au moins une fonction commerciale, selon un rapport de McKinsey.

Compte tenu du marché adressable massif (et apparemment en croissance), il n’est pas surprenant que Google Cloud s’efforce – très fort – de rester à la page.

Lors de sa conférence annuelle Cloud Next, Google a annoncé des mises à jour de Vertex AI, sa plate-forme cloud qui fournit des flux de travail pour la création, la formation et le déploiement de modèles d'apprentissage automatique. Vertex AI propose désormais des modèles d'IA mis à jour pour la génération de texte, d'images et de code, ainsi que de nouveaux modèles tiers de startups, notamment Anthropic et Meta, et des extensions qui permettent aux développeurs d'incorporer les données de l'entreprise et d'agir au nom d'un utilisateur.

« [Avec Vertex,] nous adoptons une approche écosystémique très ouverte, en travaillant avec de vastes partenaires de l'écosystème pour offrir choix et flexibilité à nos clients », a déclaré June Yang, vice-présidente de l'IA cloud et des solutions industrielles chez Google, lors d'un point de presse. « Nous avons construit une approche de l'IA générative axée sur la préparation de l'entreprise, en mettant fortement l'accent sur la gouvernance des données, la sécurité responsable de l'IA et bien plus encore. »

Du côté du modèle, Google affirme avoir « considérablement » amélioré son modèle de génération de code Codey, offrant une amélioration de la qualité de 25 % dans les « principaux langages pris en charge » pour la génération de code. (Google n'a malheureusement pas développé cette vague métrique dans les documents fournis à ce journaliste.) Il a également mis à jour Imagen, son modèle de génération d'images, pour améliorer la qualité des images générées et prendre en charge Style Tuning, qui permet aux clients de créer des images. « alignés sur leur marque » en utilisant seulement 10 images de référence.

Ailleurs, le modèle linguistique PaLM 2 de Google comprend de nouvelles langues (38 en disponibilité générale et plus de 100 en version préliminaire) et dispose d'une fenêtre contextuelle étendue de 32 000 jetons. La fenêtre contextuelle, mesurée en jetons (c'est-à-dire en morceaux bruts de texte), fait référence au texte que le modèle prend en compte avant de générer tout texte supplémentaire (32 000 jetons équivalent à environ 25 000 mots, soit environ 80 pages de texte, à double interligne).

La fenêtre contextuelle de PaLM 2 n'est pas la plus grande du marché. Cette distinction revient à Claude 2 d'Anthropic, qui possède une fenêtre contextuelle de 100 000 jetons, soit plus de trois fois la taille des PaLM 2 et GPT-4 d'origine. Mais Nenshad Bardoliwalla, chef de produit chez Vertex AI, a déclaré que la décision d'opter pour 32 000 jetons avait été prise en gardant à l'esprit la « flexibilité » et le « coût ».

"Nos clients s'efforcent d'équilibrer la flexibilité de la modélisation qu'ils sont capables de réaliser avec de grands modèles et les scénarios qu'ils peuvent générer avec le coût de l'inférence - et avec la capacité d'affiner", a déclaré Bardoliwalla lors du briefing. « Chacun d’entre eux a un certain coût informatique ainsi que des coûts humains en fonction de l’investissement que vous y consacrez. Nous avons donc estimé à ce moment-là que, compte tenu de l'évolution du marché, les résultats avec 32 000 tokens sont assez impressionnants sur la base des évaluations que nous avons effectuées. Nous avons estimé qu'il trouvait le bon équilibre entre de nouvelles capacités et un rapport prix/performance compétitif sur le marché.

Tous les clients ne seront pas d’accord. Mais pour tenter de jouer sur les deux tableaux, Google a ajouté des modèles tiers, dont Claude 2, au Model Garden de Vertex AI, une collection de modèles et d'outils prédéfinis qui peuvent être personnalisés selon les besoins d'une entreprise. Parmi les autres modèles rejoignant le Model Garden figurent le Llama 2 récemment publié par Meta et le Falcon LLM open source du Technology Innovation Institute.

Les nouveaux ajouts de modèles constituent un coup de pouce pour Amazon Bedrock, le produit AWS récemment lancé par Amazon qui permet de créer des applications génératives basées sur l'IA via des modèles pré-entraînés provenant de startups, notamment AI21 Labs, Anthropic et Stability AI. Compte tenu du déploiement difficile de Bedrock, Google voit peut-être une opportunité de s'implanter sur le marché naissant des services de modèles gérés,