Un développeur seul, armé de l'IA Claude, a réussi à implémenter la méthode révolutionnaire de Google pour mettre fin à la crise de la RAM. La conséquence : il est désormais possible de faire tourner des modèles d'IA ultra puissants sur un simple ordinateur personnel comme un MacBook Air.
Un développeur seul, armé de l’IA Claude, a réussi à implémenter la méthode révolutionnaire de Google pour mettre fin à la crise de la RAM. La conséquence : il est désormais possible de faire tourner des modèles d’IA ultra puissants sur un simple ordinateur personnel comme un MacBook Air.
L’histoire commence par une publication scientifique presque passée inaperçue auprès du grand public, mais qui a fait trembler les marchés financiers.. L’objectif : réduire les besoins en RAM des intelligences artificielles gourmandes et potentiellement mettre fin à la crise de la RAM qui touche le grand public. L’entreprise a publié les mathématiques derrière cette avancée, mais a fait un choix singulier : ne partager aucune ligne de code exploitable.assistant IA Claude. En seulement 7 jours, le développeur a réussi à recréer et même améliorer l’algorithme secret de Google.Pour comprendre l’exploit, il faut d’abord s’attarder sur la manière dont fonctionnent les modèles de langage actuels. Quand vous discutez avec une intelligence artificielle, celle-ci ne se contente pas de lire votre dernière phrase. Elle doit conserver l’historique complet de la conversation pour rester cohérente. Ces données sont stockées dans ce que l’on appelle le cache KV, pour «Le problème de ce cache, c’est qu’il grossit de manière linéaire à chaque nouveau mot généré. Sur une longue conversation, cette mémoire temporaire finit par consommer plus d’espace que le modèle d’intelligence artificielle lui-même. Votre ordinateur ou smartphone peut-il faire tourner une IA ? Ce site vous donne la réponse en un clic. L’algorithme de Google apporte une réponse mathématique à ce blocage. Si vous souhaitez approfondir la mécanique de base, nous avons déjà détaillé commentFace au document de recherche de Google, Tom Turney n’a pas attendu. En l’espace de sept jours, il a transformé des équations complexes en un programme fonctionnel. Les trois premiers jours ont été consacrés au prototypage en langage Python afin de valider les mathématiques de base. Ensuite, il a porté ce code vers des langages plus performants pour exploiter les puces graphiques des ordinateurs Apple. La partie la plus intéressante réside dans l’optimisation. La première version de son code était relativement lente. Selon les données partagées par le développeur, le traitement initial plafonnait à 739 tokens par seconde . Grâce à un travail minutieux sur la gestion de la mémoire et des calculs graphiques, il a réussi à pousser cette vitesse à 2 747 tokens par seconde. Le résultat final est non seulement fonctionnel, mais il s’avère plus rapide que les méthodes de compression standards existantes. Mais le développeur ne s’est pas arrêté là. Il a ajouté sa propre couche de recherche par-dessus l’algorithme de Google avec une fonction baptisée Sparse V. Il a remarqué que lors de longues conversations, l’intelligence artificielle n’accorde de l’importance qu’à une infime partie des mots stockés. En décidant de ne pas traiter les données inutiles, il explique pouvoir ignorer 90 % des décompressions de valeurs. Le gain de vitesse est notable, et l’impact sur la qualité des réponses de l’IA est, selon ses propres tests, de «L’annonce de Google a eu un effet collatéral inattendu. Les marchés financiers, craignant que cette optimisation logicielle ne détruise la demande en composants matériels , ont massivement vendu leurs actions. Des entreprises comme Samsung, Micron ou NVIDIA ont vu leur cours baisser drastiquement en l’espace de 48 heures. Le PDG de Cloudflare, Matthew Prince, a d’ailleurs qualifié cette publication de « Pourtant, cette réaction du marché manque de nuance. Rendre une technologie plus économe en ressources ne réduit pas nécessairement sa consommation globale, bien au contraire. C’est ce que l’on appelle le paradoxe de Jevons.En diminuant le coût matériel nécessaire pour faire fonctionner ces modèles, de nouveaux usages deviennent possibles pour le grand public. L’intégration rapide de ces découvertes nous donne d’ailleurs un premier aperçu très concret de la puissance qui arrive sur nos ordinateurs personnels avec des applications déjà prêtes à télécharger, qui utilisent l’algorithme Google TurboQuant. Ce qui s’est passé cette semaine marque un tournant. Le fossé entre la recherche théorique et son application pratique n’a jamais été aussi mince. Grâce à l’initiative d’un développeur indépendant, il est aujourd’hui possible de faire tourner un modèle d’intelligence artificielle de 35 milliards de paramètres, avec un contexte immense, sur un simple MacBook. Le tout, sans même que l’entreprise à l’origine de l’algorithme n’ait eu besoin de publier son propre code.Les données transmises par le biais de ce formulaire sont destinées à Humanoid, société éditrice du site Frandroid en sa qualité de responsable de traitement. Elles ne seront en aucun cas cédées à des tiers. Ces données sont traitées sous réserve d'obtention de votre consentement pour vous envoyer par e-mail des actualités et informations relatives aux contenus éditoriaux publiés sur Frandroid. Vous pouvez vous opposer à tout moment à ces e-mails en cliquant sur les liens de désinscriptions présents dans chacun d'eux. Pour plus d'informations, vous pouvez consulter l'intégralité de notre. Vous disposez d'un droit d'accès, de rectification, d'effacement, de limitation, de portabilité et d'opposition pour motif légitime aux données personnelles vous concernant. Pour exercer l'un de ces droits, merci d'effectuer votre demande via notre Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce siteEn cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid etVous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notreLa solution radicale de Google contre la crise de la RAM est super astucieuse : voici TurboQuantUn joueur recrée une version de ChatGPT à l’intérieur de Minecraft Test de Gemini 3 Pro : j’ai créé un jeu vidéo et un site web pro sans écrire une ligne de code, essayez-lesAndroid 17 : le dossier ultime pour tout savoir sur la future mise à jour de vos smartphones et tablettesGMKtec devance Asus avec le premier PC équipé d’un Core Ultra X7 358H, de quoi affronter le Mac mini M4 ProLe forfait mobile de Free repasse à 9,99 euros : c’est le bon moment pour faire baisser la facture mensuelleComment fonctionne une e-SIM ?
United States Latest News, United States Headlines
Similar News:You can also read news stories similar to this one that we have collected from other news sources.
Course contre la Faim: Les élèves du lycée Claude-Nougaro se mobilisentLes élèves du lycée Claude-Nougaro à Caussade-Monteils ont participé à la Course contre la Faim, un événement solidaire organisé par Action contre la Faim. 200 élèves et enseignants ont couru pour collecter des fonds destinés à améliorer l'accès à la nourriture, à l'eau et à la santé en République centrafricaine.
Read more »
RAM DDR5 : les prix baissent enfin en Europe après des mois de hausseOn commence enfin à respirer ? Après des mois de flambée, les prix de la DDR5 affichent un recul de 7 % en mars. Le marché de la RAM est toujours en plein chaos.
Read more »
Sony suspend sa production de cartes mémoire, la crise de la RAM a encore frappéTerminées les cartes SD et CFexpress de Sony. L'entreprise japonaise met à l'arrêt presque toute sa chaîne de production à cause de la pénurie de SSD.
Read more »
Llama.cpp intègre Google TurboQuant : quels gains pour votre PC ou Mac ?L'IA locale a un problème de place, pas seulement de muscle. Avec TurboQuant, Google propose une solution pour faire tenir des contextes énormes dans de petites cartes graphiques.
Read more »
Complet jusqu’en 2028 : comment la pénurie de RAM pourrait profiter à Samsung face à TSMCDuellistes sur le terrain des nodes les plus avancés, TSMC et Samsung Foundry n'ont pas toujours joué à armes égales ces dernières années. La saturation, jusqu'en 2028, des capacités de production du leader taïwanais des semi-conducteurs pourrait toutefois jouer en la faveur de son rival coréen.
Read more »
Google renforce la sécurité de Google Drive pour se protéger des RansomwareLes équipes de Google déploient deux nouvelles fonctionnalités de sécurité permettant d’analyser et de bloquer en temps réel les fichiers corrompus qui pourraient s’insinuer sur votre Drive.
Read more »
