ESI UCLM
AccueilOpinionCloud Computing et démocratisation de l'IA

Cloud Computing et démocratisation de l'IA

Article d'opinion de Raúl Reguillo esi-uclm

Cloud Computing et démocratisation de l'IA

Par Raúl Reguillo (diplômé ESI et Architecte Cloud à BBVA Next Technologies).

1. Une promenade dans les nuages.

Pendant des années, les technologies nuage Ils jouent un rôle crucial dans toute entreprise. Que ce soit un Démarrage, une PME ou une grande entreprise, le cloud s'est positionné comme un ingrédient incontournable dans la définition de la stratégie technologique [1]. Des caractéristiques telles que l'élasticité des ressources, les coûts ajustés et prévisibles, la sécurité ou le nombre naissant de services offerts, positionnent les technologies cloud comme une valeur très attractive pour les entreprises. Dans les données, [2] nous montre un exemple d'adoption et de projection.

Figure 1 : Adoption du cloud computing par les entreprises [2]

Au sein de ces services, on retrouve des plus classiques, visant le stockage, les bases de données ou le calcul, ainsi que les plus avant-gardistes, explorant les horizons du Quantum Computing [3] ou repoussant plus loin les limites de l'Intelligence Artificielle.

Figure 2 : Frein d'Amazon Web Services. Service d'informatique quantique [3]

Cette qualité de rapprocher les ressources, les connaissances et les services des personnes est connue sous le nom de démocratisation. Tout au long de l'histoire, de nombreux exemples de démocratisation ont été vus, l'un des plus pertinents et des premiers étant celui de l'invention de l'imprimerie ; Alors que les livres étaient des objets de luxe accessibles à quelques-uns qui savaient les lire, les interpréter et en profiter, l'imprimerie a permis de les rendre plus accessibles aux masses et donc de leur apporter des connaissances. On peut ainsi penser à bien d'autres exemples qui peuvent aller des transports et de l'énergie aux nouvelles et aux télécommunications. Le rôle démocratisant du cloud dans les tendances technologiques est remarquable, étendu et il est possible qu'il fasse partie de ces paradigmes qui changent le fonctionnement de l'informatique [4]. De même, le nombre de fournisseurs de services cloud favorise une couverture mondiale ainsi que des prix très abordables [5]. Il n'est plus nécessaire d'investir massivement dans des serveurs et des disques pour héberger des informations, mais l'espace virtuel peut être loué pour la durée précise requise à des prix très abordables et déléguer les aspects de sécurité, de maintenance et conformité au fournisseur lui-même nuage. De même, une petite entreprise ou même un particulier peut ainsi louer un grappe de traitement parallèle (potentiellement des centaines de nœuds) pour l'exploiter le temps strictement nécessaire, puis le libérer. Ce concept puissant peut être étendu au-delà du calcul ou du stockage, atteignant d'autres classes de services plus spécifiques (la liste est très longue [6]) tels que l'IoT, la Blockchain, la migration de données, la robotique ou l'intelligence artificielle.

Figure 3 : Comparaison entre les services des principaux fournisseurs de cloud [6]

2. Démocratie

C'est dans ce dernier domaine, l'Intelligence Artificielle, que les effets de cette démocratisation semblent les plus évidents et dans des domaines très divers. Le cloud est venu démocratiser beaucoup de choses sous forme de services (PaaS, SaaS, IaaS), le domaine de l'Intelligence Artificielle étant un cas particulier où plusieurs de ces branches convergent. Dans cet article, nous parlerons de trois aspects où la démocratisation de l'IA a le plus d'impact : les ressources, les connaissances et les opérations.

2.1 Cours

Si nous pensons former un modèle de L'apprentissage en profondeur la quantité de ressources que certains des algorithmes nécessitent ainsi que la nécessité de matériel Comme les GPU ou TPU haut de gamme, ils peuvent être hors budget pour de nombreuses entreprises, étudiants ou chercheurs modestes. Ce matériel ne serait accessible qu'aux entreprises suffisamment solvables qui pourraient l'acheter et en tirer pleinement profit. Voyons cela avec un exemple :

ResNet-50 [7] est un modèle de L'apprentissage en profondeur orienté vers la classification des images. Si nous formons ResNet-50 pendant 90 époques avec l'ensemble de données ImageNet, cela peut prendre jusqu'à une semaine avec un seul GPU. Au fur et à mesure que nous augmentons le nombre de GPU, le temps d'entraînement peut être réduit, atteignant des temps plus raisonnables avec au moins 4 GPU. D'autre part, le jeu de données lui-même est assez volumineux : environ 150 Go. Comme il s'agit d'un problème simple (et relativement ancien), nous commençons à voir qu'il est peut-être préférable d'avoir ce type de données également dans un environnement distribué.

Il est bien évident que pour certains problèmes de l'apprentissage en profondeur la solution passe par des environnements distribués, tant pour le calcul, le stockage de données et n'oublions pas l'inférence ou l'exploitation du modèle dans des environnements productifs. À ce stade, nous pouvons faire des calculs sur le nombre de nœuds que nous voulons avoir, l'utilisation que nous allons leur donner, le nombre de GPU que nous pouvons nous permettre et comment nous allons tout garder à jour (versions de bibliothèque, correctifs, etc.). Rien qui ne soit pas abordable, mais cela nécessite un compenser métatravail considérable.

Dans un environnement nuage cependant nous apprécions une couche d'abstraction de tout cela. Le stockage distribué est extrêmement bon marché (cents d'euro par Go par mois) et les différents services de formation proposent déjà des configurations standards pour réaliser ce genre de formation : nombre de nœuds, capacité des machines, types de GPU, bibliothèques et versions à utiliser. Ainsi, en quelques clics, vous pouvez compter sur un environnement prêt à entraîner notre ResNet-50 en quelques minutes, le coût du service avoisinant quelques euros.

2.2 Connaissances

L'exploitation des connaissances est peut-être l'un des aspects les plus puissants où le cloud peut rapprocher l'IA de l'utilisateur. Il existe déjà un catalogue de modèles formés disponibles pour utilisation. Une entreprise n'a pas besoin de former un classificateur d'images ou un système de recommandation à partir de rien ; Il existe déjà des services qui utilisent des modèles pré-formés qui peuvent être exploités par n'importe qui. Parmi les plus performants figurent les services d'analyse de sentiments en texte ou en image, les modèles de speech to text ou texte à la parole, détection de fraude, reconnaissance d'entité, prévision Et un long etc. Ainsi, une entreprise peut valoriser ces connaissances sous forme de services, en les connectant à ses solutions en tant que composante de ,software plus et payer une redevance mensuelle pour les exploiter. Il n'est plus nécessaire d'avoir formé un modèle au sein de l'entreprise avec les problèmes que cela implique ; le manque de données, les erreurs de prédiction, le recyclage et surtout l'acquisition des connaissances et des profils nécessaires pour le mener à bien.

Figure 4 : Comparaison des services de traitement du langage naturel chez différents fournisseurs de cloud [9]

2.3 Opérations

Enfin, l'un des derniers chapitres ajoutés au catalogue de services est celui des opérations, c'est-à-dire faciliter le travail nécessaire qui doit être effectué (ce méta-travail mentionné précédemment) pour entraîner et mettre en production un modèle d'intelligence artificielle.

Les fournisseurs de cloud, conscients de la boucle complexe qui régit ce genre de projets, facilitent grandement la création de pipelines nécessaires pour extraire les données, former le modèle, le mettre en production et surveiller ses performances. Cet ensemble de processus, généralement appelé MLOps [10] est également démocratisé par les fournisseurs de cloud via une couche d'abstraction, de sorte qu'en quelques clics toutes les opérations nécessaires sont couvertes.

Figure 5 : Exemple de MLOps [10]

3. conclusiones

Le cloud est venu révolutionner notre approche des processus et des services. Dans le domaine de l'IA, l'impact a été notoire et le nombre de services qui sont lancés chaque année liés à ce domaine semble ne jamais connaître de fin. Bien sûr, les technologies elles-mêmes nuage ils nécessitent une certaine courbe d'apprentissage pour être utilisés, nous ne sommes donc pas exempts de ce méta-travail pour les utiliser efficacement, bien qu'ils aient tendance à être des courbes d'apprentissage lisses et que le bénéfice obtenu en termes d'optimisation du temps et des coûts soit plus qu'évident . Aujourd'hui plus que jamais, l'Intelligence Artificielle à toute échelle est à la portée de tous.

références

[1] Jayeola, O., Sidek, S., Abd Rahman, A., Mahomed, ASB et Hu, J. (2022). Adoption du cloud computing dans les petites et moyennes entreprises (PME) : une revue systématique de la littérature et des orientations pour les recherches futures. Revue internationale des affaires et de la société, 23(1), 226-243.

https://www.cloudwards.net/cloud-computing-statistics/

https://en.wikipedia.org/wiki/Cloud-based_quantum_computing#Existing_platforms

[4] Shawish, A., & Salama, M. (2014). Cloud computing : paradigmes et technologies. Dans Intelligence collective inter-coopérative : Techniques et applications (pp.39-67). Springer, Berlin, Heidelberg.

https://dgtlinfra.com/top-10-cloud-service-providers-2022/

https://comparecloud.in/

[7] He, K., Zhang, X., Ren, S. et Sun, J. (2016). Apprentissage résiduel profond pour la reconnaissance d'images. Dans Actes de la conférence IEEE sur la vision par ordinateur et la reconnaissance de formes (Pp. 770-778).

https://www.bbvanexttechnologies.com/blogs/training-deep-learning-models-on-multi-gpus/

https://medium.com/kontikilabs/comparing-machine-learning-ml-services-from-various-cloud-ml-service-providers-63c8a2626cb6

https://la.blogs.nvidia.com/2020/09/08/que-es-mlops/

Partager avec:
Évaluez cet article