ESI ULM
首頁 意見雲計算和人工智能的民主化

雲計算和人工智能的民主化

Raúl Reguillo 觀點文章 esi-uclm

雲計算和人工智能的民主化

通過 勞爾·雷吉略 (畢業於 BBVA Next Technologies 的 ESI 和雲架構師)。

1.雲端漫步。

多年來,技術 他們在任何公司都扮演著至關重要的角色。 無論是一個 啟動,無論是中小企業還是大公司,在定義技術戰略時,雲都將自己定位為必不可少的要素 [1]。 資源的彈性、可調整和可預測的成本、安全性或所提供服務的初期數量等特性,將雲技術定位為對公司極具吸引力的價值。 在數據中,[2] 向我們展示了採用和預測的示例。

圖 1:公司採用雲計算 [2]

在這些服務中,可以找到針對存儲、數據庫或計算的經典服務,以及最前衛的服務,探索量子計算的視野 [3] 或進一步推動人工智能的極限。

圖 2:Amazon Web Services Braket。 量子計算服務 [3]

這種使資源、知識和服務更接近人們的質量被稱為民主化。 縱觀歷史,已經看到了許多民主化的例子,其中最相關和最早期的例子之一是印刷機的發明。 當書籍是只有少數知道如何閱讀、解釋和利用它們的人才能獲得的奢侈品時,印刷機使大眾更容易接觸到它們,從而為他們帶來知識。 因此,我們可以想到許多其他例子,從運輸和能源到新聞和電信。 雲在技術趨勢中的民主化作用是顯著的、廣泛的,它有可能成為改變計算工作方式的範式之一 [4]。 同樣,雲服務提供商的數量有利於全球覆蓋以及非常實惠的價格 [5]。 不再需要在服務器和磁盤上進行大量投資來託管信息,但可以以非常實惠的價格租用虛擬空間所需的準確時間,並委託安全、維護和 符合 提供者本身 . 同樣,小公司甚至個人也可以因此租用整個 並行處理(可能有數百個節點)以在嚴格必要的時間利用它,然後釋放它。 這個強大的概念可以擴展到計算或存儲之外,到達其他類別的更具體的服務(列表非常廣泛 [6]),例如物聯網、區塊鏈、數據遷移、機器人技術或人工智能。

圖 3:主要雲提供商的服務比較 [6]

2. 民主

正是在最後一個領域,即人工智能,這種民主化的影響似乎最為明顯,而且在非常多樣化的領域中。 雲以服務(PaaS、SaaS、IaaS)的形式使許多事物民主化,人工智能領域是其中幾個分支融合的一個特例。 在本文中,我們將討論人工智能民主化影響最大的三個方面:資源、知識和運營。

2.1 資源

如果我們考慮訓練一個模型 深度學習 某些算法所需的資源量以及需要 硬件 與高端 GPU 或 TPU 一樣,它們可能超出許多普通公司、學生或研究人員的預算。 這種材料只能提供給有足夠償付能力、可以購買並充分利用它的公司。 讓我們看一個例子:

ResNet-50 [7] 是 深度學習 面向圖像的分類。 如果我們使用 ImageNet 數據集訓練 ResNet-50 90 個 epoch,則使用單個 GPU 可能需要長達一周的時間。 隨著我們增加 GPU 的數量,可以減少訓練時間,在至少 4 個 GPU 的情況下達到更合理的時間。 另一方面,數據集本身非常大:大約 150 GB。 由於這是一個簡單(且相對較老)的問題,我們開始看到這種數據在分佈式環境中可能也更好。

很明顯,對於某些問題 深入學習 該解決方案通過分佈式環境進行計算,數據存儲,我們不要忘記在生產環境中推理或利用模型。 在這一點上,我們可以計算我們想要擁有多少個節點,我們將為它們提供什麼用途,我們可以負擔多少 GPU 以及我們將如何保持一切更新(庫版本、補丁等)。 沒有什麼是買不起的,但它確實需要一個 抵消 相當大的元工作。

在環境中 然而,我們享受所有這一切的抽象層。 分佈式存儲非常便宜(每月每 GB 幾美分),並且不同的培訓服務已經提供了執行此類培訓的標準配置:節點數量、機器容量、GPU 類型、庫和要使用的版本。 因此,只需單擊幾下,您就可以在幾分鐘內準備好訓練我們的 ResNet-50 的環境,服務成本約為幾歐元。

2.2 知識

雲可以讓人工智能更接近用戶的最強大的方面之一可能是與知識的利用有關。 已經有一個可用的訓練模型目錄。 公司不必從頭開始訓練圖像分類器或推薦系統; 已經有一些服務可以使用任何人都可以利用的預訓練模型。 其中最成功的是文本或圖像中的情感分析服務,模型 語音到文本 或取消 文本到語音, 欺詐檢測, 實體識別, 預測 還有很長的等等。 因此,公司可以以服務的形式利用這些知識,將它們連接到其解決方案,作為 軟體 更多,並每月支付費用來利用它們。 不再需要在公司內部訓練一個模型來解決這帶來的問題; 缺乏數據,預測錯誤,再培訓,主要是獲得必要的知識和概況來執行它。

圖 4:不同雲提供商的自然語言處理服務比較 [9]

2.3 操作

最後,添加到服務目錄的最新章節之一是操作,即促進必須執行的必要工作(前面提到的元工作)以訓練人工智能模型並將其投入生產。

雲提供商意識到管理此類項目的複雜循環,極大地促進了創建 管道 提取數據、訓練模型、將其投入生產並監控其性能所必需的。 這組流程,通常稱為 多播 [10] 也被雲提供商通過抽象層民主化,因此只需點擊幾下,所有必要的操作都被覆蓋。

圖 5:示例 MLOps [10]

3。 結論

雲已經徹底改變了我們處理流程和服務的方式。 在人工智能領域,影響已經臭名昭著,每年推出的與該領域相關的服務數量似乎沒有盡頭。 當然,技術本身 它們需要使用一定的學習曲線,因此我們不能免除這個元工作來有效利用它們,儘管它們往往是平滑的學習曲線,並且在時間和成本優化方面獲得的好處是顯而易見的. 現在,任何規模的人工智能比以往任何時候都更加觸手可及。

referencias

[1] Jayeola, O.、Sidek, S.、Abd Rahman, A.、Mahomed, ASB 和 Hu, J. (2022)。 雲計算在中小型企業 (SME) 中的應用:系統文獻回顧和未來研究方向。 國際商業與社會雜誌, 23(1),226-243。

[2] https://www.cloudwards.net/cloud-computing-statistics/

[3] https://en.wikipedia.org/wiki/Cloud-based_quantum_computing#Existing_platforms

[4] Shawish, A. 和 Salama, M. (2014)。 雲計算:範式和技術。 在 跨合作集體智慧:技術與應用 (第 39-67 頁)。 施普林格,柏林,海德堡。

[5] https://dgtlinfra.com/top-10-cloud-service-providers-2022/

[6] https://comparecloud.in/

[7] He, K., Zhang, X., Ren, S., & Sun, J. (2016)。 用於圖像識別的深度殘差學習。 在 IEEE關於計算機視覺和模式識別的會議論文集 (pp.770-778)。

[8] https://www.bbvanexttechnologies.com/blogs/training-deep-learning-models-on-multi-gpus/

[9] https://medium.com/kontikilabs/comparing-machine-learning-ml-services-from-various-cloud-ml-service-providers-63c8a2626cb6

[10] https://la.blogs.nvidia.com/2020/09/08/que-es-mlops/

與某人分享:
評價這個項目