欧美一区2区三区4区公司二百,国产精品婷婷午夜在线观看,自拍偷拍亚洲精品,国产美女诱惑一区二区

什么是機器學習?機器學習項目可能的機器學習硬件選擇

隨著技術的進步讓我們能夠探索數據分析的未開發潛力,機器學習已經成為一種革命性的模型,受到全世界的歡迎。從醫療保健到汽車行業再到營銷和運輸——機器學習使組織能夠發現有價值的見解、提高生產力和高效運營。但它是如何工作的,你應該如何為你的機器學習項目選擇機器學習硬件

什么是機器學習?機器學習項目可能的機器學習硬件選擇

什么是機器學習?

機器學習沒有單一的定義。Nvidia 將其描述為“使用算法解析數據、從中學習,然后對世界上的某些事物做出判斷或預測的實踐”。而麥肯錫公司進一步補充說,機器學習“基于可以從數據中學習的算法,而不依賴于基于規則的編程。”

簡而言之,機器學習是人工智能 (AI) 的一個分支,專注于開發可以學習和改進的應用程序和系統,而無需對其進行編程。假設我們必須找出一種飲料是咖啡還是茶。我們將不得不建立一個系統來根據收集到的數據來回答這個問題。我們使用訓練來為這樣的問題建立模型。目標是讓系統盡可能準確地找到我們提出的問題的答案。

收集和收集數據

第一步是收集“訓練”我們的“模型”所需的數據。所收集數據的質量直接影響機器學習模型的準確性,這就是為什么確保為所選模型準備和處理數據至關重要的原因。

在我們的示例中,我們可以使用茶杯和咖啡杯作為數據。我們可以使用多種成分,但出于我們的目的,我們將選擇兩個簡單的成分——飲料的顏色和咖啡因的量。

首先,我們需要準備好各種茶和咖啡,并準備好測量設備——測量顏色的光譜儀和測量咖啡因含量的紫外??范圍分光光度計。然后,我們將使用收集到的數據來建立顏色、咖啡因含量以及是茶還是咖啡的表格。這將是訓練數據。

算法選擇

一旦我們收集了高質量的數據,下一步就是選擇最合適的模型。許多工程師和數據科學家發現選擇正確的算法是一項艱巨的任務。盡管有大量可用的算法模型,但您必須確保所選模型符合手頭數據和項目要求。

什么是機器學習?機器學習項目可能的機器學習硬件選擇

在我們的例子中,我們只有兩個數據點——顏色和咖啡因百分比。因此,我們可以使用簡單的線性模型,比如邏輯回歸算法。邏輯函數的公式是y = 1 / (1 + e^-(β0 + β1x1 + … + βnxn))輸出介于 0 和 1 之間。我們不斷調整 β 值,直到我們最大化預測精度并最小化成本函數。

特征工程

下一步涉及轉換數據,使其更容易解釋模型,從而提高準確性。可視化您的數據對于查看您是否遺漏了不同變量之間的任何關系或調整任何數據不平衡至關重要。特征工程可以讓你突出顯示關鍵數據,讓模型專注于最重要的標準。它還使您能夠將領域專業知識輸入到模型中,從而進一步提高準確性。

模型訓練

機器學習的核心是模型訓練過程。以我們的示例為例,我們將使用我們的數據逐步增強模型準確預測飲料是咖啡還是茶的能力。

由于我們使用的是線性模型,因此我們可以影響或更改的唯一變量是斜率和 y 軸截距。在機器學習中,上述變量的集合通常形成一個矩陣,w 表示權重,b 表示偏差。現在我們初始化 w 和 b 的隨機值并嘗試預測輸出。

這是一個重復的過程,只有通過反復試驗才能完善。每次迭代都會導致權重和偏差的更新,這稱為一個訓練步驟。隨著每個階段的進展,我們的模型一步步接近咖啡和茶之間的理想分離線。訓練完成后,我們會檢查我們的模型是否符合我們的預期。我們使用測試數據集評估我們的模型性能。這是為了查看模型如何針對新數據執行。這反映了模型在實際使用中的表現。

推理

一旦我們完成了所有艱苦的工作,我們就到了機器學習的實際要點:尋找答案。推理是我們得到這些答案的地方。我們運行我們的項目,看看我們的模型如何使用給定的數據準確地預測飲料是咖啡還是茶。

什么是機器學習?機器學習項目可能的機器學習硬件選擇

這里的美妙之處在于,我們可以用我們的模型來區分咖啡和茶,以代替人類的判斷。同樣的過程可以適用于任何領域或領域中出現的任何問題或問題,并進行一定程度的更改。然而,機器學習系統的性能高度依賴于部署的硬件。一個模型可能非常出色,但如果機器學習硬件達不到標準,這個過程就會變得太累人。

機器學習項目可能的機器學習硬件選擇

機器學習算法的計算強度各不相同。當今最流行的算法,如深度神經網絡或支持向量機,計算量非常大。訓練此類模型需要大量的計算資源。選擇正確的機器學習硬件是一個復雜的過程。讓我們看看機器學習的三個核心硬件選項:處理單元、內存和存儲。

處理單元

中央處理器 (CPU)

鑒于現在大多數機器學習模型都在 GPU 上運行,CPU 主要用于信息預處理。他們的設計習慣于串行操作,所以他們支持增加高速緩存和更少的內核來快速完成復雜的指令。

CPU 的優勢在于盡可能快地按順序執行一些復雜的操作,而機器學習通常涉及大量相對簡單的線性代數計算,最好并行處理。

但是,如果您正在從事不使用復雜算法且不需要太多計算資源的機器學習項目,則可能不需要 GPU。

例如,如果您的機器學習項目是輕量級的,i7-7500U CPU 是一個不錯的選擇,因為它每秒可以處理 100 多個示例。Threadripper 1900x 是一款來自 AMD 的八核 CPU,具有 16 個超線程,如果您愿意使用 CPU,它是另一個不錯的選擇。

也就是說,CPU 無法與 GPU 競爭,因為 CPU 經常性能過剩但人手不足。

Intel Phi 試圖與 NVIDIA/AMD GPU 競爭,但前者仍然缺乏性能,如下圖所示。

什么是機器學習?機器學習項目可能的機器學習硬件選擇

如果您的任務不適合 CPU 處理,則可以尋找出色的 GPU 選項。

圖形處理單元 (GPU)

與傳統的 CPU 相比,GPU 由數千個更小的內核組成,可以進行廣泛的并行計算和更高的吞吐量——可以在給定的時刻完成更多的計算。

GPU 最初是為圖形處理工作負載而創建的,但后來發現它對科學、產品設計和其他領域的通用計算非常有用。機器學習數據通常存儲為矩陣,矩陣乘法是最常見的過程。GPU 計算非常適合此類計算,最高可將速度提高 7 倍。

談到內存,重要的是要考慮機器學習模型的大小,以及它是否適合 GPU 的 VRAM 內存。例如,10GB 的 VRAM 內存對于進行深度學習原型設計和模型訓練的企業來說應該足夠了。

現代 GPU 卡,如 RTX 系列,支持 16 位 VRAM 內存,與舊的 32 位架構相比,它可以幫助您以相同數量的內存獲得近兩倍的性能。

NVIDIA GPU 通常是機器學習的絕佳選擇。CUDNN 和 CUDA 編程接口非常適用于當前的機器學習庫,例如 Keras、Tensorflow 或 PyTorch。

以下兩種型號是不錯的選擇,因為它們具有出色的性能,我們建議您在為您的機器學習項目選擇 GPU 時考慮一下。

  • Nvidia RTX 3080(8704 個 CUDA 內核,10GB GDDR6 顯存)
  • Nvidia RTX 3070(5888 個 CUDA 內核,8GB GDDR6 顯存)

RTX 3080 Ti 比 RTX 3070 快 20% 到 50%,但價格也更高。雖然這些模型可能是當今最流行的,但也有許多其他可用的機器學習 GPU 選項。

如果預算是一個問題,您可以通過購買稍微便宜一點的 GPU 并簡單地運行更長時間的計算來減少開支。GTX 1080 或 GTX 1070 等型號是極具成本效益的替代品。

現場可編程門陣列 (FPGA)

FPGA 以其功效著稱,可為可編程硬件資源以及 DPS 和 BRAM 塊提供靈活的架構。這允許通過部分重新配置在運行時重新配置數據路徑。因此,用戶沒有任何限制,可以進行并行計算。

此外,與 CPU 和 GPU 相比,FPGA 具有無與倫比的靈活性。它使它們能夠進行任意 I/O 連接,從而使用戶無需 CPU 即可連接任何設備或網絡。FPGA 用于功能安全具有重要作用的領域。因此,FPGA 旨在滿足各種不同應用的安全要求。Xilinx Zynq-7000 以及 Ultrascale+TM MPSoC 是支持安全關鍵型應用的示例。

專用集成電路 (ASIC)

顧名思義,ASIC 是為特定用途而設計的電路。這些是專門用于以更高效率完成預定義計算的設備。相比之下,CPU 可用于一般用途。甚至 GPU 也由并行處理器組成,它們可以同時執行多種不同的算法。與 FPGA 不同,ASIC 一旦制造就不可編程。雖然您可以在 FPGA 完成其目標后對其進行重新編程,但 ASIC 的邏輯是永久性的。

然而,ASIC 的主要優勢在于它們的效率,因為它們旨在僅完成預定義的任務。這也導致效率提高。以 AlphaGo 為例。當主要的 AlphaGo 版本在 TPU 上執行時,它們比在 CPU 和 GPU 集群上運行時消耗更少的能量。所有科技巨頭都對開發和投資 ASIC 感興趣。目前,谷歌推出了 Tensor Processing Unit 的第三次迭代,這是一種為訓練和推理而建立的 ASIC。

記憶

隨著機器學習能力呈指數增長,AI 應用程序需要增強的內存功能,以處理不斷增加的工作負載,同時保持效率。機器學習應用程序要考慮的三種主要內存類型是:

  • 片上存儲器
  • HBM(高帶寬內存)
  • GDDR內存

片上存儲器是最快的存儲器類型,位于存儲器層次結構的頂部。它靠近 CPU 和 GPU 的計算核心,這使得片上內存非常快,但也限制了它的容量。它用作微處理器的本地緩存存儲器,用于存儲最近訪問的信息。

HBM 是一種基于 DRAM 架構的 3-D 堆疊內存選項。它旨在提高性能,使您能夠利用增加的帶寬和容量。雖然效率不如片上存儲器,但它仍可通過保持低數據速率確保高效運行。

最新的 HBM 版本 HBME2 是一個值得注意的內存選項,適用于各種機器學習應用程序。最后,GDDR顯存最初可追溯到游戲應用,但人們認可其在機器學習程序中的功效。當前的 GDDR6 可以支持高達每秒 16 GB 的高數據速率。

貯存

存儲通常不是機器學習的關注點,通常歸結為預算。擁有任何大于 3 TB 的硬盤或 SSD 數據就足夠了。如果您的口袋允許,500 GB NVMe M2 SSD 是一個不錯的選擇。在訓練期間存儲并不重要,因為您的數據將駐留在 RAM 或 GPU VRAM 中,盡管擁有 SSD 仍然比 HDD 更好,因為性能物有所值。

文章鏈接: http://m.qzkangyuan.com/13993.html

文章標題:什么是機器學習?機器學習項目可能的機器學習硬件選擇

文章版權:夢飛科技所發布的內容,部分為原創文章,轉載請注明來源,網絡轉載文章如有侵權請聯系我們!

聲明:本站所有文章,如無特殊說明或標注,均為本站原創發布。任何個人或組織,在未征得本站同意時,禁止復制、盜用、采集、發布本站內容到任何網站、書籍等各類媒體平臺。如若本站內容侵犯了原著者的合法權益,可聯系我們進行處理。

給TA打賞
共{{data.count}}人
人已打賞
IDC云庫

如何設置Ansible庫存文件

2022-12-8 15:05:10

IDC云庫

GPU與CPU:主要區別是什么?

2022-12-8 15:31:40

0 條回復 A文章作者 M管理員
    暫無討論,說說你的看法吧
?
個人中心
購物車
優惠劵
今日簽到
有新私信 私信列表
搜索
主站蜘蛛池模板: 都匀市| 屏山县| 霸州市| 徐汇区| 长白| 唐山市| 禹州市| 四子王旗| 积石山| 镇康县| 大丰市| 嘉峪关市| 马关县| 高安市| 五峰| 集贤县| 北票市| 安义县| 阳曲县| 泉州市| 德钦县| 芮城县| 塔河县| 洞头县| 禄丰县| 原平市| 阿城市| 西平县| 沙坪坝区| 西盟| 芜湖市| 绍兴县| 阜宁县| 锡林郭勒盟| 神木县| 定安县| 禹州市| 清原| 淄博市| 云龙县| 苏州市|