Ná Lig an Stóráil a Bheith ar an bPríomhphraghas in Oiliúint Mhúnla

Tá sé ráite go bhfuil cuideachtaí teicneolaíochta ag scrambling le haghaidh GPUanna nó ar an mbealach chun iad a fháil. I mí Aibreáin, cheannaigh Príomhfheidhmeannach Tesla, Elon Musk, 10,000 GPU agus dúirt sé go leanfadh an chuideachta ag ceannach líon mór GPU ó NVIDIA. Ar thaobh na fiontraíochta, tá pearsanra TF ag brú go dian freisin chun a chinntiú go n-úsáidtear GPUanna i gcónaí chun an toradh ar infheistíocht a uasmhéadú. D’fhéadfadh go bhfaighidh roinnt cuideachtaí amach, áfach, cé go méadaíonn líon na GPUanna, go n-éiríonn díomhaoineas GPU níos déine.

Más rud é gur mhúin an stair aon rud dúinn faoi ríomhaireacht ardfheidhmíochta (HPC), is é an fáth nach ndéanfaí an stóráil agus an líonrú a íobairt ar chostas díriú rómhór ar ríomhaireacht. Mura féidir le stóráil sonraí a aistriú go héifeachtach chuig na haonaid ríomhaireachta, fiú má tá an líon is mó GPUanna ar domhan agat, ní bhainfidh tú an éifeachtúlacht is fearr amach.

De réir Mike Matchett, anailísí ag Small World Big Data, is féidir samhlacha níos lú a fhorghníomhú mar chuimhne (RAM), rud a ligeann fócas níos mó ar ríomhaireacht. Mar sin féin, ní féidir samhlacha níos mó cosúil le ChatGPT le billiúin nóid a stóráil mar chuimhne mar gheall ar an gcostas ard.

“Ní féidir leat na billiúin nóid a chur sa chuimhne, mar sin éiríonn an stóráil níos tábhachtaí fós,” a deir Matchett. Ar an drochuair, is minic nach ndéantar dearmad ar stóráil sonraí le linn an phróisis phleanála.

Go ginearálta, beag beann ar an gcás úsáide, tá ceithre phointe coitianta sa phróiseas oiliúna múnla:

1. Oiliúint Múnla
2. Feidhm Tátail
3. Stóráil Sonraí
4. Ríomhaireacht Luathaithe

Nuair a bhíonn samhlacha á gcruthú agus á n-imscaradh, tugann an chuid is mó de na ceanglais tosaíocht do thimpeallachtaí mear-phromhadh ar choincheap (POC) nó do thimpeallachtaí tástála chun oiliúint samhaltaithe a thionscnamh, agus ní thugtar aird mhór ar riachtanais stórála sonraí.

Is é an dúshlán, áfach, ná gur féidir le hoiliúint nó le himscaradh tátal leanúint ar feadh míonna nó fiú blianta. Déanann go leor cuideachtaí a méideanna samhlacha a mhéadú go tapa le linn an ama seo, agus ní mór an bonneagar a leathnú chun freastal ar na samhlacha agus na tacair shonraí atá ag fás.

Léiríonn taighde ó Google ar na milliúin d’ualaí oibre oiliúna ML go gcaitear 30% ar an meán den am oiliúna ar an bpíblíne sonraí ionchuir. Cé gur dhírigh taighde roimhe seo ar GPUanna a bharrfheabhsú chun oiliúint a bhrostú, tá go leor dúshlán fós ann maidir le codanna éagsúla den phíblíne sonraí a bharrfheabhsú. Nuair a bhíonn cumhacht ríomhaireachtúil suntasach agat, éiríonn an scrogall fíor chomh tapa agus is féidir leat sonraí a chur isteach sna ríomhanna chun torthaí a fháil.

Go sonrach, éilíonn na dúshláin a bhaineann le stóráil agus le bainistiú sonraí pleanáil le haghaidh fáis sonraí, rud a ligeann duit luach na sonraí a bhaint go leanúnach de réir mar a théann tú ar aghaidh, go háirithe nuair a théann tú isteach i gcásanna úsáide níos forbartha mar dhomhainfhoghlaim agus líonraí néaracha, a chuireann éilimh níos airde ar. stóráil i dtéarmaí acmhainne, feidhmíochta, agus inscálaithe.

Go háirithe:

Inscálaitheacht
Éilíonn foghlaim meaisín méideanna ollmhóra sonraí a láimhseáil, agus de réir mar a mhéadaíonn líon na sonraí, feabhsaítear cruinneas na samhlacha freisin. Ciallaíonn sé seo go gcaithfidh gnólachtaí níos mó sonraí a bhailiú agus a stóráil gach lá. Nuair nach féidir leis an stóráil scála a dhéanamh, cruthaíonn ualaí oibre atá dian ar shonraí baic, cuireann siad srian ar fheidhmíocht agus bíonn am díomhaoin GPU costasach mar thoradh air.

Solúbthacht
Tá gá le tacaíocht sholúbtha do phrótacail iolracha (lena n-áirítear NFS, SMB, HTTP, FTP, HDFS, agus S3) chun freastal ar riachtanais chórais éagsúla, seachas a bheith teoranta do chineál amháin timpeallachta.

Lagacht
Tá latency I/O ríthábhachtach chun samhlacha a thógáil agus a úsáid de réir mar a léitear agus a athléitear sonraí go minic. Is féidir an t-am oiliúna do mhúnlaí a ghiorrú de réir laethanta nó míonna má laghdaítear latency I/O. Aistríonn forbairt múnla níos tapúla go díreach go buntáistí gnó níos mó.

Tréchur
Tá tréchur na gcóras stórála ríthábhachtach d’oiliúint éifeachtúil sa tsamhail. Bíonn líon mór sonraí i gceist le próisis oiliúna, go hiondúil i dterabytes in aghaidh na huaire.

Rochtain Chomhthreomhar
Chun tréchur ard a bhaint amach, scoilteann samhlacha oiliúna gníomhaíochtaí ina dtascanna comhthreomhara iolracha. Ciallaíonn sé seo go minic go bhfaigheann halgartaim meaisínfhoghlama rochtain ar na comhaid chéanna ó phróisis iolracha (ar fhreastalaithe fisiceacha iolracha b'fhéidir) ag an am céanna. Caithfidh an córas stórála éilimh chomhthráthacha a láimhseáil gan cur isteach ar fheidhmíocht.

Agus a chumais den scoth i bhfoighne íseal, tréchur ard, agus I/O comhthreomhar ar scála mór, is comhlánú stórála idéalach é Dell PowerScale don ríomhaireacht luasghéaraithe GPU. Laghdaíonn PowerScale go héifeachtach an t-am a theastaíonn le haghaidh samhlacha anailíse a dhéanann oiliúint agus tástáil ar thacair sonraí il-terabyte. I stóráil uile-flash PowerScale, méadaíonn bandaleithead faoi 18 n-uaire, ag fáil réidh le scrogaill I/O, agus is féidir é a chur le braislí Isilon atá ann cheana féin chun luach méideanna móra sonraí neamhstruchtúrtha a luathú agus a dhíghlasáil.

Thairis sin, soláthraíonn cumais rochtana ilphrótacal PowerScale solúbthacht neamhtheoranta maidir le hualaí oibre a reáchtáil, rud a ligeann do shonraí a stóráil ag baint úsáide as prótacal amháin agus rochtain a fháil ag baint úsáide as ceann eile. Go sonrach, cuidíonn gnéithe cumhachtacha, solúbthacht, inscálaitheacht, agus feidhmiúlacht grád fiontair an ardáin PowerScale le dul i ngleic leis na dúshláin seo a leanas:

- An nuálaíocht a luathú suas le 2.7 uair, ag laghdú an timthriall oiliúna múnla.

- Deireadh a chur le scrogaill I/O agus oiliúint agus bailíochtú múnla níos tapúla a sholáthar, cruinneas feabhsaithe na samhla, táirgiúlacht fheabhsaithe eolaíocht sonraí, agus toradh uasta ar infheistíochtaí ríomhaireachta trí ghnéithe de ghrád fiontair, ardfheidhmíochta, comhairgeadra agus inscálaithe a ghiaráil. Feabhas a chur ar chruinneas na samhla le tacair shonraí níos doimhne, ardtaifigh trí suas le 119 PB d'acmhainn stórála éifeachtach a ghiaráil i mbraisle amháin.

- Imscaradh ar scála a bhaint amach trí ríomh agus stóráil ar scála beag neamhspleách a thosú, ag seachadadh roghanna láidre cosanta sonraí agus slándála.

- Táirgiúlacht na heolaíochta sonraí a fheabhsú le hanailísíocht in-áit agus réitigh réamhbhailíochtaithe le haghaidh imscaradh níos tapúla agus lena mbaineann riosca íseal.

- Dearaí cruthaithe a ghiaráil bunaithe ar na teicneolaíochtaí is fearr den phór, lena n-áirítear luasghéarú NVIDIA GPU agus ailtireachtaí tagartha le córais NVIDIA DGX. Comhlíonann ardfheidhmíocht agus comhairgeadra PowerScale na ceanglais feidhmíochta stórála ag gach céim den mheaisínfhoghlaim, ó fháil agus ullmhú sonraí go oiliúint múnla agus tátal. In éineacht le córas oibriúcháin OneFS, is féidir le gach nóid oibriú gan uaim laistigh den bhraisle céanna faoi thiomáint OneFS, le gnéithe ar leibhéal an fhiontair cosúil le bainistíocht feidhmíochta, bainistíocht sonraí, slándáil, agus cosaint sonraí, rud a chumasaíonn oiliúint agus bailíochtú samhail a chríochnú níos tapúla do ghnólachtaí.


Am postála: Jul-03-2023