mboost-dp1

unknown

Ny chip gør din desktop til supercomputer

- Via Wired.com - , redigeret af Net_Srak

En ny chip med navnet CS301, fra firmaet ClearSpeed Technologies, lover enorm floating-point regnekraft til personlige computere. Chippen skulle kunne beregne 25 gigaflops – altså 25 milliarder beregninger – i sekundet.

En PC udstyret med 6 PCI-kort der hver bruger 4 chips, skulle derved kunne komme med i top500 af eksisterende supercomputere, for en pris af 25.000 dollars. Samtidig bruger chippen ikke mere end 2 watt, hvilket gør den mere end almindeligt velegnet til brug i mobile enheder, og planer om indstikskort til bærbare er allerede undervejs.

Clearspeed regner med at have prototyper klar til computer producenter, ved slutningen af året. Egentlige produkter kan være på markedet inden for et år. Processoren vil blive præsenteret på Microprocessor Forum i San Jose.





Gå til bund
Gravatar #1 - peden
14. okt. 2003 11:12
Det lyder da spændende, lidt konkurrence er aldrig af vejen.
Gravatar #2 - Tomcat
14. okt. 2003 11:15
øhh? øhh?.... hvordan?
Gravatar #3 - Madhay
14. okt. 2003 11:15
Jeg kan godt se hvad jeg skal bruge den chip til, den skal sidde på mit nye graphx kort, det skal den :0)..


#2 læs:

"When it comes to market, the chip will likely be sold to consumers as a co-processor -- an add-on PCI card that works in parallel with a PC's main processor, just like an add-on graphics card. But instead of boosting graphics performance, the chip will help compute intensive math calculations.
Similar capabilities are already built into Apple's G4 and G5 Macs, which have a floating-point co-processor called AltiVec, which handles complex, data-intensive calculations for the main processor. But whereas AltiVec is four-way parallel, ClearSpeed's chip is 64-way, the company said.
"You might class it as a big evolutionary step of AltiVec," said Mike Calise, ClearSpeed's president.
The second generation of the chip will be 128-way parallel, and then 256, and so on..."

Jeg forstår det ikke :0) men det er vist noget med at den er lidt sejere til tungt data og matematik end almindelige computere.. men er det ikke hvad en almindelig computer er?
Gravatar #4 - Pernicious
14. okt. 2003 11:17
#3

Læs punkt 2: http://newz.dk/info.php

Er da ærgeligt hvis du synes det er irriterende, men hvis det er til det bedre, som du selv synes, så er det vel ikke så slemt?
Gravatar #5 - Madhay
14. okt. 2003 11:22
Ney da, det er bare hm. yeah. irriterende. jeg kan jo ikke lave om på det :0P men vil stadig gerne bidrage :0)
Gravatar #6 - bulldog
14. okt. 2003 11:25
#4

Ehmm... det link/kommentar kan jeg ikke se hvad har med #3 at gøre.. Men det sikkert ozz være det bare er mig..

Men nu kan grafikerne/programmerene begynde at lege på bærbare computere nu. Hvis man snart kan begynde at lave indstikskort til bærbare vil det kunne være en del lettere og arbejde på en bærbar nu. Eneste ulempe der stadig ligger fremme er dog problemet med at man ikke kan udvide visse komponenter fx. GFX kort. Har hvertfald ikke set nogle eksterne kort endnu.


[Edit]

Og selvfølgelig når jeg læser den første gang manglede og halvdelen af den.
Gravatar #7 - Pernicious
14. okt. 2003 11:34
#6
Madhay redigerede sit oprindelige indlæg efterfølgende, så det kan jeg godt forstå du ikke kan :)
Gravatar #8 - CRiSpY
14. okt. 2003 11:38
Lyder lidt for godt til a være sandt :)
Og hvordan i alverden har de tænkt sig at de stakkels pci porte skulle kune forsyne chippen med data nok? :>
Gravatar #9 - sKIDROw
14. okt. 2003 11:57
Ville gerne låne sådan nogle, næste gang jeg skal kompilere openoffice.. ;oD
Gravatar #10 - Mort
14. okt. 2003 12:06
#9: Indeholder openoffice da mange floating point beregninger når det kompileres ?
Gravatar #11 - Madhay
14. okt. 2003 12:08
#7 Yep, tog dit indlæg lidt som en opfordring til at lade være med at brokke mig :0)?
Gravatar #12 - Ladefoged
14. okt. 2003 12:18
Kan godt være jeg spørger dumt men hvad skal jeg (den lille forbruger) bruge alt den regne kræft til ??
Gravatar #13 - cnr
14. okt. 2003 12:21
En af min venner skrev et program i c++ der skulle simulere rentebevægelser til brug i hans speciale. Det tog 4 timer for hans 1400 mhz Thunderbird at blive færdig.

Da hans vejleder spurte om han ikke kunne prøve at gentage udregningen med forskellige parameterværdier, tror jeg nok han ønskede han havde noget i den her stil :)
Gravatar #14 - Raenil
14. okt. 2003 12:26
#7 og #11 : Hvilket bringer os til hele diskussionen om en hvorvidt det ikke burde indikeres at et indlæg er ændret. Madhay: Lad være at ændre dit indlæg - skriv et nyt istedet. Det er umuligt at følge diskussionenen..

En anden ting: 133 mb/sec på en PCI-bus og 25 Gigaflops - kommer den ikke til at mangle data til at regne på?
Gravatar #15 - kgp43
14. okt. 2003 12:40
#14; Kan det ikke lade sig gøre at hente nogle små stykker data via PCI porten, hvorefter indstikskortet bearbejder dem? Resultatet af bearbejdningen bliver herefter sendt tilbage.
Gravatar #16 - SpaZoiD
14. okt. 2003 12:48
der står at der nok først kommer produkter på markedet om 1år og så ska vi huske at lægge de opligatoriske 3-6 måneders forsinkelse oven i.. og til den tid er PCI-X jo ved at være godt ude på high-end markedet hvilket også er det marked som dette produkt er tiltænkt.. jeg ka ik se hvordan det LØSER problemet.. 25 gflops er ufatteligt meget.. og det ka selv PCI-X ikke følge med til.. men det hjælper da en del i forhold til almindelig PCI.
Gravatar #17 - ion++
14. okt. 2003 12:49
Forklaring? på hvad det her er og kan (Uden at have læst andet end den korte text som #3 citerede).

Det lyder umiddelbart som en advanceret vektor processor, andre
eksempler på det er: altivec, MMX, SSE, SSE2, og den slags. Cray
har også brugt det, og bruger det sikkert stadig.

En vektor processor er god hvis man har mange tal der skal beregnes. Det kunne være et regneark fyldt med tal, og der
skal udføres en matematisk funktion på alle de tal. Det kan
også være billeder, da billeder består af et eller flere tal
pr. pixel. Som regel er opstarts tiden knapt så hurtig, men
tilgengæld er throughput ret god, da man behandler data
parallelt. Den her laver vist 64 tal af gangen. Problemet er
at disse tal _SKAL_ være uafhængige af hinanden. Hvis de ikke
er det, så kan man ikke arbejde parallelt.

Almindelige mennesker kan bruge dette til: lyd og billed behandling.
Gravatar #18 - Snuden
14. okt. 2003 12:51
#8 og #15 Kan I sige PCI-bus? I kalder jo heller ikke en computer for en harddisk vel? :-)
Gravatar #19 - cnr
14. okt. 2003 13:02
Enig #17

Den nye DivX 5.1 pro er EKSTREM krævende på højeste kvalitetsindstilling. Selv med en overclocket processor og 3 gb båndbredde i sekundet på mit ddr 400 ram, kan jeg godt sætte 3 timer af til at lave en 2-pass komprimering af en 4 minutters musikvideo :(
Gravatar #20 - mikbund
14. okt. 2003 13:08
Tror nu dette lyder for godt til at være sandt. Mon ikke det blot er noget HOAX reklame ting? Og kun 2watt ? yep right then...

Lad os hellere vente til vi ser et reelt kort i handlen.
Gravatar #21 - ion++
14. okt. 2003 14:00
#19 Det er muligt at denne vektor cpu ikke vil gøre nogen forskel ved DIVX encoding, det kommer an på om data er uafhængige eller ej, og pt. kender jeg ikke divx codec nok til at vide hvad der vil ske.

#20 det kan meget vel passe med 2 watt, det er jo en meget specialiseret cpu.
Gravatar #22 - Dreadnought
14. okt. 2003 14:04
Hvis man regner lidt på det så lyder de 2½W ikke helt hen i skoven. 25GFLOPS / 64 ~ 390MHz plus lidt overhead. Så med 400MHz kan den nok godt leve på kun 2½W Da det ikke er en særlig kompleks processor. Til sammenligning kan tages Texas Instruments TMS320C6713-200 en 200MHz DSP som bruger typisk 1W.
Gravatar #23 - cnr
14. okt. 2003 14:15
#21

Mon ikke alle de afhængig vektore rimelig hurtig forsvinder ud af regnestykket ved en komprimering, Det må nærmest være det første sted der sættes ind.

I og med at DivX er en lossy komprimering, må de uafhængige vektore næsten også blive manipuleret.

Ikke fordi jeg vil påstå at jeg har set kildekoden til DivX, men det virker intuitivt korrekt :)
Gravatar #24 - Whoever
14. okt. 2003 14:27
#9, ROFL!!!!

Tror jeg sparer op....fra nu af.

mmmm alle de dejlige simulations programmer man nu kan lave...nøj!!
Gravatar #25 - Porthos
14. okt. 2003 14:40
#20

Lige mine ord. Det lyder sku næsten som en af BitBoys pressemeddelelser.
Jeg vil sku se nogle billeder/specs på dyret samt nogle real-life benchmarks, før jeg tror på det ikke er en and.

Vil der forresten ikke også skulle side nogen temlig syge mængder ram internt på de kort, før man kan have buffer nok til at køre den cpu ??
Jeg tænker hermed på de gerne 1-2 gb ram der sidder pr CPU i mainframes !!
Der er vel ikke meget sjovt i at den måske nok kan deltage i mainframe top 500 men kun i 0.0001 sekkund af gangen.
Gravatar #26 - T.A
14. okt. 2003 17:02
#25
nu er flops jo målt over et sek så der er min nok ram til beregningerne i dette tidsrum
Gravatar #27 - kebab-hunden
14. okt. 2003 18:02
#26

det er da noget sludder
så skal man også køre i en time før man kan sige at man kører 100 km/t ??
Gravatar #28 - faetteren
14. okt. 2003 20:16
Juuuhuuu, nu ender det snart med at jeg kan prøve det af...

Jeg snakkede sammen med en ven for en 6-7 år siden om zip / arj / ace , og hvordan man laver et pakke pogram og vi kom frem til en teoretisk muligmåde at komprimere i en faktor bestemt af brugeren, det er bare et spørgsmål om hvormange beregninger man vil lade computeren lave .... men noget med 10 GB data på en floppy kan lade sig gøre, men det vil tage år og dag for at pakke og nogle måneder at pakke ud igen..

Hvis nu man fylder en maskine med 6 PCI slots så kunne man tage en del af tiden, det ville være extremt sejt, at kunne fikse en CD ned til måske 1 MB for at sende den til en over et 56k modem, på få minutter..

Tænk at downloade nogle linux ISO'er med alm modem, og komme igang med installation inden for en halv time, sejt....
Gravatar #29 - Linto
14. okt. 2003 20:20
Har lige fået en fræk idé - jeg bygger en mini-itx med 2 af disse kort i - så bliver det sgu sjovt :)

Total lydløs uden aktiv køling, og med potent regnekraft *Sweet*
Gravatar #30 - ziphnor
14. okt. 2003 20:31
#28
Uanset tidsforbruget, tvivler jeg nu meget stærkt på at du kan få 10GB ned på en floppy! Jeg vil egentlig gerne høre hvordan i havde tænkt jer at gøre det.
Gravatar #31 - ion++
14. okt. 2003 20:47
#23 jo, det gør de måske hvis du kun ser på en frame af gangen...
Tilgengæld er der jo MASSER af frames i en film, og hvis du alligevel skal ændre i dem alle, og de ikke alle er afhængige, fx. når der skiftes scene eller kameravinkel, så kan der paralleliseres der. Ikke at jeg ved om de gør det
Gravatar #32 - doctor_dee
14. okt. 2003 21:01
Kunne forestille mig at denne type supercomputer egner sig bedst til specielt kompilerede programmer, der er skrevet til at passe ind i de 384 kb hukommelse som processoren besidder. Således skal processoren ikke have fat på main-memory så tit. Programmerne skal dog også udvise stor parallellitet og lav dependency.

Synes ligesom andre at det virker mere interresant i sammenhæng med PCI-X, og at ydelses-tallene virker lidt ekstreme. Lyder som en "massively parallel"-type processor (mange pipelines), som kan være ekstremt svær at fodre med nok instruktioner, men som teoretisk kan yde meget højt. Men i realiteten kun hvis programmerne udviser meget stor parallellitet.
Gravatar #33 - repsac
14. okt. 2003 21:26
Gung!

Det lyder voldsomt... voldsomt hvis matlab og maple vil kunne udnytte denne processor optimalt.

... det vil måske ligefrem gøre maple så hurtig så man ikke behøver at kæle på kabinettet og sige søde ting, for at den bliver færdig med at regne; bare inden for en menneskealder ;-)
Gravatar #34 - olm
14. okt. 2003 21:32
#28
Der må være en fejl i jeres teori hvis i tænker på lossless komprimering.
Man kan ikke præcist beskrive en mængde information med en mindre mængde information. Hvis 10GB kan komprimeres til 1.44MB skyldes det, at de 10GB ikke indeholder mere information end der kan være på en floppydisk. (Hvilket er meget sjældent)

Med andre ord:
Komprimering rydder op i dataene ved at fjerne gentagelser og fyld og ved at pakke dataene bedre.
Du komprimerer din frimærkesamling ved at fjerne dupletter, tage dem ud af mapperne og stable dem fint i en lille kasse.
Men på et tidspunkt kan du ikke gøre dem mindre end de er, uden at skulle ødelægge frimærkerne.
Det samme gør sig gældende med data.

Der er ganske givet komprimeringsmetoder, der er bedre end dem, vi kender, men de vil aldrig kunne komprimere uendeligt.
Gravatar #35 - grav
14. okt. 2003 23:40
#28 + #34:
Et andet argument for at den teori ikke holder er, at det bestemt ikke er computeres regnekraft der i dag sætter grænser for komprimeringseffektiviteten.
En komprimeret lydfil bliver f.eks. udpakket langt hurtigere end den bliver afviklet. Hvis det var teoretisk muligt at komprimere den mere uden at gå mere på kompromis med kvaliteten (altså non-destruktiv eller lossless komprimering/encoding), er jeg sikker på at der var et stort marked for dette ...
Gravatar #36 - GrapeWine
15. okt. 2003 06:13
#35
Selvfølgelig sætter beregningskræften i en PC grænser for hvad det er muligt, men som der ganske rigtigt pointeres i #34 er der også en veldefineret grænse for hvor meget data kan komprimeres hvis det skal være loss less!
Var dette ikke tilfældet ville alt jo i teorien kunne pakkes til 1 byte eller i yderste konsekvens 1 bit og det ville være ensbetydende med at der kun fandtes 2 forskellige filer i denne verden! Og det håber jeg da ikke er sandt *G*!
Gravatar #37 - T.A
15. okt. 2003 06:28
#27
Nej det er nu ikke noget sludder. For da flop's måles over et sek og at en udregning skal være gennemført for at tælle.

Jeg har for ikke så længe siden set et indslag fra et af de danske universiteter omkring netop PCI indstiks kort med 4 co processorer (ved ikke om det var det samme type som dem i denne artikel), men der havde de blandt andet "optimeret" SETI programmet og kunne vise en ekstremt performance boost.
Gravatar #38 - Zredna
15. okt. 2003 06:44
#25
Et regnestykke kan da sagtens tage mere end en beregning at regne ud for computeren, og der tvivler jeg altså på at den gemmer andet end det endelige facit i computerens ram.

Jeg kunne godt forestille mig at f.eks. en 3D-renderer eller et program som SETI har nogle meget lange regnestykker, som tager mange beregninger at regne ud.
Gravatar #39 - repsac
15. okt. 2003 10:44
For lige at slå det fast:
"flop" er forkortelsen for "FLoating point OPeration" -- dvs. én flop er én regneoperation udført på flydende tal (populært, "komma-tal").
(se evt. http://dict.die.net/flop/)

Det giver altså ingen mening (jf. "definitionen"/det som forkortelsen står for) at sige "denne CPU kan udføre 5 gigaflops" -- det kan alle CPU'er; bare de får tid nok... :-)

I daglig tale, bruger man dog ofte flops om antal regneoperation på ét sekund. Dvs. at det i daglig tale giver mening at sige "denne CPU kan udføre 5 gigaflops", fordi man således ilægger det betydningen at de 5 gigaflops beregnes på netop ét sekund.

Det er med andre ord et hastighedsmål -- et meget rundhåndet hastighedsmål, da ikke alle flops tager lige lang tid. Eksempelvis vil det tage længere tid at lave en potensoplyfning af et flydende tal i et anden flydende tal, end det vil tage at addere to flydende tal -- sådan generelt; det afhænger jo også af tallene.


#37:
Jeg har i øvrigt samme opfattelse som #27 (til trods for at jeg ikke ved om man ofte også ilægger flops denne betydning; det tror jeg dog næppe, selvom det vel egentlig er en ganske plausibel betragtning -- at vide hvor længe en given CPU kan udføre x flops pr. sekund).


#38:
Jeg ved ikke med 3D-rendering (kender absolut *intet* til det), men SETI-programmet må kunne drage fordel af den omtalte processor, da SETI-opgaven jo netop distribueres, hvilket gør beregningen parallel... Spørgsmålet er så blot om SETI-opgaven kræver at der ofte hentes/sendes store mængder data fra/til disk eller andet hukommelsesmedie. Det tror jeg dog ikke umiddelbart.
Gravatar #40 - T.A
15. okt. 2003 11:36
#39
God gennemgang men flops er ikke bare flop i flertal. flops betyder "FLOPS Short for floating-point operations per second" Så når man skriver Flops og ikke flop er det målt over et sek.
Ellers er vi meget enig.

kilde: www.webopedia.com.
Gravatar #41 - repsac
15. okt. 2003 17:12
#40: Hmm, jeg regnede såmænd blot med at flops var engelsk flertal...

Dvs. det hedder "1 flop", "2 flop", "3 flop", etc.

Tjah, man kan da kun blive klogere :-)
Gravatar #42 - faetteren
16. okt. 2003 17:58
#30, #34, #35 #36 Det kan godt lade sig gøre at komprimere 10 GB til en floppy. uden tab af data, jeg har snakket med en del mattematikere om dette....

nogle som havde adgang til nogle engelske super computere har bevist teorien, men det kan stadig ikke bruges i praksis...

det vil tage flere år at gøre det med 10 GB, men det kan lade sig gøre.

Du skal bare droppe de alm tanker om komprimering.

Du har på en måde ret, man kan ikke forfine ZIP metoden til at gøre det.

Men det kan lade siggøre..

Nu ved jeg ikke om jeg vil frigive hele konceptet da det jo givet vis må være en algoritme jeg kan få patent på, nu hvor man kan få patent på den slags.. He He...

jeg tvivler på at man kommer til at bruge denne metode i min livs tid, men hvis de kan blive ved med at øge regne kraften så voldsomt kan det sgu være jeg kommer til at opleve det i brug..

skummelt...

Hvis i kan komme med endegyldigt bevis på at det ikke kan lade sig gøre, tja så er min teori løgn, jeg har meget svært ved at tro... har brugt en del tid på at lege med tanken.

Det startede faktisk med at vi snakkede lidt om hvordan man kunne pakke mest muligt... da jeg fik tanken ( skal ikke kunne sige om andre ikke har tænkt den før mig, tror jeg næsten ).
grinte jeg og fortalte min kammerat at man kunne pakke hele internettet ned til diskette størrelse, jeg brugte så et par dage på at bevise min teori for ham, han har ikke kunnet mod bevise min teori..

faetteren.....
Gravatar #43 - TotalNirvana
17. okt. 2003 20:21
#42:
Der må simpelthen være et hul et eller andet sted i din teori. For som #36 også siger, så ville man ifølge din teori kunne pakke alt ned til at fylde én bit.

Jeg forstår ikke hvordan du påstår at man skulle kunne beskrive en mængde med en mindre mængde. #34's billede med frimærkesamlingen er ret godt.

Jeg kan godt se hvorfor du vil holde din teori tæt til dig hvis den virkelig er så fantastisk, men du bliver simpelthen nødt til at uddybe, hvis det du siger skal virke troværdigt.
Gå til top

Opret dig som bruger i dag

Det er gratis, og du binder dig ikke til noget.

Når du er oprettet som bruger, får du adgang til en lang række af sidens andre muligheder, såsom at udforme siden efter eget ønske og deltage i diskussionerne.

Opret Bruger Login