ქეისის ბანერი

ინდუსტრიის სიახლეები: ჯიმ კელერმა გამოუშვა ახალი RISC-V ჩიპი

ინდუსტრიის სიახლეები: ჯიმ კელერმა გამოუშვა ახალი RISC-V ჩიპი

ჯიმ კელერის ხელმძღვანელობით ჩიპების კომპანია Tenstorrent-მა გამოუშვა თავისი შემდეგი თაობის Wormhole პროცესორი ხელოვნური ინტელექტის ჩატვირთვისთვის, რომელიც მოელის კარგ შესრულებას ხელმისაწვდომ ფასად.კომპანია ამჟამად გვთავაზობს ორ დამატებით PCIe ბარათს, რომლებშიც შეიძლება განთავსდეს ერთი ან ორი Wormhole პროცესორი, ასევე TT-LoudBox და TT-QuietBox სამუშაო სადგურები პროგრამული უზრუნველყოფის დეველოპერებისთვის. ყველა დღევანდელი განცხადება მიზნად ისახავს დეველოპერებს და არა მათ, ვინც იყენებს Wormhole დაფებს კომერციული დატვირთვისთვის.

„ყოველთვის სასიხარულოა ჩვენი პროდუქტების მეტი დეველოპერების ხელში მოხვედრა. ჩვენი Wormhole™ ბარათების გამოყენებით განვითარების სისტემების გამოშვება შეუძლია დეველოპერებს დაეხმაროს მრავალჩიპიანი ხელოვნური ინტელექტის პროგრამული უზრუნველყოფის მასშტაბირებაში და განვითარებაში,” - თქვა ჯიმ კელერმა, Tenstorrent-ის აღმასრულებელმა დირექტორმა.გარდა ამ გაშვებისა, ჩვენ აღფრთოვანებული ვართ, რომ ვხედავთ პროგრესს, რომელსაც ვაღწევთ ჩვენი მეორე თაობის პროდუქტის, Blackhole-ის ლენტის გამორთვით და გააქტიურებით.

1

თითოეული Wormhole პროცესორი შეიცავს 72 Tensix ბირთვს (მათგან ხუთი მხარს უჭერს RISC-V ბირთვს მონაცემთა სხვადასხვა ფორმატში) და 108 MB SRAM, რომელიც უზრუნველყოფს 262 FP8 TFLOPS 1 გჰც სიხშირით 160 ვტ თერმული დიზაინის სიმძლავრით. ერთჩიპიანი Wormhole n150 ბარათი აღჭურვილია 12 GB GDDR6 ვიდეო მეხსიერებით და აქვს გამტარუნარიანობა 288 გბ/წმ.

Wormhole პროცესორები უზრუნველყოფენ მოქნილ მასშტაბურობას სამუშაო დატვირთვის სხვადასხვა საჭიროებების დასაკმაყოფილებლად. სტანდარტულ სამუშაო სადგურში ოთხი Wormhole n300 ბარათით, პროცესორები შეიძლება გაერთიანდეს ერთ ერთეულში, რომელიც გამოჩნდება პროგრამულ უზრუნველყოფაში, როგორც ერთიანი, ფართო Tensix ძირითადი ქსელი. ეს კონფიგურაცია საშუალებას აძლევს ამაჩქარებელს გაუმკლავდეს იგივე დატვირთვას, გაყოს ოთხ დეველოპერს შორის ან ერთდროულად აწარმოოს რვა განსხვავებული AI მოდელი. ამ მასშტაბურობის მთავარი მახასიათებელია ის, რომ მას შეუძლია ადგილობრივად იმუშაოს ვირტუალიზაციის საჭიროების გარეშე. მონაცემთა ცენტრის გარემოში, Wormhole პროცესორები გამოიყენებენ PCIe-ს გაფართოებისთვის აპარატის შიგნით, ან Ethernet-ს გარე გაფართოებისთვის.

შესრულების თვალსაზრისით, Tenstorrent-ის ერთ-ჩიპიანი Wormhole n150 ბარათი (72 Tensix ბირთვი, 1 გჰც სიხშირე, 108 MB SRAM, 12 GB GDDR6, 288 გბ/წმ სიჩქარეს) მიაღწია 262 FP8 TFLOPS 160W30, 160W30, ხოლო the (128 Tensix ბირთვი, 1 გჰც სიხშირე, 192 MB SRAM, გაერთიანებული 24 GB GDDR6, 576 GB/s გამტარუნარიანობა) უზრუნველყოფს 466 FP8 TFLOPS-მდე 300 ვტ-ზე.

466 FP8 TFLOPS-ის 300 ვატი კონტექსტში რომ ჩავდოთ, ჩვენ შევადარებთ იმას, რასაც AI ბაზრის ლიდერი Nvidia გვთავაზობს ამ თერმული დიზაინის სიმძლავრით. Nvidia-ს A100 არ უჭერს მხარს FP8-ს, მაგრამ მხარს უჭერს INT8-ს, მაქსიმალური ეფექტურობით 624 TOPS (1,248 TOPS, როცა იშვიათია). შედარებისთვის, Nvidia-ს H100 მხარს უჭერს FP8-ს და აღწევს პიკს 1,670 TFLOPS 300 ვტ-ზე (3,341 TFLOPS იშვიათად), რაც მნიშვნელოვნად განსხვავდება Tenstorrent-ის Wormhole n300-ისგან.

თუმცა, არის ერთი მთავარი პრობლემა. Tenstorrent's Wormhole n150 იყიდება 999 დოლარად, ხოლო n300 1399 დოლარად. შედარებისთვის, ერთი Nvidia H100 გრაფიკული ბარათი იყიდება 30,000 დოლარად, რაოდენობის მიხედვით. რა თქმა უნდა, ჩვენ არ ვიცით, შეუძლია თუ არა ოთხ ან რვა Wormhole პროცესორს ერთი H300-ის შესრულება, მაგრამ მათი TDP არის 600W და 1200W შესაბამისად.

ბარათების გარდა, Tenstorrent გთავაზობთ წინასწარ ჩაშენებულ სამუშაო სადგურებს დეველოპერებისთვის, მათ შორის 4 n300 ბარათს უფრო ხელმისაწვდომ Xeon-ზე დაფუძნებულ TT-LoudBox-ში აქტიური გაგრილებით და მოწინავე TT-QuietBox EPYC-ზე დაფუძნებული Xiaolong) თხევადი გაგრილების ფუნქციით).


გამოქვეყნების დრო: ივლის-29-2024