ჯიმ კელერის ხელმძღვანელობით ჩიპების მწარმოებელმა კომპანია Tenstorrent-მა ხელოვნური ინტელექტის სამუშაო დატვირთვებისთვის განკუთვნილი ახალი თაობის Wormhole პროცესორი გამოუშვა, რომელიც, მათი ვარაუდით, კარგ შესრულებას შესთავაზებს ხელმისაწვდომ ფასად.კომპანია ამჟამად გთავაზობთ ორ დამატებით PCIe ბარათს, რომლებზეც შესაძლებელია ერთი ან ორი Wormhole პროცესორის განთავსება, ასევე TT-LoudBox და TT-QuietBox სამუშაო სადგურებს პროგრამული უზრუნველყოფის დეველოპერებისთვის. დღევანდელი ყველა განცხადება მიმართულია დეველოპერებისთვის და არა მათთვის, ვინც Wormhole დაფებს კომერციული სამუშაო დატვირთვებისთვის იყენებს.
„ყოველთვის სასიამოვნოა, როდესაც ჩვენი პროდუქტების მეტი ნაწილი დეველოპერებს ხვდებათ ხელში. ჩვენი Wormhole™ ბარათების გამოყენებით გამოშვების შემუშავების სისტემები დაეხმარება დეველოპერებს მრავალჩიპიანი ხელოვნური ინტელექტის პროგრამული უზრუნველყოფის გაფართოებასა და შემუშავებაში“, - განაცხადა Tenstorrent-ის აღმასრულებელმა დირექტორმა ჯიმ კელერმა.ამ გამოშვებასთან ერთად, ჩვენ აღფრთოვანებულები ვართ იმ პროგრესით, რომელსაც ჩვენი მეორე თაობის პროდუქტის, Blackhole-ის, ფირის გამოშვებისა და გაძლიერების კუთხით მივაღწიეთ.“

თითოეული Wormhole პროცესორი შეიცავს 72 Tensix ბირთვს (რომელთაგან ხუთი მხარს უჭერს RISC-V ბირთვებს სხვადასხვა მონაცემთა ფორმატში) და 108 მბ SRAM-ს, რაც უზრუნველყოფს 262 FP8 TFLOPS-ს 1 გჰც სიხშირეზე, 160 ვატიანი თერმული სიმძლავრით. ერთჩიპიანი Wormhole n150 ბარათი აღჭურვილია 12 გბ GDDR6 ვიდეო მეხსიერებით და აქვს 288 გბ/წმ გამტარუნარიანობა.
Wormhole პროცესორები უზრუნველყოფენ მოქნილ მასშტაბირებას, რათა დააკმაყოფილონ სამუშაო დატვირთვების მრავალფეროვანი საჭიროებები. სტანდარტულ სამუშაო სადგურში, რომელსაც აქვს ოთხი Wormhole n300 ბარათი, პროცესორების გაერთიანება შესაძლებელია ერთ ერთეულში, რომელიც პროგრამულ უზრუნველყოფაში წარმოდგენილია, როგორც ერთიანი, ფართო Tensix ბირთვული ქსელი. ეს კონფიგურაცია საშუალებას აძლევს ამაჩქარებელს გაუმკლავდეს ერთსა და იმავე სამუშაო დატვირთვას, გადანაწილდეს ოთხ დეველოპერზე ან ერთდროულად გაუშვას რვა სხვადასხვა ხელოვნური ინტელექტის მოდელი. ამ მასშტაბირების მთავარი მახასიათებელია ის, რომ მას შეუძლია ლოკალურად მუშაობა ვირტუალიზაციის საჭიროების გარეშე. მონაცემთა ცენტრის გარემოში, Wormhole პროცესორები გამოიყენებენ PCIe-ს მანქანის შიგნით გაფართოებისთვის, ან Ethernet-ს გარე გაფართოებისთვის.
რაც შეეხება მუშაობას, Tenstorrent-ის ერთჩიპიან Wormhole n150 დაფას (72 Tensix ბირთვი, 1 GHz სიხშირე, 108 MB SRAM, 12 GB GDDR6, 288 GB/s გამტარობა) 160 ვატზე 262 FP8 TFLOPS-ს მიაღწია, ხოლო ორჩიპიან Wormhole n300 დაფას (128 Tensix ბირთვი, 1 GHz სიხშირე, 192 MB SRAM, აგრეგირებული 24 GB GDDR6, 576 GB/s გამტარობა) 300 ვატზე 466 FP8 TFLOPS-ს მიაღწია.
466 FP8 TFLOPS-ის 300 ვატიანი პროცესორის კონტექსტში განსახილველად, ჩვენ მას შევადარებთ ხელოვნური ინტელექტის ბაზრის ლიდერ Nvidia-ს მიერ შემოთავაზებული თერმული დიზაინის სიმძლავრის მაჩვენებლებს. Nvidia-ს A100 არ უჭერს მხარს FP8-ს, მაგრამ მხარს უჭერს INT8-ს, პიკური წარმადობით 624 TOPS (1,248 TOPS sparse რეჟიმში). შედარებისთვის, Nvidia-ს H100 მხარს უჭერს FP8-ს და აღწევს პიკურ წარმადობას 1,670 TFLOPS 300 ვატზე (3,341 TFLOPS sparse რეჟიმში), რაც მნიშვნელოვნად განსხვავდება Tenstorrent-ის Wormhole n300-ისგან.
თუმცა, არსებობს ერთი მთავარი პრობლემა. Tenstorrent-ის Wormhole n150-ის საცალო ფასი 999 დოლარია, ხოლო n300-ის - 1399 დოლარი. შედარებისთვის, ერთი Nvidia H100 ვიდეო ბარათის ფასი, რაოდენობიდან გამომდინარე, 30 000 დოლარია. რა თქმა უნდა, ჩვენ არ ვიცით, შეუძლია თუ არა ოთხ თუ რვა Wormhole პროცესორს ერთი H300-ის მუშაობის უზრუნველყოფა, მაგრამ მათი TDP შესაბამისად 600 ვატი და 1200 ვატია.
ბარათების გარდა, Tenstorrent დეველოპერებისთვის წინასწარ აწყობილ სამუშაო სადგურებს სთავაზობს, მათ შორის 4 n300 ბარათს უფრო ხელმისაწვდომ Xeon-ზე დაფუძნებულ TT-LoudBox-ში აქტიური გაგრილებით და გაუმჯობესებულ TT-QuietBox-ში EPYC-ზე დაფუძნებული Xiaolong-ის თხევადი გაგრილების ფუნქციით.
გამოქვეყნების დრო: 2024 წლის 29 ივლისი