FPGA आधारित तंत्रिका नेटवर्क त्वरक outperforms GPUs
इसे आठ-बिट पूर्णांक रिज़ॉल्यूशन का उपयोग करके एक GoogLeNet Inception-v1 CNN के रूप में प्रदर्शित किया गया था। इसने 16.8 टेरा संचालन प्रति सेकंड (TOPS) हासिल किया और एक Xilinx Virtex UltraScale + XCVU9P-3 fpga पर प्रति सेकंड 5,300 से अधिक छवियों का अनुमान लगा सकता है। मॉड्यूलर, स्केलेबल दृष्टिकोण, यह किनारे पर और क्लाउड में ऑब्जेक्ट डिटेक्शन और वीडियो प्रोसेसिंग अनुप्रयोगों के लिए उपयुक्त बनाता है, फॉसेट को समझाया गया है, साथ ही डेटा सेंटरों और बुद्धिमान कैमरों में प्रवेश के लिए भी।
डीपीयू को समानांतर डीएसपी आर्किटेक्चर, वितरित मेमोरी और विभिन्न एल्गोरिदम के लिए तर्क और कनेक्टिविटी की पुन: योग्यता का उपयोग करके मशीन सीखने के अनुप्रयोगों में तंत्रिका नेटवर्क टोपोलॉजी के लिए इष्टतम गणना प्रदर्शन प्रदान करने के लिए कॉन्फ़िगर किया जा सकता है।
DPU किसी भी प्रतिस्पर्धा CNNs की तुलना में 50% से अधिक उच्च प्रदर्शन प्राप्त करता है और किसी दिए गए पावर या लागत बजट के लिए GPU का प्रदर्शन करता है, कंपनी का दावा है। "Fpga एक विश्व-धड़कन मंच और वास्तुकला है, जो भविष्य में प्रूफिंग के लिए बहुत लचीला है और कम विलंबता के साथ AI में GPU को बेहतर बना सकता है," Fawcett जोड़ा।
कंपनी ने यह भी घोषणा की है कि यह fpgas के गहन शिक्षण त्वरण को लागू करने के लिए तकनीक का अध्ययन करने के लिए ऑक्सफोर्ड विश्वविद्यालय में एक DPhil (PhD0) को प्रायोजित कर रहा है। यह काम Omnitek के स्वयं के अनुसंधान के साथ AI कंप्यूट इंजन और एल्गोरिदम के सहयोग से होगा।
