Ο επιταχυντής νευρωνικού δικτύου που βασίζεται σε FPGA ξεπερνά τις GPU
Παρουσιάστηκε ως CNN ΧρήσηςNet Inception-v1, χρησιμοποιώντας ανάλυση οκτώ-ακέραιων αριθμών. Έχει επιτύχει 16,8 terra λειτουργίες ανά δευτερόλεπτο (TOPS) και μπορεί να συμπεράνει πάνω από 5.300 εικόνες ανά δευτερόλεπτο σε ένα Xilinx Virtex UltraScale + XCVU9P-3 fpga. Η αρθρωτή, κλιμακωτή προσέγγιση, το καθιστά κατάλληλο για εφαρμογές ανίχνευσης αντικειμένων και επεξεργασίας βίντεο στην άκρη και στο σύννεφο, εξήγησε ο Fawcett, καθώς και για συμπεράσματα σε κέντρα δεδομένων και ευφυείς κάμερες.
Το DPU μπορεί να διαμορφωθεί έτσι ώστε να παρέχει τη βέλτιστη υπολογιστική απόδοση για τοπολογίες νευρωνικών δικτύων σε εφαρμογές μηχανικής μάθησης, χρησιμοποιώντας την παράλληλη αρχιτεκτονική DSP, κατανεμημένη μνήμη και επαναπροσδιορισμό λογικής και συνδεσιμότητας για διαφορετικούς αλγόριθμους.
Η DPU επιτυγχάνει πάνω από 50% υψηλότερες επιδόσεις από ό, τι τα ανταγωνιστικά CNN και αποδίδει GPUs για έναν συγκεκριμένο προϋπολογισμό εξουσίας ή κόστους, ισχυρίζεται η εταιρεία. "Το fpga είναι μια πλατφόρμα και αρχιτεκτονική, που είναι πολύ ευέλικτη για μελλοντική προστασία και μπορεί να ξεπεράσει τις GPU σε AI, με χαμηλότερη καθυστέρηση", πρόσθεσε ο Fawcett.
Η εταιρεία έχει επίσης ανακοινώσει ότι χορηγεί ένα DPhil (PhD0 στο Πανεπιστήμιο της Οξφόρδης για να μελετήσει τεχνικές για την εφαρμογή επιτάχυνσης της βαθιάς εκμάθησης στο fpgas.) Η εργασία θα γίνει σε συνεργασία με την έρευνα της Omnitek για υπολογιστές και αλγόριθμους υπολογιστών.
