Radeon + C++AMPでDNNやろうとしてんだけど、前提となる行列計算がなかなか早くなんないな
メーカー公表値通りなら6TFlopsでなきゃならないところが0.8TFlopsしか出ず(大きな最適化はしていない)、こっから最適化してもせいぜい2倍が限度の気がしてしまう
GeForceを買ってもやっぱ素人が書いたコードじゃ早くなんないのかな?
レス:1-200 201-400 401-600 601-800 801-1000 ALL
このスレへの固定リンク: http://5chb.net/r/tech/1498493352/
![]() ![]() ![]() |
---|
13:26:00 up 10:34, 1 user, load average: 78.98, 77.86, 76.92
in 0.071398019790649 sec
@0.071398019790649@0b7 on 091302 |