2018-11-20から1日間の記事一覧

Cuda C を用いた並列リダクションの実装と高速化

最近, cuda C を使う機会が多くて, リファレンスを探すのに苦労したので, そのメモです。 この記事は, atomicAdd 関数の自作 並列リダクションの実装 ベクトル化による高速化(あまり効果はなかった) 複素数の場合 高速化の結果 という流れです。 atomicAdd …