削除された内容 追加された内容
Ertyupoi (会話 | 投稿記録)
Ertyupoi (会話 | 投稿記録)
1,169行目:
! 理論値の計算式
|-
| nowrap | Stratix 10IV
| nowrap | 1445 GHzMHz
| nowrap | 10理論値 TFLOPS245 GFLOPS<br>実測値 171 GFLOPS
| nowrap | 理論値
| 64x64の行列のかけ算1つで128個のDSPを消費し、24.45 GFLOPS。DSP は最大1288個なので、244.5 GFLOPS。FPGAでは整数の積和算は1クロックで計算できるが、GPUとは異なり浮動小数点のかけ算は 445MHz 動作で11クロック必要<ref>[http://www.altera.co.jp/products/ip/dsp/arithmetic/m-alt-float-point.html アルテラ浮動小数点メガファンクション]</ref><ref>[http://www.altera.co.jp/literature/ug/ug_altfp_mfug.pdf 浮動小数点メガファンクション ユーザーガイド]</ref>。それに対して、GPUは1クロックで行える。
| 2 FLOP * 5000 DSP * 1 GHz = 10 TFLOPS<ref>[https://www.altera.co.jp/ja_JP/pdfs/literature/wp/wp-01222-understanding-peak-floating-point-performance-claims_j.pdf ピーク浮動小数点性能の本質 - ALTERA]</ref>。
|-
| nowrap | Stratix V
1,181行目:
| 2048 multiplyer / 64 * 49 GFLOPS (388 MHz) = 1.568 TFLOPS<ref>[https://www.altera.com/content/dam/altera-www/global/zh_CN/pdfs/literature/wp/wp-01142-teraflops.pdf Achieving One TeraFLOPS with 28nm FPGA]</ref>。単精度の乗算には 27x27 の multiplyer が単精度浮動小数点数あたり 64 個必要。
|-
| nowrap | Stratix IV10
| nowrap | 4451 MHzGHz
| nowrap | 理論値10 245 GFLOPS<br>実測値 171 GFLOPSTFLOPS
| nowrap | 理論値
| 2 FLOPFLOPS * 5000 DSP * 1 GHz = 10 TFLOPS<ref>[https://www.altera.co.jp/ja_JP/pdfs/literature/wp/wp-01222-understanding-peak-floating-point-performance-claims_j.pdf ピーク浮動小数点性能の本質 - ALTERA]</ref>。
| 64x64の行列のかけ算1つで128個のDSPを消費し、24.45 GFLOPS。DSP は最大1288個なので、244.5 GFLOPS。FPGAでは整数の積和算は1クロックで計算できるが、GPUとは異なり浮動小数点のかけ算は 445MHz 動作で11クロック必要<ref>[http://www.altera.co.jp/products/ip/dsp/arithmetic/m-alt-float-point.html アルテラ浮動小数点メガファンクション]</ref><ref>[http://www.altera.co.jp/literature/ug/ug_altfp_mfug.pdf 浮動小数点メガファンクション ユーザーガイド]</ref>。それに対して、GPUは1クロックで行える。
|}
 
1,196行目:
! 理論値の計算式
|-
| nowrap | Virtex-5 UltraScaleSX240T
|
| 1162.73952 TFLOPSGFLOPS
| 理論値
| <ref name="xilinxfpga-dspxilinx"/><ref>[http://japanwww.xilinxhpcwire.com/productshpcwire/technology2008-05-14/dsprevaluating_fpgas_for_64-bit_floating-point_calculations.html DSPRevaluating FPGAs for 64-bit Floating-Point XilinxCalculations]</ref>
|-
| nowrap | Virtex-7
| 833 GFLOPS
| 理論値
| <ref name="xilinx-dsp"/>
|-
| nowrap | Virtex-6 SX475T
1,214 ⟶ 1,208行目:
| <ref name="fpga-xilinx">[http://japan.xilinx.com/support/documentation/white_papers/j_wp375_HPC_Using_FPGAs.pdf FPGAを用いた高性能コンピューティング]</ref>
|-
| nowrap | Virtex-5 SX240T7
|
| 162.52833 GFLOPS
| 理論値
| <ref name="xilinx-dsp"/>
| <ref name="fpga-xilinx"/><ref>[http://www.hpcwire.com/hpcwire/2008-05-14/revaluating_fpgas_for_64-bit_floating-point_calculations.html Revaluating FPGAs for 64-bit Floating-Point Calculations]</ref>
|-
| nowrap | Virtex-7 UltraScale
| 1.739 TFLOPS
| 理論値
| <ref name="xilinx-dsp">[http://japan.xilinx.com/products/technology/dsp.html DSP - Xilinx]</ref>
|}