AMDはビットコインマイニングでNvidiaを破壊しますが、ギャップを埋めることはできますか?

Nvidiaのロゴ

ゲームに関連するGPUのパフォーマンスを通常フォローしているが、ビットコインマイニングに興味を持っている場合は、AMD GPUが市場で競合しないパフォーマンスリーダーであるという事実に気づき、驚いたことでしょう。これは、AMDのHD 7000シリーズがNvidiaのGK104 / GeForce 600製品ファミリーに対して防御的なゲームを行っているPCグラフィックスビジネスとはまったく対照的です。ビットコインマイニングでは、状況はほぼ完全に逆転します。Radeon7970は550MHash /秒の能力がありますが、GTX 680は約1/5の速度です。

Bitcoin Wikiにある記事があります。 説明しようとする試み 違いはありますが、元の作品は2010〜2011年に作成され、それ以降更新されていません。これは、FermiとAMDのVLIWアーキテクチャを参照しており、AMDのパフォーマンスが向上するのは、同等のNvidiaカードよりもはるかに多くのシェーダーコアがあるためであることを示しています。これは正確ではなく、なぜGTX 680なのか説明していません GTX 580よりも実際には遅い コアがはるかに多いにもかかわらず、BTCマイニングで。この記事では、違いを説明し、より優れたCUDAマイナーがAMDとNvidiaの間のパフォーマンスデルタを劇的にシフトするかどうかに対処し、NvidiaのGPGPUパフォーマンスが最近のAMDに一般的に匹敵するかどうかに触れます。



トピック ない ここで説明する内容は次のとおりです。



  • 投資機会
  • ASICかどうか、到着したとき 来月この夏、将来的にはGPU鉱業市場を破壊するでしょう。

これらは重要な質問ですが、この記事の焦点では​​ありません。我々 意志 AMDとNvidiaのマイニングパフォーマンスの比較に影響を与えるため、電力効率とMhash /ワットについてある程度説明します。

鉱業のメカニズム

ビットコインマイニングは、SHA2-256アルゴリズムの特定の実装です。 AMDカードがマイニングで優れている理由の1つは、会社のGPUに整数パフォーマンスを向上させる多くの機能があるためです。これは実際には奇妙なことです。テクスチャは半分(FP16)または完全(FP32)の精度で格納されるため、GPUワークロードは歴史的に浮動小数点負荷が高くなっています。



NvidiaがCUDAを推進し始めたとき、カードの主要な強みとしてパスワードクラッキングを強調したという事実によって、問題はさらに混乱します。 G80以降のGeForce GPUがCPUよりもはるかに高い暗号化パフォーマンスを提供したことは事実ですが、AMDのハードウェアはNvidiaの 水から。

AMDカードがBTCマイニングで対応するNvidiaに勝る最初の理由(そして現在のビットコインエントリは これをカバー)は、SHA-256アルゴリズムが32ビット整数の右回転演算を利用するためです。これは、整数値がシフトされることを意味します(説明はこちら)、ただし欠落しているビットは値に再接続されます。右ローテーションでは、右から落ちたビットが左に再接続されます。 AMD GPUは、この操作を1つのステップで実行できます。 GTX Titanの発売前は、Nvidia GPUには3つのステップ(2つのシフトと追加)が必要でした。

NvidiaがCompute Capability 3.5(GTX TitanおよびTesla K20 / K20Xでのみサポートされています)で導入された機能の1つがファンネルシフターであるため、「Titanより前」と言います。ファンネルシフターは操作を組み合わせることができ、3サイクルのペナルティNvidiaを大幅に削減できます。これはGK110がGK104を超えた唯一の改善ではないため、一時的にどの程度パフォーマンスが改善されるかを見ていきます。 GK110は、SMXごとに最大64の32ビット整数シフトにも対応しています(Titanには14のSMXがあります)。対照的に、GK104はSMXごとに32の整数シフトしか処理できず、SMXブロックは8つしかありませんでした。



ケプラー指導機能

CC 3.0とCC 3.5の32ビット整数シフト機能の違いを強調しました。

AMDは物事を果たしています 胸に近い Graphics Core Next(GCN)の32ビット整数機能に関しては、GCNが倍精度浮動小数点と同じレートでINT32コードを実行することを確認しています。これは、CUあたりクロックあたり64の理論的なピークint32ディスパッチレート、つまりGK104の基本レートの2倍を意味します。ただし、AMDのその他の利点は、1つのGPUを構成する計算ユニット(CU)の数が非常に多いことです。私たちが言ったように、タイタンは、HD 7970の32 CUと比較して14のSMXを持っています。コンピューティングユニット/ SMXは、これらのコンテキストでのコアの総数よりもはるかに重要です。

Copyright © 全著作権所有 | 2007es.com