AMDがSteamroller CPUアーキテクチャを詳述:動的L2キャッシュを備えた洗練されたPiledriver

AMD

2番目に大きいx86-64チップデザイナーであるAdvanced Micro Devicesは、岩場と困難な場所の中間にあります。最近はあきらめて「ファブレス」になりましたが その所有権 GlobalFoundriesでいくらかの借金を払うために、x86の弱者は、急成長している(主にARMベースの)モバイル市場と、新しい(より小さな)プロセスノードとCPUの追求に専念するための非常に多くのリソースを持つチップジャガーノートIntelに囲まれています。テクノロジー—もう一方。さらに、ARMとIntelはどちらも、Intelのx86ベースのCPUがより小さく効率的になり、ARMのSoC(system-on-a-chip)プロセッサがより高速で機能を追加し続けるにつれて、収束点に向かっています。これは、それがAMDをどこに残すかという問題を提起します。

AMD CTOのMark Papermasterが本日のホットチップ会議で答えを出し、AMDの将来と継続的な関連性について話しました。多くの点で、基調講演は会社の意図を繰り返し表明しました APU(の成功)にその未来を賭ける—今年初めにAMD Fusion Developer Summit(AFDS)で最初に明らかにされたアイデア。 AFDSの包括的なテーマは、AMDが現状に順応しており、ハイエンドデスクトップ市場をIntelに譲歩することです。 AMDは、絶対的に最も高速なチップクラウンを求めてIntelと直接競合するのではなく、競合他社よりも最大の利点がある領域に焦点を合わせることにしました。主に、同社の要点はグラフィックス処理と異種コンピューティングアーキテクチャです。



AMDは、AFDSで次世代のKaveri APUのグラフィックス処理部分と統合アドレス空間について頻繁に話しました。ただし、今日の基調講演では、チップ設計者はSteamroller x86-64 CPUアーキテクチャについて話し合うことで、CPU側に焦点を当てました。 SteamrollerはPiledriverの後継であり、Piledriverは(今後の)VisheraデスクトッププロセッサとTrinity APUで使用されるx86-64 CPUアーキテクチャの名前です。 Steamrollerはさらに改善されます まんぐり返しの改良 元のブルドーザーアーキテクチャに合わせて、全体的な設計がはるかに効率的になりました。

ブルドーザー対Steamrollerアーキテクチャのサイズ

AMDは、コンピュータで組み立てられた設計(より自動化された設計手法)を使用することを優先して、手描きのプロセッサ回路図(すべての内部がどのように配置され相互接続されるかを定義する)を廃止しました。同社は高密度ライブラリを使用して、ロジックブロックの数を減らすことなく、最終チップの消費電力とダイ面積を30%削減することができました。 Steamrollerコアはさらに、レイテンシの削減、帯域幅の拡大、命令フェッチとパイプラインの最適化、プロセス間通信の微調整、電力効率の向上、動的にサイズ設定された(共有)L2キャッシュを誇っています。簡単に言うと、SteamrollerはPiledriver 2.0です。これは、処理と電力効率を考慮して少し調整されたPiledriverアーキテクチャです。



命令フェッチの前面では、Steamrollerは大幅に改良されており、CPUコア(モジュール)にデータを供給し続けることができるため、ある程度のパフォーマンスの向上が期待できます。たとえば、分岐予測エラーを20%削減し、キャッシュミスを30%削減します。さらに、Steamrollerの浮動小数点(FP)スケジューラーは引き続き2つのCPUモジュール(コア)間で共有されます。 2つの128ビットFMAC(ヒューズ-乗算-加算機能)ユニットを備えていますが、MMXユニットは1つしかありませんが、Piledriverの2つのMMXユニットとは異なります。 AMDは、この変更は変化するコンピューティング状況に対応するものであり、MMXユニットを削除することで、パフォーマンスに大きな影響を与えずにダイスペースを再利用できると述べています。

AMD Steamroller命令フェッチの改善

特にAMD APUでSteamroller CPUコアを使用すると、さらなる省電力機能を実現できます。つまり、チップは現在のワークロードに応じてクロック速度を動的に調整できます(結果として電力使用量も調整できます)。 CPUがほとんどアイドル状態でGPUのみに負荷がかかっている場合(たとえば、ハードウェアアクセラレーションされたH.264エンコードされた映画を視聴している場合)、クロック速度を上げる(必要に応じて)とともに、使用可能な電力の大部分をGPUに割り当てることができます。 AMDのTurbo Coreテクノロジーのおかげで、定格TDPになっています(デフォルトではまだ何も言われていないか、クロック速度が向上しています)。



AMDは、毎年数百万台のモバイルデバイスが販売されており、人々がますますインターネットを利用してデータを保存および処理しているため、電力効率の高いプロセッサーの重要性と必要性​​を認識しています。 大規模な冷却主要な運用費用になる可能性があります。 AMDが会社の将来をAPUテクノロジーに基づいてスマートに賭けたかどうかはまだ分からないが、Steamrollerコアは表にいくつかの有望な改善をもたらし、会社がHSAを導入するという目標を実現するのに役立つ可能性がある。 -今(結果として会社の競争力を維持します)。

についてもっと読む AMDの異種システムアーキテクチャ

Copyright © 全著作権所有 | 2007es.com