パソコン関係の記事を書いています。
コメントお待ちしております。
×
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
先日といってもだいぶ前になりますが、11月11日にAMDからBulldozerアーキテクチャの新CPU FXシリーズが発売されましたね。
各所でベンチマークが出ていますが、最上位のFX-8150はIntelのCore i7 2600に対してシングルスレッドで3分の2、マルチスレッドでも1割引きくらいの性能です。
旧世代のPhenom II X6 1100Tに対しても互角くらいで買ったり負けたりの性能です。
消費電力は、アイドル状態でこそi7 2600並で、X6 1100Tよりも10Wほど少ないですが、最大負荷時はi7 2600より80Wほど、X6 1100Tより30Wほども多く消費します。
期待はずれな出来に見えるBulldozerですが、パフォーマンスが悪い理由を調べてみるといくつかの要因が見つかります。
1.Bulldozerアーキテクチャへの最適化が不十分
2.コア間の帯域増と引き換えにレイテンシが増加
3.L1キャッシュが減少
4.CPUの重要部分を自動ツールにより設計
5.発熱が多くTurboCoreが十分働かない
Bulldozerは、1つのモジュールに2つの整数演算ユニットと1つの浮動小数点ユニットを持ち、フェッチ/デコードは共有という従来のCPUと異なるアーキテクチャをとっています。
このため、従来のCPU向けに作られたアプリケーションではパフォーマンスが十分発揮できないと見られています。
コア間の帯域が増えているもののレイテンシが増加しているため、特にゲームなど一部のアプリケーションでパフォーマンスが低下しているそうです。
BulldozerのL1キャッシュは、L1 DATAが整数演算ユニットごとに16KB、L1 Instがモジュールごとに64KBという構成になっています。
PhenomIIではコアごとにL1 DATA、L1 Instともに64KBあったので、減少していることになります。
AMDの技術者だったCliff A. Maier氏の話によると、Bulldozerは性能に直結する様々な部位を自動設計ツールで設計しており、開発期間の短縮と引き換えに20%遅く、20%大きなダイになったそうです。
Bulldozerは高クロックなためか発熱が多く、高負荷な処理をマルチスレッドで行うと、TurboCoreが十分働かないことが少なくないようです。
これも額面通りの性能が出ない一因となっています。
Bulldozerが遅い理由としては以上のようなところらしいです。
しかし、理由を知れば次のようにいくつか希望も見えてきます。
1.改良と最適化を進め、アプリケーションの最適化も進めばパフォーマンスを発揮できるようになる
2.設計を手作業で最適化していくことで、最大25%の高速化が見込め、ダイ縮小により省電力化と歩留まりの向上も期待できる
3.プロセスが成熟してくればより高クロック化できる
12年第3四半期に登場が予定されているBulldozer後継のPiledriverを使用したVisheraに期待ですね。
・2012.1.21追記
Windows7以降用の2つの最適化パッチ(KB2645594、KB2646060)がマイクロソフトより公開されました。
海外サイト(VR-ZONE)に検証が載っています。
各所でベンチマークが出ていますが、最上位のFX-8150はIntelのCore i7 2600に対してシングルスレッドで3分の2、マルチスレッドでも1割引きくらいの性能です。
旧世代のPhenom II X6 1100Tに対しても互角くらいで買ったり負けたりの性能です。
消費電力は、アイドル状態でこそi7 2600並で、X6 1100Tよりも10Wほど少ないですが、最大負荷時はi7 2600より80Wほど、X6 1100Tより30Wほども多く消費します。
期待はずれな出来に見えるBulldozerですが、パフォーマンスが悪い理由を調べてみるといくつかの要因が見つかります。
1.Bulldozerアーキテクチャへの最適化が不十分
2.コア間の帯域増と引き換えにレイテンシが増加
3.L1キャッシュが減少
4.CPUの重要部分を自動ツールにより設計
5.発熱が多くTurboCoreが十分働かない
Bulldozerは、1つのモジュールに2つの整数演算ユニットと1つの浮動小数点ユニットを持ち、フェッチ/デコードは共有という従来のCPUと異なるアーキテクチャをとっています。
このため、従来のCPU向けに作られたアプリケーションではパフォーマンスが十分発揮できないと見られています。
コア間の帯域が増えているもののレイテンシが増加しているため、特にゲームなど一部のアプリケーションでパフォーマンスが低下しているそうです。
BulldozerのL1キャッシュは、L1 DATAが整数演算ユニットごとに16KB、L1 Instがモジュールごとに64KBという構成になっています。
PhenomIIではコアごとにL1 DATA、L1 Instともに64KBあったので、減少していることになります。
AMDの技術者だったCliff A. Maier氏の話によると、Bulldozerは性能に直結する様々な部位を自動設計ツールで設計しており、開発期間の短縮と引き換えに20%遅く、20%大きなダイになったそうです。
Bulldozerは高クロックなためか発熱が多く、高負荷な処理をマルチスレッドで行うと、TurboCoreが十分働かないことが少なくないようです。
これも額面通りの性能が出ない一因となっています。
Bulldozerが遅い理由としては以上のようなところらしいです。
しかし、理由を知れば次のようにいくつか希望も見えてきます。
1.改良と最適化を進め、アプリケーションの最適化も進めばパフォーマンスを発揮できるようになる
2.設計を手作業で最適化していくことで、最大25%の高速化が見込め、ダイ縮小により省電力化と歩留まりの向上も期待できる
3.プロセスが成熟してくればより高クロック化できる
12年第3四半期に登場が予定されているBulldozer後継のPiledriverを使用したVisheraに期待ですね。
・2012.1.21追記
Windows7以降用の2つの最適化パッチ(KB2645594、KB2646060)がマイクロソフトより公開されました。
海外サイト(VR-ZONE)に検証が載っています。
PR
この記事にコメントする
管理人より
パソコン関係の記事を書いています。
ブログ内検索
最新記事
(05/13)
(02/04)
(01/28)
(01/25)
(01/21)
(01/14)
カレンダー
11 | 2024/12 | 01 |
S | M | T | W | T | F | S |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
カテゴリー
アーカイブ
最新TB
プロフィール
HN:
クロ
性別:
男性
自己紹介:
ある夏の日、パソコンを買い換えようと下調べを始め、BTOパソコンに興味を持つ。最近の興味は専ら自作とノートパソコン。
リンク