パソコン関係の記事を書いています。
コメントお待ちしております。
×
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
■クロック周波数
「Hz(ヘルツ)」で表記され、CPUが1秒間に何回動作するかを表しています。
「G(Giga、ギガ)」というのは接頭辞で、10の9乗を表します。
クロック周波数は簡単にいえば計算速度です。
ただし、1回の計算で出来る仕事の量はCPUの設計によって変わるので、必ずしもクロック周波数の高さが処理能力の高さとは言えません。
それでも設計の同じCPU同士ならクロック周波数で処理能力を比べることができます。
■バススピード
FSB(Front Side Bus)、HT(Hyper Transport)、QPI(Intel QuickPath Interconnect)、DMI(Direct Media Interface)が主にあります。
細かいことは抜きにして、データを運ぶ速度を表しています。
これが高いほどデータのやり取りが速くなり、高速なCPUといえます。
ただ、FSBが使われなくなった現在ではあまり気にすることのない数字です。
■キャッシュ
動作を高速化するためにデータを一時的に置いておく非常に高速なメモリです。
1次、2次、3次と階層化されています。
基本的に多いほど高速なCPUと言えます。
しかし、基本的に容量が増えるほどレイテンシが大きくなるため、一概に多いほどいいとは言えません。
ちなみに容量は、大 HDD>メインメモリ>L3>L2>L1 小
速度は、高 L1>L2>L3>メインメモリ>HDD 低
■TDP(Thermal Design Power)
設計上の最大放熱量を表し、消費電力や発熱の目安になります。
厳密にはイコールではありませんが、基本的に低いほど低発熱省電力なCPUです。
■Hyper Threding Technology
1つのコアを仮想的に2つのコアとして扱う機能です。
コアは処理中でもすべての機能を使っているわけではないため、その暇な部分を利用して1つのコアで2つの処理を同時に行います。
処理によりますが、最大20%ほどのパフォーマンスUPが期待できます。
Windows XPまではHTをOFFにしたほうがパフォーマンスに優れる場面もありましたが、Windows7ではHTをうまく扱えるようになったため特にOFFにする必要はないそうです。
■マルチコアCPU
複数の演算ユニット(コア)を複数搭載したCPUのことです。
複数のコアを搭載することで、複数の作業を同時に行なってもリソースの競合を起こしにくいため、複数同時作業が快適に行えます(例:ウイルススキャンをしながら作業)。
また、マルチコアCPUに最適化されたソフトもあり、そういったソフトでは理論上コア数に比例した速度で処理することができます(例:動画エンコード、RAW現像)。
ただし、オーバーヘッドが生じるため、マルチコアに最適されたソフトでもコア数に比例せず、2コアなら1.8倍程度の高速化にとどまります。
世の中の多くのソフトは依然としてシングルスレッド処理が中心のため、多くの人は2コアあれば不足を感じることはあまりありません。
1つならシングルコア、2つならデュアルコア、3つならトリプルコア、4つならクアッドコア、6つならヘキサコアと呼ばれます。
「Hz(ヘルツ)」で表記され、CPUが1秒間に何回動作するかを表しています。
「G(Giga、ギガ)」というのは接頭辞で、10の9乗を表します。
クロック周波数は簡単にいえば計算速度です。
ただし、1回の計算で出来る仕事の量はCPUの設計によって変わるので、必ずしもクロック周波数の高さが処理能力の高さとは言えません。
それでも設計の同じCPU同士ならクロック周波数で処理能力を比べることができます。
■バススピード
FSB(Front Side Bus)、HT(Hyper Transport)、QPI(Intel QuickPath Interconnect)、DMI(Direct Media Interface)が主にあります。
細かいことは抜きにして、データを運ぶ速度を表しています。
これが高いほどデータのやり取りが速くなり、高速なCPUといえます。
ただ、FSBが使われなくなった現在ではあまり気にすることのない数字です。
■キャッシュ
動作を高速化するためにデータを一時的に置いておく非常に高速なメモリです。
1次、2次、3次と階層化されています。
基本的に多いほど高速なCPUと言えます。
しかし、基本的に容量が増えるほどレイテンシが大きくなるため、一概に多いほどいいとは言えません。
ちなみに容量は、大 HDD>メインメモリ>L3>L2>L1 小
速度は、高 L1>L2>L3>メインメモリ>HDD 低
■TDP(Thermal Design Power)
設計上の最大放熱量を表し、消費電力や発熱の目安になります。
厳密にはイコールではありませんが、基本的に低いほど低発熱省電力なCPUです。
■Hyper Threding Technology
1つのコアを仮想的に2つのコアとして扱う機能です。
コアは処理中でもすべての機能を使っているわけではないため、その暇な部分を利用して1つのコアで2つの処理を同時に行います。
処理によりますが、最大20%ほどのパフォーマンスUPが期待できます。
Windows XPまではHTをOFFにしたほうがパフォーマンスに優れる場面もありましたが、Windows7ではHTをうまく扱えるようになったため特にOFFにする必要はないそうです。
■マルチコアCPU
複数の演算ユニット(コア)を複数搭載したCPUのことです。
複数のコアを搭載することで、複数の作業を同時に行なってもリソースの競合を起こしにくいため、複数同時作業が快適に行えます(例:ウイルススキャンをしながら作業)。
また、マルチコアCPUに最適化されたソフトもあり、そういったソフトでは理論上コア数に比例した速度で処理することができます(例:動画エンコード、RAW現像)。
ただし、オーバーヘッドが生じるため、マルチコアに最適されたソフトでもコア数に比例せず、2コアなら1.8倍程度の高速化にとどまります。
世の中の多くのソフトは依然としてシングルスレッド処理が中心のため、多くの人は2コアあれば不足を感じることはあまりありません。
1つならシングルコア、2つならデュアルコア、3つならトリプルコア、4つならクアッドコア、6つならヘキサコアと呼ばれます。
PR
秋に発売したAMD FXシリーズはターボ時とは言え遂に4GHzを超えましたね。
しかし、Pentium4 が3.8GHzに達して以来、定格で4GHzを超えるCPUは登場していません。
ではなぜなかなか4GHzを突破しないのでしょうか?
それはマーケティング上の理由もありますが、消費電力と発熱の限界が大きいです。
Intelによると、クロックを20%上げると、パフォーマンスは13%しか上昇しないのに、消費電力は73%も上昇するとしています。
逆にクロックを20%下げると、パフォーマンス低下は13%にとどまりながら、省電力は49%も低下するそうです。
これは高クロック化で性能を上げるより、マルチコア化で性能を上げたほうがワットパフォーマンスがいいことを示しています。
例えば、高クロック化に適した設計のNetBurstアーキテクチャを採用したPentium4は、理論上10GHz越えも可能とされていました。
しかし、シュリンクが進むにつれてリーク電流が増え、消費電力と発熱が減らせず、高クロック化に行き詰りました。
そのためIntelはそれまでの高クロック化路線を転換し、クロックあたりの効率を重視した設計に切り替えました。
それが現在Intelの主力になっているCoreから続くアーキテクチャで、初めこそ低いクロックからスタートしましたが、現在ではターボ時4GHzに届きそうなクロックになりました。
一方、クロックでシングルスレッド性能を補う方針に転換したAMDのBulldozerアーキテクチャは、ターボ時4GHzを超えていますが、水冷クーラーが欲しくなるほどの発熱と高い消費電力に悩んでいます。
消費電力と発熱、その他を無視すればもっとクロックを上げることはできます。
しかし、消費電力と発熱を増やしすぎると、扱いづらいCPUとなり売れなくなります。
また、クロックとクロックあたりの性能のバランスを考えて設計していなかないと、クロックと発熱の割に性能が伸びません。
最後にマーケティング上の理由ですが、下位が最上位のクロックを超えないようにしているそうです。
最上位はコア数が多いため、消費電力や発熱も相応に多く、クロックが上げにくくなっています。
ただ、クロックを抑えているから性能が低いということはなく、クロックを多少落としてでもコア数を増やしたほうがCPU全体としての性能は高くなります。
コア数の少ない下位はさらに高クロック化できても、マーケティング上最上位を超えないように抑えているそうです。
しかし、Pentium4 が3.8GHzに達して以来、定格で4GHzを超えるCPUは登場していません。
ではなぜなかなか4GHzを突破しないのでしょうか?
それはマーケティング上の理由もありますが、消費電力と発熱の限界が大きいです。
Intelによると、クロックを20%上げると、パフォーマンスは13%しか上昇しないのに、消費電力は73%も上昇するとしています。
逆にクロックを20%下げると、パフォーマンス低下は13%にとどまりながら、省電力は49%も低下するそうです。
これは高クロック化で性能を上げるより、マルチコア化で性能を上げたほうがワットパフォーマンスがいいことを示しています。
例えば、高クロック化に適した設計のNetBurstアーキテクチャを採用したPentium4は、理論上10GHz越えも可能とされていました。
しかし、シュリンクが進むにつれてリーク電流が増え、消費電力と発熱が減らせず、高クロック化に行き詰りました。
そのためIntelはそれまでの高クロック化路線を転換し、クロックあたりの効率を重視した設計に切り替えました。
それが現在Intelの主力になっているCoreから続くアーキテクチャで、初めこそ低いクロックからスタートしましたが、現在ではターボ時4GHzに届きそうなクロックになりました。
一方、クロックでシングルスレッド性能を補う方針に転換したAMDのBulldozerアーキテクチャは、ターボ時4GHzを超えていますが、水冷クーラーが欲しくなるほどの発熱と高い消費電力に悩んでいます。
消費電力と発熱、その他を無視すればもっとクロックを上げることはできます。
しかし、消費電力と発熱を増やしすぎると、扱いづらいCPUとなり売れなくなります。
また、クロックとクロックあたりの性能のバランスを考えて設計していなかないと、クロックと発熱の割に性能が伸びません。
最後にマーケティング上の理由ですが、下位が最上位のクロックを超えないようにしているそうです。
最上位はコア数が多いため、消費電力や発熱も相応に多く、クロックが上げにくくなっています。
ただ、クロックを抑えているから性能が低いということはなく、クロックを多少落としてでもコア数を増やしたほうがCPU全体としての性能は高くなります。
コア数の少ない下位はさらに高クロック化できても、マーケティング上最上位を超えないように抑えているそうです。
先日といってもだいぶ前になりますが、11月11日にAMDからBulldozerアーキテクチャの新CPU FXシリーズが発売されましたね。
各所でベンチマークが出ていますが、最上位のFX-8150はIntelのCore i7 2600に対してシングルスレッドで3分の2、マルチスレッドでも1割引きくらいの性能です。
旧世代のPhenom II X6 1100Tに対しても互角くらいで買ったり負けたりの性能です。
消費電力は、アイドル状態でこそi7 2600並で、X6 1100Tよりも10Wほど少ないですが、最大負荷時はi7 2600より80Wほど、X6 1100Tより30Wほども多く消費します。
期待はずれな出来に見えるBulldozerですが、パフォーマンスが悪い理由を調べてみるといくつかの要因が見つかります。
1.Bulldozerアーキテクチャへの最適化が不十分
2.コア間の帯域増と引き換えにレイテンシが増加
3.L1キャッシュが減少
4.CPUの重要部分を自動ツールにより設計
5.発熱が多くTurboCoreが十分働かない
Bulldozerは、1つのモジュールに2つの整数演算ユニットと1つの浮動小数点ユニットを持ち、フェッチ/デコードは共有という従来のCPUと異なるアーキテクチャをとっています。
このため、従来のCPU向けに作られたアプリケーションではパフォーマンスが十分発揮できないと見られています。
コア間の帯域が増えているもののレイテンシが増加しているため、特にゲームなど一部のアプリケーションでパフォーマンスが低下しているそうです。
BulldozerのL1キャッシュは、L1 DATAが整数演算ユニットごとに16KB、L1 Instがモジュールごとに64KBという構成になっています。
PhenomIIではコアごとにL1 DATA、L1 Instともに64KBあったので、減少していることになります。
AMDの技術者だったCliff A. Maier氏の話によると、Bulldozerは性能に直結する様々な部位を自動設計ツールで設計しており、開発期間の短縮と引き換えに20%遅く、20%大きなダイになったそうです。
Bulldozerは高クロックなためか発熱が多く、高負荷な処理をマルチスレッドで行うと、TurboCoreが十分働かないことが少なくないようです。
これも額面通りの性能が出ない一因となっています。
Bulldozerが遅い理由としては以上のようなところらしいです。
しかし、理由を知れば次のようにいくつか希望も見えてきます。
1.改良と最適化を進め、アプリケーションの最適化も進めばパフォーマンスを発揮できるようになる
2.設計を手作業で最適化していくことで、最大25%の高速化が見込め、ダイ縮小により省電力化と歩留まりの向上も期待できる
3.プロセスが成熟してくればより高クロック化できる
12年第3四半期に登場が予定されているBulldozer後継のPiledriverを使用したVisheraに期待ですね。
・2012.1.21追記
Windows7以降用の2つの最適化パッチ(KB2645594、KB2646060)がマイクロソフトより公開されました。
海外サイト(VR-ZONE)に検証が載っています。
各所でベンチマークが出ていますが、最上位のFX-8150はIntelのCore i7 2600に対してシングルスレッドで3分の2、マルチスレッドでも1割引きくらいの性能です。
旧世代のPhenom II X6 1100Tに対しても互角くらいで買ったり負けたりの性能です。
消費電力は、アイドル状態でこそi7 2600並で、X6 1100Tよりも10Wほど少ないですが、最大負荷時はi7 2600より80Wほど、X6 1100Tより30Wほども多く消費します。
期待はずれな出来に見えるBulldozerですが、パフォーマンスが悪い理由を調べてみるといくつかの要因が見つかります。
1.Bulldozerアーキテクチャへの最適化が不十分
2.コア間の帯域増と引き換えにレイテンシが増加
3.L1キャッシュが減少
4.CPUの重要部分を自動ツールにより設計
5.発熱が多くTurboCoreが十分働かない
Bulldozerは、1つのモジュールに2つの整数演算ユニットと1つの浮動小数点ユニットを持ち、フェッチ/デコードは共有という従来のCPUと異なるアーキテクチャをとっています。
このため、従来のCPU向けに作られたアプリケーションではパフォーマンスが十分発揮できないと見られています。
コア間の帯域が増えているもののレイテンシが増加しているため、特にゲームなど一部のアプリケーションでパフォーマンスが低下しているそうです。
BulldozerのL1キャッシュは、L1 DATAが整数演算ユニットごとに16KB、L1 Instがモジュールごとに64KBという構成になっています。
PhenomIIではコアごとにL1 DATA、L1 Instともに64KBあったので、減少していることになります。
AMDの技術者だったCliff A. Maier氏の話によると、Bulldozerは性能に直結する様々な部位を自動設計ツールで設計しており、開発期間の短縮と引き換えに20%遅く、20%大きなダイになったそうです。
Bulldozerは高クロックなためか発熱が多く、高負荷な処理をマルチスレッドで行うと、TurboCoreが十分働かないことが少なくないようです。
これも額面通りの性能が出ない一因となっています。
Bulldozerが遅い理由としては以上のようなところらしいです。
しかし、理由を知れば次のようにいくつか希望も見えてきます。
1.改良と最適化を進め、アプリケーションの最適化も進めばパフォーマンスを発揮できるようになる
2.設計を手作業で最適化していくことで、最大25%の高速化が見込め、ダイ縮小により省電力化と歩留まりの向上も期待できる
3.プロセスが成熟してくればより高クロック化できる
12年第3四半期に登場が予定されているBulldozer後継のPiledriverを使用したVisheraに期待ですね。
・2012.1.21追記
Windows7以降用の2つの最適化パッチ(KB2645594、KB2646060)がマイクロソフトより公開されました。
海外サイト(VR-ZONE)に検証が載っています。
管理人より
パソコン関係の記事を書いています。
ブログ内検索
最新記事
(05/13)
(02/04)
(01/28)
(01/25)
(01/21)
(01/14)
カレンダー
11 | 2024/12 | 01 |
S | M | T | W | T | F | S |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
カテゴリー
アーカイブ
最新TB
プロフィール
HN:
クロ
性別:
男性
自己紹介:
ある夏の日、パソコンを買い換えようと下調べを始め、BTOパソコンに興味を持つ。最近の興味は専ら自作とノートパソコン。
リンク