この記事は、インテル® デベロッパー・ゾーンに公開されている「An overview of the 6th generation Intel® Core™ processor (code-named Skylake)」(https://software.intel.com/en-us/articles/an-overview-of-the-6th-generation-intel-core-processor-code-named-skylake) の日本語参考訳です。
この記事の PDF 版はこちらからご利用になれます。
はじめに
2015 年にリリースされた第 6 世代インテル® Core™ プロセッサー (開発コード名 Skylake) は、コア、システムオンチップ (SoC)、プラットフォーム・レベルで改良が行われ、14nm プロセス技術を採用した前世代のプロセッサー (開発コード名 Broadwell) よりも優れた機能を提供する、幅広いフォームファクターにわたって生産性、創造性、ゲーム・アプリケーションに最適なプロセッサーです。この記事では、Skylake✝ の主な機能と改良点の概要、ならびに Wake on Voice (音声認識) や Windows® 10 の生体認証のような魅力的な新しい使用法を紹介します。
Skylake✝ アーキテクチャー
第 6 世代インテル® Core™ マイクロアーキテクチャーは、14nm テクノロジーを採用しています。幅広いフォームファクターで利用できるようにプロセッサーとプラットフォームのサイズが小さくなり、インテル® アーキテクチャーおよびグラフィックスのパフォーマンスが向上し、消費電力が削減され、セキュリティー機能が拡張されています。図 1 は、主な新機能と改良点です。実際の構成は、OEM デバイスにより異なります。
図 1: Skylake✝ アーキテクチャーと改良点の要約[1]
コア・プロセッサー・ベクトル
パフォーマンス
パフォーマンスの向上は、より多くの命令を実行ユニットに提供すること (つまり、1 クロックに実行される命令の数を増やすこと) によってもたらされます。これは、次の 4 つの改良によって達成されました[Ibid]。
- フロントエンドの改良。容量が大きく、よりスマートな分岐予測により、広いビット幅の命令のデコードと、高速で効率の良いプリフェッチが可能になりました。
- 命令の並列性の強化。1 クロックあたりの命令数が増えたことで、より深いアウトオブオーダー・バッファーにより命令実行の並列性が向上しました。
- 実行ユニット (EU) の改良。前世代と比べて、以下の点で EU が強化されました。
- レイテンシーの短縮
- EU 数の増加
- 使用されていないユニットをオフにする際の電力効率が改善
- セキュリティー・アルゴリズムの実行速度が向上
- メモリー・サブシステムの改良。フロントエンド、命令の並列性、EU の改良により、帯域幅とパフォーマンス要件に応じたメモリー・サブシステムのスケーリングも向上しました。これは、次の要因によって達成されました。
- より高いロード/ストア帯域幅
- プリフェッチャーの改良
- より深いストレージ
- フィル/ライトバック・バッファー
- ページミス処理の向上
- L2 キャッシュミス帯域幅の向上
- キャッシュ管理用の新しい命令
図 2: Skylake✝ のコア・マイクロアーキテクチャーの概要
図 3 は、Skylake✝ と第 2 世代 (Sandy Bridge✝)、第 4 世代 (Haswell✝) のインテル™ Core™ プロセッサーの並列性を比較した結果です。
図 3: 前世代のプロセッサーと比べて並列性が向上
5 年前の PC と比べてパフォーマンスは最大 60% 向上、ビデオ・トランスコーディングは最大 6 倍スピードアップ、グラフィックス・パフォーマンスは最大 11 倍向上しています。
図 4: 第 6 世代インテル® Core™ プロセッサーと 5 年前の PC のパフォーマンス比較結果
- 出典: インテル コーポレーション。インテル® Core™ i5-6500 プロセッサーとインテル® Core™ i5-650 プロセッサーを比較した SYSmark* 2014 の推定値に基づく。
- 出典: インテル コーポレーション。インテル® Core™ i5-6500 プロセッサーとインテル® Core™ i5-650 プロセッサーを比較した Handbrake + インテル® クイック・シンク・ビデオの推定値に基づく。
- 出典: インテル コーポレーション。インテル® Core™ i5-6500 プロセッサーとインテル® Core™ i5-650 プロセッサーを比較した 3DMark* “Cloud Gate” の推定値に基づく。
デスクトップとラップトップのパフォーマンス・ベンチマークの詳細は、次の Web サイト (英語) を参照してください。
デスクトップ・パフォーマンス・ベンチマーク: http://www.intel.com/content/www/us/en/benchmarks/desktop/6th-gen-core-i5-6500.html
ラップトップ・パフォーマンス・ベンチマーク: http://www.intel.com/content/www/us/en/benchmarks/laptop/6th-gen-core-i5-6200u.html
電力効率
動的な消費に基づくリソース構成
レガシーシステムは、OS によって制御される要求ベースのアルゴリズムを利用して電力効率とパフォーマンスのバランスをとるため、Intel SpeedStep® テクノロジーを採用しています。これは、ワークロードが一定の場合は問題ありませんが、バースト性のワークロードには最適ではありません。Skylake✝ では、インテル® Speed Shift テクノロジーにより OS からハードウェアへ制御を移し、プロセッサーが約 1 ミリ秒で最高クロック速度に到達できるようにして、より細やかな電力管理を実現しています[3]。
図 5: インテル® Speed Shift テクノロジーと Intel SpeedStep® テクノロジーの比較
インテル® Core™ i5 – 6200U プロセッサーにおいて、インテル® Speed Shift テクノロジーは Intel SpeedStep® テクノロジーと比べて優れた応答時間を達成します。
- 応答性が最大 45% 向上
- 高精細写真は最大 45% 向上
- 売上グラフは最大 31% 向上
- ローカルノートは最大 22% 向上
- 全体の応答性が最大 20% 向上
[高精細写真、売り上げグラフ、ローカルノートをすべてまたは一部使用して Web アプリケーションのパフォーマンスを測定する、Principled Technologies* 社のベンチマーク WebXPRT* 2015 での測定結果。詳細は、www.principledtechnologies.com (英語) を参照してください。]
十分に利用されていないリソースをダウンスケールしたり、使用されていないときはインテル® アドバンスト・ベクトル・エクステンション 2 (インテル® AVX2) をパワーゲートしたり、アイドル状態の電力消費を削減して、動的な消費に基づいてリソースを構成することで、追加の電力最適化も達成しています。
メディアとグラフィックス
インテル® HD グラフィックスは、第 2 世代インテル® Core™ プロセッサーで初めてプロセッサー・グラフィックスが搭載されて以来、3D グラフィックス、メディア/ディスプレイ機能、パフォーマンス、パワー・エンベロープ、設定/スケーラビリティーにおいて大きな進化を遂げました。図 6 は、主な改良点を比較したもので、これらの改良点によりグラフィックス・パフォーマンスは 100 倍以上向上しました [2]。
[ピークシェーダー FLOPS @ 1GHz]図 6: 各世代のプロセッサー・グラフィックスの機能
図 7: 各世代におけるグラフィックスとメディアの改良点
第 9 世代マイクロアーキテクチャー
第 9 世代 (Gen9) グラフィックス・アーキテクチャーは、第 5 世代インテル® Core™ プロセッサー (開発コード名 Broadwell) に搭載されている Gen8 マイクロアーキテクチャーに似ていますが、パフォーマンスとスケーラビリティーが強化されています。 図 8 は、Gen9 マイクロアーキテクチャーのブロック図です[8]。3 つの主要コンポーネントで構成されています。
- ディスプレイ。左端。
- アンスライス。中央の L 字型の部分。コマンド・ストリーマー、グローバル・スレッド・ディスパッチャー、グラフィックス・テクノロジー・インターフェイス (GTI) を処理します。
- スライス。EU を含む部分。
Gen8 と比較して、Gen9 マイクロアーキテクチャーは、ワットあたりの優れた最大パフォーマンス、スループットの向上、アンスライス・コンポーネントへの個別の電力/クロックドメインを提供します。これらの機能は、メディア再生などの用途において、より賢い電力管理を可能にします。スライス・コンポーネントは構成可能で、例えば、GT3 は最大 2 スライス (各スライスに 24 EU) であるのに対して、GT4 (Halo) は最大 3 スライスをサポートできます (GTx は使用する EU の数を表します: GT1 は 12、GT2 は 24、GT3 は 48、GT4 は 72 をサポート)。このアーキテクチャーは、低電力シナリオでは EU の数を減らすように設定できるため、4W 未満から 65W 超まで広範な用途に対応することができます。Gen9 の API サポートは、DirectX® 12、OpenCL* 2.x、OpenGL* 5.x、Vulkan* で利用できます。
図 8: Gen9 プロセッサー・グラフィックス・アーキテクチャー
コンポーネントの詳細については、https://software.intel.com/sites/default/files/managed/c5/9a/The-Compute-Architecture-of-Intel-Processor-Graphics-Gen9-v1d0.pdf (英語) をお読みください。
メディア関連の機能と改良点には、次のものが含まれます[2]。
- 1W 未満の電力消費と 1W のテレビ会議
- Camera RAW アクセラレーションと新しい VQE 関数により、モバイル・プラットフォームで 4K60 RAW ビデオに対応
- 新しいインテル® クイック・シンク・ビデオの固定機能 (Fixed-Function: FF) モード
- 固定機能や GPU アクセラレーション・デコードを含む豊富なコーデックサポート
図 9 は Gen9 でサポートしているコーデックです。
注: メディアコーデックと処理は、すべてのオペレーティング・システムとアプリケーションでサポートされているわけではありません。
図 9: Skylake✝ のコーデックサポート
ディスプレイに関する機能と改良点には、次のものがあります。
- パネルのブレンド、スケーリング、回転、圧縮
- 高画質サポート (4K+)
- ワイヤレスサポート (最大 4K30)
- セルフ・リフレッシュ (PSR2)
- CUI X.X – 新機能、パフォーマンス向上
ゲームファン向けに、インテル® Core™ i7-6700K プロセッサーは、これらの豊富な機能と改良点 (図 10) に加え、インテル® ターボ・ブースト・テクノロジー 2.0、インテル® ハイパースレッディング・テクノロジー、オーバークロッキング機能も備えています。5 年前の PC と比べてパフォーマンスが 80% 向上しています。http://www.intel.com/content/www/us/en/processors/core/core-i7ee-processor.html (英語) から追加情報を入手できます。
- 出典: インテル コーポレーション。インテル® Core™ i7-6700K プロセッサーとインテル® Core™ i7-875K プロセッサーを比較した SPECint*_rate_base2006 (8 コピーレート) の推定値に基づく。
- 出典: インテル コーポレーション。インテル® Core™ i7-6700K プロセッサーとインテル® Core™ i7-3770K プロセッサーを比較した SPECint*_rate_base2006 (8 コピーレート) の推定値に基づく。
- 特定のチップセットとプロセッサーの組み合わせで利用可能な機能を利用しています。警告:動作周波数または電圧、あるいはその両方を改変した場合、以下の事態が生じるおそれがあります。(i) システムの安定性が低下し、システムやプロセッサーの耐用年数が短くなる。(ii) プロセッサーや他のシステム・コンポーネントの故障の原因となる。(iii) システム性能が低下する。(iv) 発熱の増加およびその他の損傷の原因となる。(v) システムのデータ保全性に影響を与える。インテルでは、仕様の枠を超えるプロセッサーの動作についてはテストしておらず、保証も行いません。
図 10: インテル® Core™ i7-6700K プロセッサーの機能
スケーラビリティー
Skylake✝ マイクロアーキテクチャーは、1 つのデザインでクライアント用とサーバー用の 2 種類の製品があり、各セグメントの電力およびパフォーマンス要件を損なうことなく、設定可能なコアを提供します。図 11 は、ローエンドのインテル® Compute Stick からハイエンドのインテル® Xeon®プロセッサー・ベースのワークステーションにわたる広範なフォームファクターで使用されている製品とその電力効率です。
図 11: さまざまなフォームファクターで利用可能なインテル® Core™ プロセッサー
セキュリティー機能の拡張
インテル® ソフトウェア・ガード・エクステンション (インテル® SGX): インテル® SGX は、Skylake✝ で提供された新しい命令セットで、高いレベルの権限で実行している違法ソフトによる不正な変更やアクセスから機密データを保護します。この命令を利用することで、アプリケーションはデータの機密性と整合性を保持することができます[1],[3]。Skylake✝ は、セキュリティーを確保し、信頼できるメモリー領域を使用できるようにするための命令とフローを提供します。インテル® SGX に関する詳細は、次の記事 (英語) を参照してください: https://software.intel.com/en-us/blogs/2013/09/26/protecting-application-secrets-with-intel-sgx。
インテル® Memory Protection Extensions (インテル® MPX): インテル® MPX は、実行時にバッファー・オーバーフローをチェックするための新しい命令セットです。呼び出し元プロセスが割り当てられたメモリーにのみアクセスするように、メモリーアクセスの前にスタックとヒープバッファーの範囲を確認できます。Windows® 10 では インテル® MPX が有効で、Microsoft® Visual Studio® 2015 のインテル® MPX 組込み関数をサポートします。ほとんどの C/C++ アプリケーションは、ソース変更なしで再コンパイルするだけで、インテル® MPX をレガシー・ライブラリーとともに利用できます。インテル® MPX をサポートしていないレガシーシステム上 (第 5 世代インテル® Core™ プロセッサー以前) でインテル® MPX 対応ライブラリーを実行しても、インテル® MPX の効果は得られません。インテル® MPX サポートは動的に有効/無効にできます[1][3]。
ここまでは、Skylake✝ アーキテクチャーの新機能と改良点を紹介しました。次のセクションでは、インテル® Core™ プロセッサー・アーキテクチャーの利点が得られるように最適化されている Windows® 10 の機能について見てみましょう。
Windows® 10 での新しい体験
第 6 世代インテル® Core™ プロセッサーは、Windows® 10 でその性能を発揮し、最適な体験をもたらします。以下は、Windows® 10 搭載のインテル® プラットフォームで優れた電力効率、セキュリティー、応答性、スケーラビリティーを提供する主なハードウェア機能です[3]。
Ϯ 現在、インテルは Microsoft 社と共同で将来の Windows® でのサポートに向けて取り組んでいます。
図 12: Skylake✝ と Windows® 10 の機能
Cortana®
Windows® RTM の Microsoft® Cortana® 音声アシスタントは、「コルタナさん」と言うと Cortana® が応答し、ハンズフリーで操作できます。音声認識機能は、CPU のオーディオ処理パイプラインを使用して、誤認率を抑え正しく認識します。この処理は、Windows® でビルトインサポートされているハードウェアのオーディオ DSP にオフロードされることもあります[3]。
Windows Hello™
生体認証ハードウェアと Microsoft Passport™ を利用して、Windows Hello™ は、パスワードフリーで簡単に使える、顔、指紋、虹彩によるさまざまな種類のログインをサポートしています。インテル® RealSense™ カメラ (F200/SR300) は、顔認証によるログインをサポートします[3]。
図 13: インテル® RealSense™ テクノロジーを利用した Windows Hello™
図 13 の写真は、F200 カメラによって提供された顔の特徴が、登録とログインにどのように使用されるかを示しています。初回ログイン時は、ユーザーの顔の 78 の特徴を使ってテンプレートを作成します。そして、2 回目以降は、カメラの捉えた特徴とテンプレートを比較して一致するかどうか検証します。Microsoft Passport™ のセキュリティー機能とインテル® RealSense™ カメラの機能を組み合わせることで、顔認証は他人誤認率 1/100,000、本人拒否率 2 ~ 4 % という正確なログインを提供します。
参考文献 (英語)
- http://intelstudios.edgesuite.net/idf/2015/sf/ti/150818_spcs001/index.html
- Next-generation Intel® processor graphics architecture, code-named Skylake, by David Blythe: http://intelstudios.edgesuite.net/idf/2015/sf/ti/150818_spcs003/index.html
- Intel® architecture code-named Skylake and Windows* 10 better together, by Shiv Koushik: http://intelstudios.edgesuite.net/idf/2015/sf/ti/150819_spcs009/index.html
- Skylake for gamers: http://www.intel.com/content/www/us/en/processors/core/core-i7ee-processor.html
- Intel’s best processor ever: http://www.intel.com/content/www/us/en/processors/core/core-processor-family.html
- Skylake Desktop Performance Benchmark: http://www.intel.com/content/www/us/en/benchmarks/desktop/6th-gen-core-i5-6500.html
- Skylake Laptop Performance Benchmark: http://www.intel.com/content/www/us/en/benchmarks/laptop/6th-gen-core-i5-6200u.html
- The compute architecture of Intel® processor graphics Gen9: https://software.intel.com/sites/default/files/managed/c5/9a/The-Compute-Architecture-of-Intel-Processor-Graphics-Gen9-v1d0.pdf
✝開発コード名