DRAMエラー:ソフトからハードへ

数年前の研究(DIMMの街のナイトメアを参照)は、DRAMのエラー率がベンダーが信じていた数百から数千倍も高いことを発見しました。しかし、そのエラーの性質は何ですか?迷い込んだアルファ粒子がちょっと転がってしまうようなソフトエラーですか?一般的には信じられていますか?あるいは、ハードなエラーですか、ちょっと立ち往生しますか?

ソフトとハードのエラー

彼らがソフトで無作為であれば、私たちができることはあまりありません。しかし、彼らが難しいのであれば、より効果的に動作している間に影響を少なくするためにできることがあるかもしれません。

トロント大学(Andrew Hwang、Ioan Stefanovici、Bianca Schroederによる「宇宙線の2倍の打撃:DRAMエラーの性質とシステム設計への含意」を参照)によれば、数万のプロセッサをGoogleといくつかの国立研究所、ハードエラーは一般的ですが、その性質はバイナリでもありません。メモリの場所は、アクセスパターンにおそらく敏感になる可能性があります。

この研究では、LLNLのIBM Blue Gene / L(BG / L)、アルゴンヌ国立研究所のBlue Gene / P(BG / P)、SciNetのHPCクラスター、20,000台のGoogleサーバーが調査されました。 Googleのシステムは、他のシステムと同様にインスツルメンテーションされていないため、一部のエラーは控えめに見積もられています。この研究の2つの最も興味深い詳細

これがあなたに与える影響

まもなく発売されるMac Proを除くすべてのMacを含むほとんどの民生用PCには、DRAMエラー修正コード(ECC)はありません。 ECCメモリのコストはより高く、ベンダーは消費者が気にしないで支払いをしないことを学んだ。

BSODまたはシステムロックアップ?重要なシステムコードでメモリエラーが発生している可能性があります。

ほとんどのエラーは、最も使用されているメモリ領域(主要なOSプログラムが実行されている場所)に集中しています。Googleは、他の研究者のGoogle DRAMエラーでデータベースをリリースすることを拒否しました。どうして?私はいくつかのアイデアを持っています。

ワークステーション、サーバー、およびスーパーコンピュータには、一般的な検出と訂正のシングルビットエラーから、メモリチップ全体の損失を生き残ることができる、より洗練された高価な「チップキル」モジュールまで、ある程度のレベルのECCがあります。数テラバイトのDRAMを搭載した世界で最もパワフルなコンピュータの6か月間のシミュレーションを実行しているときに、チップを1つだけ失うことがないようにします。

ストレージビット

「ハード」エラーの過渡的な性質を考えると、DRAMの問題を抱えている消費者はほとんどいません。数週間おきにしか起こらなければ、彼らは呪い、再起動して忘れてしまいます。

この問題は、クラウドプロバイダーにとって何かをする経済的インセンティブがあるので、クラウドプロバイダーにとって重要です。何百万ものサーバがあると、ECCのお金、エネルギー、パフォーマンスのヒットが増えます。

ストレージ、NetApp、Zaloniと提携しているデータレイク向けの中間層システム、クラウド、EMCとの契約を締結したMichael Dell:「データセンター、Dellテクノロジーズのリフトオフ:Dell、EMC、エンタープライズビジネスの群れが結合;ストレージ; FacebookのオープンソースZstandardのデータ圧縮アルゴリズムは、Zipの背後にある技術を置き換えることを目指して

Googleが調査チームが収集したデータの公開を拒否したと伝えている。明らかな推論:データを使用して競争上の地位を向上させることを意図しています。

結局のところ、Googleの購買力を考えれば、より信頼性の高いクラウドサービスと優れたサーバーメモリ設計だけがあれば、残りの人たちが恩恵を受けるでしょう。

しかし、次のPCで修正を探すべきではありません。ベンダーはそれを買う余裕がありません。

コメントはもちろん歓迎します。あなたが詳細を知りたいのであれば、私はStorageMojoでこの投稿のより長いバージョンをやりました。

NetApp、Zaloniと提携しているデータ湖の中間層システムを開始

マイケル・デルがEMCとの契約を締結した。「数十年後には、

Dell Technologiesがリフトオフする:ここでは、Dell、EMC、エンタープライズビジネスの群れが結合

FacebookのオープンソースZstandardのデータ圧縮アルゴリズム、Zipの背後にある技術を置き換えることを目指す