AMD EPYCに起動してから約3年後にハングアップする不具合。回避方法あり。しかし、修正はされず

CPU

AMD EPYC

AMDは、同社製サーバー向けCPUとなるEPYCにおいて、約3年起動しっぱなしにするとハングアップする不具合があることを発表しました。

AMDによると、システムを起動してから約1,044日後(約2.86年後)に、CPUコアがCC6スリープから抜け出せなくなってハングアップが発生するとのこと。ハングアップするまでの期間は、クロックによって異なる場合があるとされています。

この不具合の影響を受けるCPUは、Zen 2世代のEPYC 7002シリーズ(コードネーム: Rome)。今のところ、そのほかのEPYCでこの不具合は確認されていません。

この不具合を回避する方法は2つあります。1つは、CC6を無効にすること。もう1つは、ハングアップ前にシステムを再起動することです。

AMD EPYC 7002シリーズの不具合を記したPDF
AMD EPYC 7002シリーズの不具合を記したPDF

理由はわかりませんが、AMDはこの不具合を修正しないとしています。EPYC 7002シリーズを使用したサーバー運用に携わっている方はお気をつけください。

Posted by にっち