С удивительным для многих не очень приятным событием стали сталкиваться пользователи серверных платформ построенных на процессорах EPYC второго поколения(7нм архитектура Zen2) носящих аббревиатуру Rome. Оказалось, что данный тип CPU уходят в режим зависания на 1044й(если быть точнее после 1042 дней и 12 часов работы) день непрерывной работы системы без перезагрузок. После прошествия обозначенного периода с момента запуска, чип самостоятельно переключается в энергосберегающий режим CC6(Core C6 State), из которого уже не выходит. Притом, заставить «отвиснуть» сервер никак не получится, потребуется полное выключение и включение системы заново.

Актуальность проблемы и жалобы на неё от некоторых пользователей начали поступать аккурат именно сейчас из-за прошествия обозначенного периода с момента старта продаж чипов и постепенно, на определённый отрезок времени таких обращений будет становиться всё больше, так как процессоры EPYC Rome — очень популярные, надёжные и относительно недорогие CPU, до сиих пор пользующиеся спросом по всему миру. Теорию о происходящем уже выдвинул один из пользователей популярной платформы Reddit скрывающийся под ником acid_migrain. Он уточнил, что у процессоров данной серии, вынесенный в отдельный процесс контроллер временной отметки Timestamp Counter Scaling работает на частоте 2800 МГц и в этом кроется весь секрет. Путём нехитрого умножения частоты, на число исполняемых тактов и число дней — 2800 * 10(в 6 степени) *1042,5 получается число 0x3800000000000000. Данное значение имеет слишком много нулей, оно становится чересчур длинным и процессор уходит в зависание.

Сама AMD по данному поводу даже выпустила отдельный 54х страничный доклад, в котором помимо кучи технической информации представлено два варианта решения проблемы — отключение энергосберегающего режима CC6(не вариант, энергосберегающий режим нужен всегда) или перезагрузка сервера не реже чем 1 раз в 1042 дня. Других способов решения проблемы нет и искаться они не будут.

p.s. На самом деле действительно многие серверы работают без отключения долгие годы, но это не какое — либо достижение, а недостаток работы профильных специалистов их обслуживающих. Сервер конечно «прочнее» любого компьютера, но и ему нужна перезагрузка хотя бы раз в полгода.

Вам может быть интересно: Sony показала перспективную портативную консоль PlayStation Q

Добавить комментарий

Ваш адрес email не будет опубликован.