우리는 우분투 16.04를 실행하는 서버를 가지고 있습니다. 우리는 4 개의 제온과 2 개의 RAID 컨트롤러 (각각 1TB SSD로 채워짐)를 통해 많은 실험을했습니다. 문제없이 64 개 코어를 모두 사용하여 몇 달 동안 작업을 실행했습니다. 우리는 새로운 작업을 시도 할 때까지 아무런 문제없이 1 년 넘게 사용 해왔다.
짧은 시간 내에 대량의 디스크 IO (수백에서 TB에 이르는)를 수행 할 때 서버는 자동 재부팅을 수행합니다. 모든 로그에서 재부팅을 찾을 수 없습니다. “마지막 재부팅”을 실행해도 재부팅을 인식하지 못하지만 가동 시간을 확인하면 최근에 다시 시작 되었음이 표시됩니다.
Heavy Disk IO는 지속적으로 자동 재부팅을 유발합니다. 습격 파티션을 다시 만들려고했습니다. 우리는 다른 것에 비교되면서 조금 별 났던 1 개의 구동 장치를 바꾸었다 (그러나 아직도 일하는 것처럼 보였다). 14.04에서 16.04로 업그레이드되었습니다. RAID 컨트롤러와 SSD의 펌웨어도 업데이트되었지만 이것이 도움이되지는 못합니다.
재부팅은 여전히 발생하며, 이유를 파악하는 방법은 확실하지 않습니다. 아무 것도 문제를 기록하는 것 같지 않고, 여기 누군가가 syslog 및 dmesg (후자는 비어 있음) 이외의 다른 곳을 보게 될 것입니다.