(Recovered) [Outage] November 9, 2021: I/O interruption in some areas of Lustre6
Summary
There was a failure that caused I/O to stop on 10 of the 41 OSTs that make up Lustre6 between 10:58 and 11:28.
There was a failure that caused I/O to stop on 10 of the 41 OSTs that make up Lustre6 between 10:58 and 11:28.
At about 21:00(24h) Thursday, October 7, 2021, the access failure occurred to the tape device that constitutes the hierarchical storage system of the large scale archive storage. The access was restored to the tape device at about 10:40 on Friday, October 8, 2021.
To change the correspondence between OSS and OST in the Lustre6 failure recovery work, 1/3 of the area in /lustre6 will be temporarily inaccessible.
We apologize for any inconvenience this may cause, and thank you for your understanding and cooperation.
Lustre 6ファイルシステムを構成しているRAID6グループの1つで3本のディスクに障害が発生したため、2021年9月11日(土) 午前5時30分頃より、Lustre6の一部のファイルに対しデータアクセス出来ない状態となっております。また、一部のファイルが失われた可能性があり、調査中です。
Lustre 7ファイルシステムの一部領域が9/17 午前1時33分からリードオンリーとなっているため復旧作業を行います。該当の一部領域へのリードライトが9/17 14:00頃から一時間程度停止します。
The scheduled maintenance of the NIG supercomputer is scheduled on the following date and time in accordance with the legal power outage of the NIG. The supercomputer will not be available during the scheduled maintenance.
富士市計画の市道原本市場線道路改良工事の一環である富安橋橋梁補修工事に伴い、 支障となる電気通信設備の移転実施のため、以下の時間帯において、ネットワークが 一時的に不通となります。