障害履歴

ユーザジョブに影響したと思われる障害の一覧を掲載しています。

より詳細な障害履歴はこちらをご覧ください。
http://mon.g.gsic.titech.ac.jp/trouble-list/index.htm


  • 2015-06-04

    (グループディスクを利用している方向けの情報です)

                                 学術国際情報センター
    平成27年6月4日

     下記の通りグループディスク設定に問題が発生し、復旧いたしました。皆様にはご迷惑をおかけして申し訳ございませんでした。

     日時:2015年6月4日 0:20 から 6月4日 11:01 頃

     影響: グループディスクを正しく購入していても、グループの最上位のディレクトリの所有者とパーミッションがroot 700に変更されアクセス不能となる。またクオータ設定もおかしくなる。

     詳細: 提示処理毎月3日夜間(今月は6/4日 0:20分)に実行される未購入グループのroot化処理に問題があり、ほとんどのグループ(*)においてグループディスクのディレクトリへのアクセスが不能となりました。9:30頃より復旧を開始し、11:00頃にすべての復旧作業及び確認が終わりました。

     *…...


  • 2015-05-22

    (グループディスクを利用している方向けの情報です)

                                 学術国際情報センター
    平成27年5月21日

     下記の通りストレージに障害が発生し、復旧いたしました。皆様にはご迷惑をおかけして申し訳ございませんでした。

     日時:2015年5月21日 16:49 から 5月22日 13:45 頃

     影響: /data0 のテープドライブ上のデータの一部にアクセスできない。

     詳細: 

      期間中、5000巻あるうちの1つのテープメディアTI1016が読み込めない状況でした。ロボットハンドがTI1016のテープの存在を認識しているが、バーコードが読めずテープ情報をシステムに誤報告したため、テープシステム内のDBと整合性が取れない状態に陥りました。テープ情報を更新することで復旧しました。


  • 2015-05-21

    (グループディスクを利用している方向けの情報です)

                                 学術国際情報センター
    平成27年5月21日

     下記の通りストレージに障害が発生し、復旧いたしました。皆様にはご迷惑をおかけして申し訳ございませんでした。

     日時:2015年5月20日 11:20 から 20:00 頃

     影響: /data0 のテープドライブ上のデータの一部にアクセスできない。

     詳細: 

      テープドライブのバーコード不良及びロボット不良によりテープをマウントすることができませんでした。既にドライブに入ってるメディアに関してはデータの読み/書きは可能でしたが、ドライブに入ってないメディアに関するデータの読み/書き
    (ドライブに対してメディアを入れる処理が障害によりできなかったため)はできない状況でした。

    ドライブ及びロボットを交換することで復旧しました。...


  • 2015-05-08

    (グループディスクを利用している方向けの情報です)

                                 学術国際情報センター
    平成27年5月8日

    (7/22更新) 

    下記の通りストレージに障害が発生し、再発防止策を設定しました。詳細はわかり次第追記します。

     日時:発生する可能性があった期間は/data0サービス開始時(2011.5.1)から2015.5.7まで。最初の発見は2015.4.28。実際に上書きが起きた期間は2014.2.19から2014.6.13。

     影響: /data0 のテープ上の多くのデータが上書きされ消失

     詳細: 

     ...


  • 2015-04-24

    (グループディスクを利用している方向けの情報です)

                                 学術国際情報センター
    平成27年4月24日

     下記の通りストレージに障害が発生し、復旧いたしました。皆様にはご迷惑をおかけして申し訳ございませんでした。

     日時:2014年4月3日 から 2015年4月21日 頃

     影響: /data0 のテープドライブ上のデータの一部にアクセスできない。

     詳細: 

     /data0ではHDDとテープを利用した階層型ストレージを構成しておりますが(HSM)、それを実現するTivoli Storage Manager(以下TSM)が/data0 の テープ上のデータを Recall する際に Permission Denied となりデータが Recall できない状況が発生しました。...


  • 2015-04-22


  • 2015-03-02

    (グループディスクを利用している方向けの情報です)

                                 学術国際情報センター
    平成27年3月2日

     下記の通りストレージに障害が発生し、復旧いたしました。皆様にはご迷惑をおかけして申し訳ございませんでした。

     日時:2月28日(土) 12:24 から 15:32 頃

     影響: /work1 にアクセスできない。

     詳細: (確認中)

    (3/5追記) 2015 年 2 月 28 日 12:24 より、/work1 を構成する MDS(MetaData Server)...


  • 2015-02-19

    (グループディスクを利用している方向けの情報です)

                                 学術国際情報センター
    平成27年2月19日

     下記の通りストレージに障害が発生し、復旧いたしました。皆様にはご迷惑をおかけして申し訳ございませんでした。

     日時:2月14日(土) 18:33 から 2月16日(月) 12:17 頃

     影響: /work0の一部に書き込みができない。

     詳細:

     8台あるOSSの中の1台 t2s007001 に接続されるOSTの1つ work0-OST0000 において、”Invalid block bitmap”とのエラーを検知し、OST が read-only で再マウントされておりました。このため障害発生から復旧までの間、当該OSTに対する書き込みができない状態となっておりました。なお/work0を構成するOSTの数は56のため、1/56に問題があったことになります。...


  • 2014-12-18

    (グループディスクを利用している方向けの情報です)

                                 学術国際情報センター
    平成26年12月18日

     下記の通りストレージに障害が発生し、復旧いたしました。皆様にはご迷惑をおかけして申し訳ございませんでした。

     日時:12月7日(日) 18:15 から 12月10日(水) 15:41 頃

     影響: /work0の一部に書き込みができない。

     詳細:

     8台あるOSSの中の1台 t2s007003 に接続されるOSTの1つ work0-OST000C において、”Invalid block bitmap”とのエラーを検知し、OST が read-only で再マウントされておりました。このため障害発生から復旧までの間、当該OSTに対する書き込みができない状態となっておりました。

    ...


  • 2014-12-08

    (グループディスクを利用している方向けの情報です)

                                 学術国際情報センター
    平成26年12月8日

     下記の通りストレージに障害が発生し、復旧いたしました。皆様にはご迷惑をおかけして申し訳ございませんでした。

     日時:12月8日(月) 5:16頃 から 10:32 頃

     影響: /work1, /gscr0の一部にアクセスできない。

     詳細:

     8台あるOSSの中の6台 t2s007037, t2s007039, t2s007041, t2s007043, t2s007045, t2s007047, t2s007049, t2s007051 に障害が発生し、このサーバで管理されていたOSTにアクセスできませんでした。

     ...

ページ