「Tips & FAQ」の版間の差分

提供:biaswiki
ナビゲーションに移動 検索に移動
 
(同じ利用者による、間の16版が非表示)
20行目: 20行目:
**mysql、postgresql、Sqlite3を用意しています。お問い合わせください
**mysql、postgresql、Sqlite3を用意しています。お問い合わせください
**virtuosoもあるよ
**virtuosoもあるよ
*Dockerが使いたいです
**Docker利用は対応していません
**コンテナイメージファイルを用意して、Singularity を利用してください
**[[コンテナの利用|コンテナ(Singularity)の利用]]


=== PBS関連 ===
=== PBS関連 ===
33行目: 38行目:
*メモリが不足しそうですが実行していいですか
*メモリが不足しそうですが実行していいですか
**よくはないが、利用メモリ量を推測することは難しい
**よくはないが、利用メモリ量を推測することは難しい
**blastキューは188GBまで要求メモリ量を増やせるので、smpXに入れる前に試してみてください
**blastキューは188GBまで要求メモリ量を増やせるので、smp[s|m|l] に入れる前に試してみてください
**上限の188GBを確保する場合、bias5-node[01-20]の一台をまるまる占有することになります
**blastキューで上限の188GBを確保する場合、bias5-node[01-20]の一台をまるまる占有することになります
**[[%E3%82%B8%E3%83%A7%E3%83%96%E7%AE%A1%E7%90%86%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0_PBS%E3%82%92%E7%94%A8%E3%81%84%E3%81%9F%E8%A8%88%E7%AE%97%E6%A9%9F%E3%81%AE%E5%88%A9%E7%94%A8#.E3.83.A1.E3.83.A2.E3.83.AA.E5.88.B6.E9.99.90.E3.81.AB.E3.81.A4.E3.81.84.E3.81.A6|メモリ制限について]] もご覧ください
**[[%E3%82%B8%E3%83%A7%E3%83%96%E7%AE%A1%E7%90%86%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0_PBS%E3%82%92%E7%94%A8%E3%81%84%E3%81%9F%E8%A8%88%E7%AE%97%E6%A9%9F%E3%81%AE%E5%88%A9%E7%94%A8#.E3.83.A1.E3.83.A2.E3.83.AA.E5.88.B6.E9.99.90.E3.81.AB.E3.81.A4.E3.81.84.E3.81.A6|メモリ制限について]] もご覧ください


41行目: 46行目:


*ジョブがステータスEqwで止まってしまった
*ジョブがステータスEqwで止まってしまった
**とりあえず <code>qstat -j your_job_id | grep reason</code> など実行して理由を確認しましょう(データ読み書きのパスは正しいですか?)
**とりあえず <code>qstat -f job_id | grep reason</code> など実行して理由を確認しましょう(データ読み書きのパスは正しいですか?)
**理由が取り除けたら、<code>qmod -cj your_job_id</code>で再投入
**理由が取り除けたら、<code>qrls job_id</code>で再投入
**取り除けないエラーなら <code>qdel your_job_id</code>で削除して出直しましょう
**取り除けないエラーなら <code>qdel job_id</code>で削除して出直しましょう


*異常終了したのに eファイルとoファイルが作成されない
*異常終了して、eファイルとoファイルが作成されない
**<code>tracejob your_job_id</code> で原因を探りましょう
**<code>tracejob job_id</code> で原因を探りましょう
**わからない場合、そのジョブIDを support@nibb.ac.jp(@を半角に)までお知らせください
**わからない場合、そのジョブIDを support@nibb.ac.jp(@を半角に)までお知らせください


*リソースは空いているように見えるのにジョブがQ状態のまま実行されない
*リソースは空いているように見えるのにジョブがQ状態のまま実行されない
**<code>tracejob your_job_id</code> で原因を探ったら、隙間に滑り込めるように要求リソース量を調整しましょう
**<code>tracejob job_id</code> で原因を探ったら、隙間に滑り込めるように要求リソース量を調整しましょう
**実はアレイジョブが占有しているかもしれません。 <code>qstat -nr1t</code> とすると畳まれていたアレイジョブが見えます
**実はアレイジョブが占有しているかもしれません。 <code>qstat -nr1t</code> とすると畳まれていたアレイジョブが見えます
*ジョブが振られたホストのローカルディスクを満杯にしてしまった
**まずは support@nibb.ac.jp(@を半角に) までご連絡ください
**考えられる原因は2つ
**1) 一時ファイルが大量に作られる
*** ソフトウェアのドキュメントに、temporary file の置き場所を決められるオプションがあるはず
**2) 途中のエラーでユーザのアクションを促されるが(上書きするか?等)PBS経由では反応できないため標準出力に延々とメッセージが繰り替えされる
*** 原因を取り除いて再度実行する
=== その他 ===
*numactlを使いたい
** diaf-smp[1,2] に実装されていますので、smpsキューでそちらに振ってください


*javaのバージョンが古すぎて動きません
*javaのバージョンが古すぎて動きません
57行目: 74行目:
**Linuxプラットフォーム用Javaの場合 [https://www.java.com/ja/download/help/linux_install.xml javaインストール方法]
**Linuxプラットフォーム用Javaの場合 [https://www.java.com/ja/download/help/linux_install.xml javaインストール方法]
**<code>export PATH=/home/your_account/jdk1.8.0_91/bin:$PATH</code> とパスを通します
**<code>export PATH=/home/your_account/jdk1.8.0_91/bin:$PATH</code> とパスを通します
*numactlを使いたい
** diaf-smp[1,2] に実装されていますので、smpsキューでそちらに振ってください




*順次作成中 ご質問、お問い合わせ、不具合の連絡などは support@nibb.ac.jp(@を半角に) まで
*順次作成中 ご質問、お問い合わせ、不具合の連絡などは support@nibb.ac.jp(@を半角に) まで

2021年11月5日 (金) 03:02時点における最新版

ログイン関連

  • ログインできません
    • VPNの接続先は正しいですか?(最初の接続先は pa-gate.orion.ac.jp (PaloAlto) または、ovs.orion.ac.jp (AnyConnect) です)
    • ログインするマシン名は正しいですか? bias5.nibb.ac.jp
    • パスワードは正しいですか?
    • UNIXログイン、シェルが有効になっていますか?(所内ユーザのみ・お問い合わせください)

ログインしてから

  • core.NNNNN ていうサイズの大きな覚えのないファイルがたくさんあります
  • MPI関連のプログラムはどこにある?
    • /usr/mpi/gcc/openmpi-3.1.0rc2/bin です コンパイラ:mpicc もここ
  • データベース(RDBMS)が使いたいです
    • mysql、postgresql、Sqlite3を用意しています。お問い合わせください
    • virtuosoもあるよ
  • Dockerが使いたいです

PBS関連

  • 途中終了して、「=>> PBS: job killed: mem 3977304kb exceeded limit 3686400kb」というエラー
    • small, medium, large, blast キューでは、メモリ制限をしています メモリ制限について
    • qsubオプション #PBS -l mem=8G で要求メモリを増やして再度 qsub してください
  • メモリが不足しそうですが実行していいですか
    • よくはないが、利用メモリ量を推測することは難しい
    • blastキューは188GBまで要求メモリ量を増やせるので、smp[s|m|l] に入れる前に試してみてください
    • blastキューで上限の188GBを確保する場合、bias5-node[01-20]の一台をまるまる占有することになります
    • メモリ制限について もご覧ください
  • ジョブがステータスEqwで止まってしまった
    • とりあえず qstat -f job_id | grep reason など実行して理由を確認しましょう(データ読み書きのパスは正しいですか?)
    • 理由が取り除けたら、qrls job_idで再投入
    • 取り除けないエラーなら qdel job_idで削除して出直しましょう
  • 異常終了して、eファイルとoファイルが作成されない
    • tracejob job_id で原因を探りましょう
    • わからない場合、そのジョブIDを support@nibb.ac.jp(@を半角に)までお知らせください
  • リソースは空いているように見えるのにジョブがQ状態のまま実行されない
    • tracejob job_id で原因を探ったら、隙間に滑り込めるように要求リソース量を調整しましょう
    • 実はアレイジョブが占有しているかもしれません。 qstat -nr1t とすると畳まれていたアレイジョブが見えます
  • ジョブが振られたホストのローカルディスクを満杯にしてしまった
    • まずは support@nibb.ac.jp(@を半角に) までご連絡ください
    • 考えられる原因は2つ
    • 1) 一時ファイルが大量に作られる
      • ソフトウェアのドキュメントに、temporary file の置き場所を決められるオプションがあるはず
    • 2) 途中のエラーでユーザのアクションを促されるが(上書きするか?等)PBS経由では反応できないため標準出力に延々とメッセージが繰り替えされる
      • 原因を取り除いて再度実行する

その他

  • numactlを使いたい
    • diaf-smp[1,2] に実装されていますので、smpsキューでそちらに振ってください
  • javaのバージョンが古すぎて動きません
    • システムのjavaは触る予定がありませんので、お手数ですがホームディレクトリに最新版をインストールしてください
    • Linuxプラットフォーム用Javaの場合 javaインストール方法
    • export PATH=/home/your_account/jdk1.8.0_91/bin:$PATH とパスを通します


  • 順次作成中 ご質問、お問い合わせ、不具合の連絡などは support@nibb.ac.jp(@を半角に) まで