「AlphaFold」の版間の差分

提供:biaswiki
ナビゲーションに移動 検索に移動
編集の要約なし
 
(同じ利用者による、間の20版が非表示)
1行目: 1行目:
== DeepMind社のタンパク質立体構造予測プログラム [https://github.com/deepmind/alphafold AlphaFold] が利用できます。==
== DeepMind社のタンパク質立体構造予測プログラム [https://github.com/deepmind/alphafold AlphaFold] が利用できます。==
 
=== 2023/01/18 最新版 AlphaFold 2.3.1 の利用方法です。2.1〜は[[AlphaFold211|こちら]] ===
使い方:<br>
使い方:<br>
ソースをホームディレクトリにコピーして解凍してください
1. ソースをホームディレクトリにコピーして解凍してください


  cd
  cd
  cp /bio/package/alphafold/venv_AF2.tar.gz
  cp /bio/package/alphafold/alphafold-2.3.1.tar.gz ~/
  tar zxvf venv_AF2.tar.gz
  tar zxvf alphafold-2.3.1.tar.gz
 
2. 解凍したディレクトリに移動します
 
cd alphafold-2.3.1
 
3. make_env.sh を実行してpythonの仮想環境をセットアップします
 
bash make_env.sh
 
4. setup.sh を実行してさらに必要なものをインストールします
 
bash setup.sh
 
5. ホームディレクトリに「AF230」というディレクトリが作成されます。この中にalphafold実行に必要なものが入っていますので、削除しないでください
 
6. run_alphafold_example.sh がサンプルスクリプトです。これを適当な名前をつけてコピーして編集します
 
cp ~/alphafold-2.3.1/run_alphafold_example.sh ~/my_af2.sh
vi ~/my_af2.sh


~/venv_AF2/af2_pbs 内にサンプルスクリプト(af2_test_node.sh)があります。これを適当な名前をつけてコピーし<br>
書き換えるのは、############# EDIT FOLLOW LINE ################### から下の4行:22〜25行目、
44行目、


  bash ${AF_DIR}/run_alphafold_gpfs.sh -d ${DB} -o ${HOME}/dtest -m model_1_ptm,model_2_ptm,model_3_ptm,model_4_ptm,model_5_ptm -f ${AF_DIR}/example/query.fasta -t 2020-05-14 -g False
<pre>
  output_dir="${HOME}/af_result"
fasta_path="${AF_DIR}/example/query.fasta"
model_preset='monomer_ptm'  #'monomer' |  'monomer_casp14' |  'monomer_ptm' |  'multimer'
db_preset='full_dbs'      #'full_dbs' | 'reduced_dbs'
</pre>


を書き換えて保存したものを、qsubに与えて実行します。<br>
上から、
必須のオプション:


* -o&nbsp;&nbsp;&nbsp;結果ディレクトリ
# <code>output_dir=</code> 結果を保存するディレクトリ名
* -f&nbsp;&nbsp;&nbsp;検索するアミノ酸配列
# <code>fasta_path=</code> 解析したい配列のFASTAファイル
* -m&nbsp;&nbsp;&nbsp;モデルの数(サンプルでは5モデル全てを適用した結果を返すように書かれています)
# <code>model_preset=</code> 使いたいモデル名(monomer、monomer_casp14、monomer_ptm、multimer)のどれか
# <code>db_preset=</code> 使いたいデータベース名(full_dbs または reduced_dbs)


他のオプションの説明:
<code>#PBS</code> から続くqsubオプションも適宜変更ください(キュー名や利用するリソース量など)


* -d&nbsp;&nbsp;&nbsp;alphafold用データベースのディレクトリ
実行:
* -t&nbsp;&nbsp;&nbsp;最新のテンプレート公開日(このままで大丈夫です 2021-08-24現在)
 
* -g&nbsp;&nbsp;&nbsp;GPUを使うかどうか(当システムにGPUはありません...)
qsub ~/my_af2.sh


所要時間は検索配列の長さに依存します 〜70 => 40分、〜500 => 10時間
所要時間は検索配列の長さに依存します 〜70 => 40分、〜500 => 10時間
=== おまけ:結果を手元のPCの jupyter-notebook で立体的に見てみましょう: [https://github.com/piroyon/fold3Dplot_jupyter fold3Dplot_jupyter] ===
0. bias5からはログアウトし、手元のPCで閲覧します。
1. 結果のディレクトリを手元のPCにコピーします
scp your_user_id@bias5.nibb.ac.jp:~/your_alphafold_result_directory .
2. 手元のPCに python3 および、下記のライブラリをインストールします。
* numpy
* pickle
* py3Dmol
* matplotlib.pyplot
* ipywidgets
* jupyter-notebook
3. [https://github.com/piroyon/fold3Dplot_jupyter fold3Dplot_jupyter] から、fold3Dplot.ipynb をダウンロードします。
4. 先ほどの alphafoldの結果ディレクトリに fold3Dplot.ipynb を置きます
5. jupyter-notebook を起動します
python3 jupyter-notebook
6. fold3Dplot.ipynb を jupyter の画面から開き、セル->全てのセルを実行 します。
[[ファイル:130024182-d9659b44-00a9-4c5d-9947-00bdf02c5280.png|サムネイル|左]]

2023年1月31日 (火) 04:24時点における最新版

DeepMind社のタンパク質立体構造予測プログラム AlphaFold が利用できます。

2023/01/18 最新版 AlphaFold 2.3.1 の利用方法です。2.1〜はこちら

使い方:
1. ソースをホームディレクトリにコピーして解凍してください

cd
cp /bio/package/alphafold/alphafold-2.3.1.tar.gz ~/
tar zxvf alphafold-2.3.1.tar.gz

2. 解凍したディレクトリに移動します

cd alphafold-2.3.1

3. make_env.sh を実行してpythonの仮想環境をセットアップします

bash make_env.sh

4. setup.sh を実行してさらに必要なものをインストールします

bash setup.sh

5. ホームディレクトリに「AF230」というディレクトリが作成されます。この中にalphafold実行に必要なものが入っていますので、削除しないでください

6. run_alphafold_example.sh がサンプルスクリプトです。これを適当な名前をつけてコピーして編集します

cp ~/alphafold-2.3.1/run_alphafold_example.sh ~/my_af2.sh
vi ~/my_af2.sh

書き換えるのは、############# EDIT FOLLOW LINE ################### から下の4行:22〜25行目、

 output_dir="${HOME}/af_result"
 fasta_path="${AF_DIR}/example/query.fasta"
 model_preset='monomer_ptm'  #'monomer' |  'monomer_casp14' |  'monomer_ptm' |  'multimer'
 db_preset='full_dbs'       #'full_dbs' | 'reduced_dbs'

上から、

  1. output_dir= 結果を保存するディレクトリ名
  2. fasta_path= 解析したい配列のFASTAファイル
  3. model_preset= 使いたいモデル名(monomer、monomer_casp14、monomer_ptm、multimer)のどれか
  4. db_preset= 使いたいデータベース名(full_dbs または reduced_dbs)

#PBS から続くqsubオプションも適宜変更ください(キュー名や利用するリソース量など)

実行:

qsub ~/my_af2.sh

所要時間は検索配列の長さに依存します 〜70 => 40分、〜500 => 10時間

おまけ:結果を手元のPCの jupyter-notebook で立体的に見てみましょう: fold3Dplot_jupyter

0. bias5からはログアウトし、手元のPCで閲覧します。

1. 結果のディレクトリを手元のPCにコピーします

scp your_user_id@bias5.nibb.ac.jp:~/your_alphafold_result_directory .

2. 手元のPCに python3 および、下記のライブラリをインストールします。

  • numpy
  • pickle
  • py3Dmol
  • matplotlib.pyplot
  • ipywidgets
  • jupyter-notebook

3. fold3Dplot_jupyter から、fold3Dplot.ipynb をダウンロードします。

4. 先ほどの alphafoldの結果ディレクトリに fold3Dplot.ipynb を置きます

5. jupyter-notebook を起動します

python3 jupyter-notebook

6. fold3Dplot.ipynb を jupyter の画面から開き、セル->全てのセルを実行 します。

130024182-d9659b44-00a9-4c5d-9947-00bdf02c5280.png