バイオウェブ  


実験医学別冊 Experimental Medicine
Pythonで実践
生命科学データの機械学習
あなたのPCで最先端論文の解析レシピを体得できる!
 出版社  羊土社

〒101-0052
東京都千代田区神田小川町2-5-1
TEL 03-5282-1211
FAX 03-5282-1212
URL https://www.yodosha.co.jp/

清水秀幸/編

■ はじめに

【清水秀幸】

■ コード・データのダウンロードについて

■ 第1章 機械学習の概要とライフサイエンス研究への応用

【清水秀幸】

1.1 AlphaFold2 の衝撃

1.2 機械学習速習

1.2.1 機械学習とは何か?

1.2.2 機械学習が行うこと

1.2.3 データの「学習」を紐解く

1.2.4 データを丸暗記してはいけない

1.2.5 機械学習の性能指標

1.2.6 教師なし学習

1.3 深層学習ことはじめ

1.3.1 ニューラルネットワークの基本構造

1.3.2 ニューラルネットワークの学習

1.3.3 さまざまなニューラルネットワーク

1.3.4 転移学習のパラダイム

1.4 生命医科学への機械学習の応用

1.4.1 ゲノム・トランスクリプトームへの応用

1.4.2 タンパク質・創薬への応用

1.4.3 バイオテクノロジーへの応用

1.5 おわりに

■ 第2章 Google Colaboratory, Pandas,Matplotlib, NumPy の基礎

【保住英希,清水秀幸】

2.1 本章で扱うデータ

2.2 Google Colaboratory の使い方

2.2.1 ノートブックの作成

2.2.2 ファイルのアップロード

2.2.3 Google Drive からの読み込み

2.2.4 GPU の使用

2.3 データを知る ―― Pandas の基礎1

2.3.1 データの読み込み

2.3.2 データの概要の把握

2.4 データを見る ―― Matplotlib の基礎

2.4.1 figure とsubplot の関係

2.4.2 微調整

2.4.3 実践課題1

2.4.4 補足:Seaborn

2.4.5 実践課題2

2.4.6 補足:pandas_profiling

2.5 データを整形する ―― Pandas の基礎2

2.5.1 データの前処理

2.5.2 データの操作

2.5.3 表の操作

2.6 解析の実行 ―― NumPy の基礎

2.6.1 NumPy による計算

2.7 おわりに

■ 第3章 教師あり学習のためのデータ前処理

【澤田高志,清水秀幸】

3.1 機械学習の概説

3.1.1 機械学習とは何か?

3.1.2 機械学習とそのライブラリ

3.1.3 機械学習のワークフロー

3.1.4 マイクロアレイデータの解析

3.2 データの前処理

3.2.1 GEOparse を用いたデータの読み込みと欠損値処理

3.2.2 遺伝子発現量データの可視化

3.2.3 遺伝子発現量データの重複の処理

3.2.4 重要な遺伝子発現量データの抽出と欠損値の処理

3.2.5 選ばれた13 種のmRNA の図示

3.3 おわりに

■ 第4章 scikit-learn を用いたトランスクリプトームデータの分類

【澤田高志,清水秀幸】

4.1 機械学習: サポートベクトルマシンの実行

4.1.1 訓練データセットとテストデータセット

4.1.2 サポートベクトルマシンの導入

4.1.3 カーネルトリックによるサポートベクトルマシンの拡張

4.1.4 グリッドサーチによるハイパーパラメータの最適化

4.1.5 検証データセットの導入

4.1.6 ベイズ最適化によるハイパーパラメータの調整

4.2 おわりに

■ 第5章 PyTorch を用いたトランスクリプトームデータの分類

【澤田高志,清水秀幸】

5.1 機械学習:ニューラルネットワークの基礎

5.1.1 基本的なテンソル計算

5.1.2 深層学習の基本知識

5.1.3 PyTorch でニューラルネットワークを構築する

5.1.4 PyTorch のハイパーパラメータを最適化する

5.2 おわりに

■ 第6章 実践編(1):生命科学・医歯学分野の画像を用いた機械学習

【安齋達彦,橋邦彦】

6.1 はじめに

6.2 畳み込みニューラルネットワークを用いた画像判別

6.2.1 プログラムを動作させるための準備と実行手順

6.2.2 画像の読み込み:画像処理の基本

6.2.3 畳み込みニューラルネットワークモデルの構築

6.2.4 学習の実施とその評価

6.2.5 テストデータに対する予測・判別性能の評価

6.2.6 その他のチューニングについて

6.3 Grad CAM による画像分類の判断根拠

6.4 転移学習による判別モデルの構築

6.5 画像セグメンテーションモデルの構築

6.6 おわりに

■ 第7章 実践編(2):腫瘍特異的ネオ抗原の機械学習を用いた予測

【長谷川嵩矩】

7.1 はじめに

7.1.1 ゲノム解析とがん免疫療法

7.1.2 ライブラリのインストール

7.1.3 解析の対象とする変異ペプチド候補の作成

7.2 Python を用いたネオ抗原予測

7.3 おわりに

■ 第8章 実践編(3):シングルセル解析とVAE

【水越周良,小嶋泰弘,島村徹平】

8.1 背景と準備

8.1.1 シングルセル解析における課題

8.1.2 VAE とシングルセル解析

8.1.3 VAE のシングルセル解析への応用例

8.1.4 ライブラリとデータセットの用意

8.2 エンコーダとデコーダの構造

8.3 VAE の学習方法

8.3.1 VAE の理論

8.3.2 デコーダの尤度関数

8.3.3 VAE クラスの実装

8.4 その他の部分の実装

8.4.1 early stopping の実装

8.4.2 データの振り分け

8.4.3 学習の実行箇所の実装

8.5 学習の実行とモデルの評価

8.6 おわりに

■ 第9章 実践編(4):エピジェネティクスを含む多階層の統合によるがん研究

【浅田 健,浜本隆二】

9.1 はじめに

9.2 オートエンコーダを利用したマルチオミクス解析

9.3 オートエンコーダのためのPyTorch コード解説

9.4 コード全体を.py ファイルとして書き出す

9.5 書き出した.py ファイルの実行

9.6 オプションの使用例

9.7 追記:Anaconda 仮想環境

9.8 おわりに

■ 第10章 実践編(5):タンパク質の「言語」の法則を解き明かす 〜アミノ酸配列からのタンパク質局在の予測

【清水秀幸】

10.1 生命科学研究に応用されつつある自然言語処理AI

10.2 アミノ酸配列のみからタンパク質の局在を予測する:事前学習済みモデルの利用

10.2.1 必要になるライブラリの準備

10.2.2 タンパク質局在データのダウンロードと探索

10.2.3 事前学習済みタンパク質言語モデルのダウンロード

10.2.4 アミノ酸配列の事前学習済みモデルによる数値化

10.3 アミノ酸配列のみからタンパク質の局在を予測する:タンパク質局在データによるfine-tuning

10.3.1 ニューラルネットワークの設定

10.3.2 タンパク質局在の学習

10.3.3 学習済みモデルのテストデータに対する性能評価

10.4 おわりに

■ 第11章 実践編(6):AI 創薬へのはじめの一歩

【清水秀幸】

11.1 従来の創薬が抱える2 つの難題と機械学習への期待

11.2 環境の準備

11.2.1 RDKit のインストール

11.3 プロジェクト1:csv ファイルを読み込み,水への溶解度を予測する線形モデルを作る

11.3.1 RDKit の使い方とSMILES 表記

11.3.2 SMILES からの分子記述子の抽出

11.3.3 初めてのQSPR 解析

11.4 プロジェクト2:アンサンブル学習による水溶解度予測

11.4.1 データのダウンロード

11.4.2 アンサンブル学習による溶解度予測

11.5 プロジェクト3:グラフ畳み込みニューラルネットワークによる水溶解性予測

11.5.1 グラフとは何か?

11.5.2 ライブラリのインストールとデータの確認

11.5.3 深層学習モデルの構築

11.5.4 グラフ畳み込みニューラルネットワークの学習

11.6 プロジェクト4:コロナウイルス治療薬探索る

11.6.1 コロナウイルスに関するデータの収集

11.6.2 特徴量の抽出

11.6.3 部分的最小二乗回帰モデルの作成

11.7 おわりに

■ 第12章 発展編(1):機械学習を用いたアプタマー配列の解析と創薬

【岩野夏樹,浜田道昭】

12.1 はじめに

12.1.1 アプタマー創薬

12.1.2 アプタマー創薬と機械学習

12.1.3 本章で取り扱う内容

12.2 RaptGen を用いた配列解析

12.2.1 配列解析の準備

12.2.2 モデルの学習

12.2.3 学習結果の描画

12.2.4 本配列生成モデルの応用

12.3 おわりに

■ 第13章 発展編(2):機械学習によるマイクロバイオームと機能未知遺伝子の解析 〜メタゲノム・対偶遺伝学・近傍遺伝子解析

【西村祐貴,綿野桂人,岩崎 渉】

13.1 準備

13.2 はじめに

13.3 ヒト腸内のメタゲノム解析

13.3.1 アセンブリ

13.3.2 ビニング

13.3.3 系統プレイスメント

13.4 機能未知遺伝子の機能解析と対偶遺伝学的解析・近傍遺伝子解析

13.4.1 系統解析

13.4.2 オルソログクラスタリング

13.4.3 機能アノテーション

13.4.4 機能未知遺伝子解析

13.5 おわりに

■ 第14章 終章:さらなる学習のためのリソース

【清水秀幸】

14.1 注目されつつあるノーコード・ローコードAI

14.2 本書で扱えなかった重要トピックス

14.2.1 強化学習

14.2.2 教師あり学習,教師なし学習の境界の曖昧化

14.2.3 グラフ・ネットワークへの応用

14.2.4 生成モデル

14.2.5 説明可能なAI

14.2.6 蒸留

14.2.7 連合学習と群学習

14.3 より優れた計算リソースを求めて

14.4 生命医科学領域のデータサイエンス・機械学習をさらに勉強するために

14.4.1 Python を習得する

14.4.2 機械学習を理解する

14.4.3 機械学習を実践する

14.4.4 機械学習のメディア・学会をチェックする

14.4.5 生命医科学への応用を実例を通じて学ぶ

14.5 おわりに

■ 索引

■ 執筆者一覧


[バイオウェブ - HOME]BIOWEB(R)サービスに関するお問い合わせ: service@bioweb.ne.jp