これ1冊マスターすればそれなりに戦えるPython技術者になれます(きっと)。機械学習の基礎(パーセプトロンとか)とPythonの基本文法を覚えた後に読むのがよさそうです。


↑気になったらここからポチっと↑
見よう見まねで機械学習をやってきたので、後付けだけど機械学習について体系的に学んでみようの第三弾。
scikit-learnという機械学習の王道ライブラリ(ニューラルネットワークのモデルやら便利な関数やらが標準装備された無料のライブラリ)の実践的な使い方指南から、画像認識・文章解析、機械学習したモデルのWebサーバーへの実装まで幅広く解説されています。表紙に「AI技術の基本を習得!」って書いてありましたが、個人的な感覚だと、中級者向けのような気がします。
↓気になったらここからポチっと↓
↑気になったらここからポチっと↑
見よう見まねで機械学習をやってきたので、後付けだけど機械学習について体系的に学んでみようの第三弾。
scikit-learnという機械学習の王道ライブラリ(ニューラルネットワークのモデルやら便利な関数やらが標準装備された無料のライブラリ)の実践的な使い方指南から、画像認識・文章解析、機械学習したモデルのWebサーバーへの実装まで幅広く解説されています。表紙に「AI技術の基本を習得!」って書いてありましたが、個人的な感覚だと、中級者向けのような気がします。
この本を読むとわかること
本書の章立てと各章の概要はこんな感じです。Jupyterで動かせるソースコードがダウンロードできるので、本の内容がよくわからない場合はとりあえずそのまま実行したり、少しパラメータをいじって動かしたりするとなんとなく理解した気になれます。
分類問題:機械学習のアルゴリズムトレーニング
- 機械学習のアルゴリズムに対する直観を養う。
- pandas・Numpy・matplotlibを使ってデータの読込・処理・可視化を行う。
- 線形分類のアルゴリズムをPythonで実装する。
分類問題:機械学習ライブラリscikit-learnの活用
- よく使用されている分類アルゴリズムの概念
- scikit-learn機械学習ライブラリの使用方法
- 機械学習アルゴリズムを選択するときに生じる疑問
データ前処理:よりよいトレーニングセットの構築
- データセットにおける欠測値の削除と推定
- 機械学習のアルゴリズムに合わせたカテゴリデータの整形
- モデルの構築に適した特徴量の選択
次元削減でデータを圧縮する
- 教師なしデータ圧縮での主成分分籍(PCA)
- クラスの分離を最大化する教師あり次元削減法としての線形判別分析(LDA)
- カーネル主成分分籍による非線形次元削減
モデルの評価とハイパーパラメータのチューニングのベストプラクティス
- モデルの性能の偏りのない推定量の算出
- 機械学習のアルゴリズムに共通する問題の診断
- 機械学習のモデルのチューニング
- 様々な性能指標に基づく予測モデルの評価
アンサンブル学習:異なるモデルの組み合わせ
- 多数決に基づく予測
- トレーニングデータセットのランダムな組み合わせを繰り返し抽出することによる過学習の抑制
- 誤答から学習する「弱学習」による強力なモデルの構築
機械学習の適用1:感情分析
- テキストデータのクレンジングと準備
- テキストドキュメントからの特徴ベクトルの構築
- 映画レビューを肯定的な文と否定的な文に分類する機械学習のモデルのトレーニング
- アウトオブコア学習に基づく大規模なテキストデータセットの処理
機械学習の適用2:Webアプリケーション
- トレーニングされた機械学習モデルの状態を保存する。
- データストレージとしてSQLiteデータベースを使用する。
- 人気の高いWebフレームワークFlaskを使ってWebアプリケーションを開発する。
- 機械学習アプリケーションをパブリックWebサーバーにデプロイ(展開)する。
回帰分析:連続値をとる目的変数の予測
- データセットの探索と可視化。
- 線形回帰モデルを実装するための各種アプローチの考察。
- 外れ値に対して頑健な回帰モデルのトレーニング。
- 回帰モデルの評価と一般的な問題の診断。
- 回帰モデルの非線形データでの学習。
クラスタ分析:ラベルなしデータの解析
- よく知られているk-means(k平均法)を使って類似点の中心を見つけ出す。
- 階層的クラスタ木をボトムアップ方式で構築する。
- 密度に基づくクラスタリングアプローチを使ってオブジェクトの任意の形状を識別する。
ニューラルネットワーク:画像認識トレーニング
- 多層ニューラルネットワークの概念を理解する。
- 画像を分割するためのニューラルネットワークをトレーニングする。
- ニューラルネットワークをトレーニングするための強力なバックプロパゲーションアルゴリズムを実装する。
- ニューラルネットワークの実装をデバッグする。
ニューラルネットワーク:数値計算ライブラリTheanoによるトレーニングの並列化
- Theanoを使って最適化された機械学習コードを作成する。
- 人工ニューラルネットワークの活性化関数を選択する。
- すばやく簡単に実験を行うためにディープラーニングライブラリKerasを使用する。
↓気になったらここからポチっと↓