Python Ubuntu

Pythonではじめての機械学習2〜scikit-learnとpandasで決定木

投稿日:

決定木(Decision Tree)

決定木は、木構造になっている分類器.
ある特徴を持ったデータと分類結果から学習して、決定木を作成する.
その方法は、ジニ係数という尺度で、データ群をもっとも分類できる特徴から抜き出していき、順番にデータ群を分類できる特徴を抜き出していく.
その結果、木構造になった分類器ができる.

サンプルデータの用意

Irisデータを使って決定木を作ってみる.
Irisデータは一番有名なサンプルデータ.

学習用データと検証用データにわける

特徴的なデータが検証用データに偏ると学習時に分類できないことがあるので注意.

scikit-learn

学習結果の保存と読込

決定木の図を作成

まずgraphvizをインストールしておく.

次に、pydotplusをインストール

scikit-learn で決定木分析 (CART 法)を参考に保存.

決定木の図の見方
まず、X[3]<=0.8かどうかで、第1群がすべて分類できる.
次に、X[3]<=1.75かどうかで、第2群が多いグループと第3群が多いグループにわけられる.
というふうに、最後まで下っていけば、分類ができるという仕組み.
ディープラーニングでは学習結果はブラックボックスだが、決定木では学習結果が見通せるところがよいところ.

AWS Access Key ID: AKIAIZUDN7SMNJFMNVLA. You are submitting requests too quickly. Please retry your requests at a slower rate.

-Python, Ubuntu
-, , , ,

執筆者:

関連記事

Let’s go Ubuntu Unity!

By: Marcin Wichary – CC BY 2.0 目次1 Ubuntu Unity2 CompizConfig Setting Manager と Unity Tweak To …

市場テクニカル分析ライブラリta-libとPython用のラッパーTa-Libをインストールする

By: GotCredit – CC BY 2.0 目次1 ta-lib2 Ta-Lib ta-lib ta-libは市場のテクニカル分析用のライブラリ集. linuxの場合はソースコード …

no image

Ubuntu Server12.04にRedmine2.0.3をインストール

環境 Ubuntu Server12.04にrvmでrubyをインストール 目次1 準備2 MySQLを準備3 nginxのインストール4 Redmineのダウンロードと展開5 config/data …

zshの機能と設定まとめ

By: Marsha Wheatley – CC BY 2.0 目次1 zsh機能の紹介 ニコニコ動画2 環境3 colors 色の設定4 Completion 補完機能5 Correct …

企業レベルのコンテンツマネジメントシステムAlfresco Community5.1をubuntu server14.04にインストールしてみた

By: jenny downing – CC BY 2.0 目次1 Alfresco Community2 ダウンロード3 LibreOfficeのライブラリのインストール4 Alfres …