仕組みがわかる!Pythonでデータサイエンスをはじめる環境構築方法

こんにちは、タクロウです!

機械学習や統計などデータサイエンスを行いたいけど、環境構築でつまずきやめてしまうことはないでしょうか?

言葉や実行しているコマンドを丁寧に説明しながら、Pythonでデータサイエンスをはじめる環境構築方法を紹介します!

環境

  • OS:macOS High Sierra
  • プログラミング言語:Python3系
  • Python仮想環境:pyenv
  • Pythonパッケージ:Anaconda
  • パッケージ管理システム:Homebrew

Homebrewインストール:パッケージ管理システム

Pythonやライブラリのインストールに便利なOS X上で動くパッケージ管理システムHomebrewをインストールします。

パッケージ管理システムとは、各種のソフトウェアの導入と削除、ソフトウェア同士やライブラリの依存関係を管理するシステムです。

Homebrewの公式サイトに記載されている下記コマンドをターミナルから実行しましょう。

$ /usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

Pyenvインストール:Python仮想環境

Pythonの複数バージョンを使いわけできるバージョン管理ツールpyenvをインストールします。

ターミナルに以下のコマンドを実行し、pyenvをインストールします。

$ brew install pyenv
$ brew install pyenv-virtualenv

pyenv-virtualenvは同じPythonバージョンで違う環境を作成するためのpyenvのブラグインです。

インストールできたら、pyenvを初期化するコマンド($ pyenv init-)を、ターミナル起動時に実行される.bash_procfileファイルに追加し、設定を反映させるためにsourceコマンドを実行します。

$ echo 'eval "$(pyenv init -)"' >> ~/.bash_profile
$ source ~/.bash_profile
Memo
evalコマンドは以下の形式で文字列をコマンドとして実行します。
eval 文字列
echoコマンドは以下の形式で文字列をファイルに追記します。
$ echo 追記する文字列 >> ファイル名

Anacondaインストール:Pythonパッケージ

pyenvからインストール可能なPythonの一覧を確認します。

$ pyenv install --list

データサイエンスで使うライブラリがセットになっているPythonパッケージのAnacondaをインストールします。

$ pyenv install anaconda3-5.3.0

インストールしたAnacondaにバージョンを切り替えます。

$ pyenv global anaconda3-5.3.0

特定のディレクトリ内のみバージョンを切り替えたいときはglobalコマンドではなく、localコマンドを使用します。

以上でPythonでデータサイエンスを行う環境構築ができました。データサイエンスを学んでいきましょう!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です