覚え書きブログ

google colaboratoryでcsvファイルの読み込み

Amazon Cloud9+jupyter notebookのような機能が、以下のgoogle colaboratoryで提供されている。
https://colab.research.google.com

まず、colaboratoryにアクセスすると以下のような画面がでるので、「PYTHON3の新しいノートブック」をクリックする。
f:id:hirotaka_hachiya:20190609225616p:plain

そうすると、jupyter notebookと似ていてGoogle流に拡張された画面が表示される。
f:id:hirotaka_hachiya:20190609230007p:plain

今回は、このcolaboratoryにて、google driveに保存してあるcsvファイルを読み込んでみた。以下は手順のメモである。

1)driveのモジュールをインポート

from google.colab import drive

2)driveのマウント

drive.mount('/content/drive')

そうすると、初めての場合は、以下のような認証が始まるので、指示通りに認証を行う。
f:id:hirotaka_hachiya:20190609230619p:plain
認証が完了すると、「drive/My Drive」以下にgoogle driveのルートがマウントされる。

3)google drive上でファイルのパスを確認
f:id:hirotaka_hachiya:20190609230847p:plain
今回読み込むファイルは、「Data/house-prices-advanced-regression-techniques/house_prices_train.csv」のパスにあることを確認。

4)pandasのread_csvで読み込み
以下のように、「drive/My Drive」以下に、3)で確認したパスを指定して読み込む。

import pandas as pd 
data= pd.read_csv('drive/My Drive/Data/house-prices-advanced-regression-techniques/house_prices_train.csv')

head()を用いて確認すると、無事以下のように読み込みができていることがわかる。
f:id:hirotaka_hachiya:20190609231239p:plain

ついでに、グラフで散布図をプロットしてみると以下のようになる。
f:id:hirotaka_hachiya:20190609231401p:plain