2018年11月14日水曜日

Jupyterとdatapackageで高等教育機関の研究開発支出額データを取得する

Jupyterとdatapackageで、UNESCO institute for statisticsの高等教育機関の研究開発支出額データを取得してグラフ描画するには、以下のコードを実行します。

〇グラフ出力


サンプルコード

以下のコードで高等教育機関の研究開発支出額データを取得してグラフを描画します。
%matplotlib inline
import matplotlib.pyplot as plt
from datapackage import Package
import pandas as pd

package = Package('https://datahub.io/core/expenditure-on-research-and-development/datapackage.json')

for resource in package.resources:
  if resource.name == "expenditure_csv":
    df = pd.read_csv(resource.descriptor['path'], index_col=['Country', 'TIME'], parse_dates=True)
    df = df[["Higher Education"]]
    df = df.query("Country in ('Japan', 'United States of America', 'United Kingdom of Great Britain and Northern Ireland')")
    df = df.query("TIME >= '2000-01-01'")
    ax = df.unstack(level=0).plot()
    plt.xticks(rotation=90)
    plt.legend(loc='best')
    plt.show()

動作確認バージョン

datapackage=1.14.1 (2020/07/15確認)

関連情報

様々なデータを取得できるdatapackageのまとめ

・datapackageに関する他の記事はこちらを参照してください。

0 件のコメント:

コメントを投稿