2020年6月4日木曜日

Debian 10/Ubuntu 20.04でCSV/TSVをSQLを使用して集計・抽出ができるqツールをインストールする

qでCSV/TSVをSQLを使用して集計・抽出する事ができます。

〇インストール方法
以下のコマンドを実行します。
wget https://github.com/harelba/packages-for-q/raw/master/deb/q-text-as-data_2.0.9-2_amd64.deb
sudo dpkg -i q-text-as-data_2.0.9-2_amd64.deb

〇サンプル実行
cat << EOF > sales.csv
store_id,yyyymm,sales
1,202005,400
1,202006,1000
2,202005,400
2,202006,800
3,202005,100
3,202006,1100
4,202005,200
4,202006,1200
EOF

cat << EOF > store.csv
store_id,store_name
1,store_tokyo
2,store_osaka
3,store_sanfrancisco
4,store_newyork
EOF

q -d , -H "SELECT store_name, SUM(sales) FROM ./sales.csv dat LEFT OUTER JOIN ./store.csv st ON (dat.store_id = st.store_id) GROUP BY store_name"

0 件のコメント:

コメントを投稿