2016年11月27日日曜日

pythonとhdfsパッケージを使用してHDFSを操作する

pythonでHDFSを操作するのに、hdfsパッケージが使用できます。以下の様にpipでインストールできます。

pip install hdfs

また、Dockerでhdfsパッケージを使用できるコンテナを作成するには、以下のDockerfileを使用します。

Dokcerfile
FROM ubuntu:16.04

RUN locale-gen ja_JP.UTF-8
ENV LANG ja_JP.UTF-8
ENV LC_ALL ja_JP.UTF-8

RUN apt-get update \
  && apt-get -y install python-pip \
  && pip install hdfs

CMD "/bin/bash"
・コンテナのビルド
docker build -t ub1604hdfs .
・コンテナに入る場合(変更は破棄される)
docker run -v `pwd`/dat:/dat --add-host hdfsserver:192.168.1.10 --rm -it ub1604hdfs

Ambariを使用している場合、 接続先は HDFS > Configs > Advanced > Advanced hdfs-site と辿って、dfs.namenode.http-addressを確認します

ファイルの列挙は以下のコードのようにlistメソッドを使用します。
from hdfs import InsecureClient

url = "http://hdfsserver:50070"
client = InsecureClient(url, user="hdfs")

for filename in client.list("/"):
  print(filename)
ローカルファイルをHDFSにアップロードするには、以下のコードのようにuploadメソッドを使用します。
from hdfs import InsecureClient

url = "http://hdfsserver:50070"
client = InsecureClient(url, user="hdfs")

hdfs_path = "/tmp"
local_path = "./test.txt"
client.upload(hdfs_path, local_path)
HDFS上のファイルを読み込むには、以下のコードのようにreadメソッドを使用します。
from hdfs import InsecureClient

url = "http://hdfsserver:50070"
client = InsecureClient(url, user="hdfs")

hdfs_path = "/tmp/test.txt"
with client.read(hdfs_path) as reader:
  print(reader.read())
HDFSのファイルをローカルにダウンロードするには、downloadメソッドを使用します。
from hdfs import InsecureClient

url = "http://hdfsserver:50070"
client = InsecureClient(url, user="hdfs")

hdfs_path = "/tmp/test.txt"
local_path = "/dat/download.txt"
client.download(hdfs_path, local_path)
HDFS上のファイルを削除するには、deleteメソッドを使用できます。
from hdfs import InsecureClient

url = "http://hdfsserver:50070"
client = InsecureClient(url, user="hdfs")

hdfs_path = "/tmp/test.txt"
client.delete(hdfs_path, recursive=True)

2016年10月23日日曜日

pysmbでディレクトリを作成する

pysmbでディレクトリを作成するには、以下のコードのようにSMBConnectionのcreateDirectoryを使用します。
import datetime
import platform
from smb.SMBConnection import SMBConnection

user = "test1"
password = "test1password"
host = "testserver"
shared_folder = "share"
conn = SMBConnection(user, password, platform.uname()[1], host, use_ntlm_v2 = True)
conn.connect(host, 139)

today = datetime.date.today()
todaystr = today.strftime("%Y%m%d")
conn.createDirectory(shared_folder, "foo/" + todaystr)

conn.close()

・pysmbのインストール
pip install pysmb

pysmbでIPアドレスからNetBIOS名を取得する

pysmbでIPアドレスからNetBIOS名を取得するには、以下のコードのようにNetBIOSクラスのqueryIPForNameを使用します。

from nmb.NetBIOS import NetBIOS
import sys

remote_ip = "192.168.1.10"
srv_name=""
timeout=10 # 10 sec
bios = NetBIOS()
srv_name = bios.queryIPForName(remote_ip, timeout=timeout)
bios.close()
if srv_name is None:
  print(remote_ip + " is not found.")
else:
  print(srv_name[0] + " is found.")

・pysmbのインストール
pip install pysmb

2016年8月16日火曜日

flaskでhello worldを行うDockerコンテナを作成する

flaskでhello worldを行うDockerコンテナを作成するには、以下のDockerfileを使用します。

使用するDockerfile
FROM ubuntu:16.04

RUN locale-gen ja_JP.UTF-8
ENV LANG ja_JP.UTF-8
ENV LANGUAGE ja_JP:en
ENV LC_ALL ja_JP.UTF-8

RUN apt-get update \
  && apt-get -y install python-pip \
  && pip install --upgrade Flask

CMD "/bin/bash"

以下のコマンドでコンテナの作成を行う。
docker build -t ub1604flask .

以下のコマンドでコンテナの実行を行う。
docker run -v `pwd`/dat:/dat -p 5000:5000 --rm -it ub1604flask python /dat/app.py

dat/app.py
from flask import Flask
app = Flask(__name__)

@app.route("/")
def index():
    return "Hello World!"

if __name__ == "__main__":
    app.run(host='0.0.0.0')

ブラウザからはホストのIPアドレス:5000でアクセスする。

2016年8月14日日曜日

pyvboxで実行している仮想マシン名を列挙する

pyvboxで実行している仮想マシン名を列挙するには、以下のコードのようにstateを使用します。

import virtualbox

for vm in virtualbox.VirtualBox().machines:
  if vm.state == virtualbox.pool.MachineState.first_online or vm.state == virtualbox.pool.MachineState.last_online:
    print vm.name

2016年5月25日水曜日

Vagrantを使用してCentOS7上でGnome DesktopとXRDPがインストールされた仮想マシン(CentOS7)を作成する

Vagrantを使用してCentOS7上でGnome DesktopとXRDPがインストールされた仮想マシンを作成するには、以下のVagrantfileを使用します。

VAGRANTFILE_API_VERSION = "2"

Vagrant.configure(VAGRANTFILE_API_VERSION) do |config|
  config.vm.box = "centos/7"
  config.vm.hostname = "centos7gui"
  config.vm.network :public_network, ip:"192.168.1.11"
  config.vm.synced_folder ".", "/home/vagrant/sync", disabled: true
  config.vm.synced_folder ".", "/vagrant", type: "virtualbox"
  config.vm.provider :virtualbox do |vbox|
     vbox.name = "centos7gui"
     vbox.gui = true
  end
  config.vm.provision "shell", inline: <<-SHELL
yum -y install wget

# GUIに関連するパッケージをインストール
sudo yum -y groupinstall "Server with GUI"
# 不要なダイアログを表示されないようにする
sudo sh -c "echo 'X-GNOME-Autostart-enabled=false' >> /etc/xdg/autostart/gnome-welcome-tour.desktop"
sudo sh -c "echo 'X-GNOME-Autostart-enabled=false' >> /etc/xdg/autostart/gnome-software-service.desktop"
sudo sh -c "echo 'X-GNOME-Autostart-enabled=false' >> /etc/xdg/autostart/gnome-settings-daemon.desktop"
sudo systemctl disable initial-setup-graphical.service
sudo systemctl disable initial-setup-text.service

sudo systemctl set-default graphical.target

# 日本語のロケールを設定
sudo yum -y install ibus-kkc vlgothic-*
localectl set-locale LANG=ja_JP.UTF-8

# XRDPをインストールして、リモートデスクトップでログインできるようにする。
sudo yum -y install epel-release
sudo yum -y install xrdp
sudo yum -y install tigervnc-server

sudo chcon -t bin_t /usr/sbin/xrdp
sudo chcon -t bin_t /usr/sbin/xrdp-sesman
sudo sed -i "s/max_bpp=32/max_bpp=24/" /etc/xrdp/xrdp.ini 
systemctl start xrdp.service
systemctl enable xrdp.service


telinit 5
SHELL

end

2016年1月4日月曜日

psycopg2を使用してクエリー結果をカラム名でアクセスする

psycopg2を使用してクエリー結果をカラム名でアクセスするには、以下のコードのようにpsycopg2.extrasのDictCursorを使用します。

import psycopg2
import psycopg2.extras

try:
    cnn = psycopg2.connect("dbname=yourdb host=yourhost user=you password=yourpass")
    cur = cnn.cursor(cursor_factory=psycopg2.extras.DictCursor)

    cur.execute("""
      select ... from ...
    """)
    rows = cur.fetchall()
    for row in rows:
        print row['column_name']

    cur.close()
    cnn.close()

except (psycopg2.OperationalError) as e:
    print (e)

※参考
http://initd.org/psycopg/docs/extras.html


○関連情報
・psycopg2に関する他の記事はこちらを参照してください。