未分類

KEN_ALL.CSVを使える形にする

投稿日:

[browsershot url=”http://www.post.japanpost.jp/zipcode/download.html” width=”400″ ]

日本郵便はKEN_ALL.CSVという名前で住所と郵便番号のデータを配布している

だけど、なにか2段にわたるデータがあったりして使いづらいと評判↓

「全角となっている町域名の文字数が38文字を超える場合、また、半角カタカナとなっている町域名のフリガナが76文字を越える場合には、複数レコードに分割しています。」

これを成形するモジュールがリリースされていたのでさっそく使ってみた

参照

本物の KEN_ALL.csv の処理が簡単に出来る Parse::JapanesePostalCode をリリースした

github.com/yappo/p5-Parse-JapanesePostalCode

環境

ubuntu 11.04 デスクトップ

*macはcpanでモジュールをインストールできなかった

1 moduleをインストール

適当にyesと答えればok

個人のモジュールにしたい場合はそういう設定をしておく

2 sampleを改造してみる

サンプルはなにも出力しないのでprintとかから標準出力してみる

allken.plなどと名前をつけて保存。perl allken.plで実行。途中で止めるときはctrl + c。

ターミナルからはutf-8関係のエラーがでるので標準出力をutf8にする設定をする binmodeとかその辺り

ALL_KEN.CSVはplファイルと同じディレクトリにいれておく

 3 フリガナも加えて、csvに出力してみる

変更点はつぎのとおり

  • real_ken_all.csvという名前で出力する
  • フリガナも出力する
  • subtownやbuildがない場合は空データを追加する

*subtownは1データについて複数データがあるようだがサンプル通り”/”で区切って1データとすることにした

 

たぶんopenとかファイルの例外処理とかしないといけないぽいけどファイルハンドラとreadline関係でうまくいかなかった。

だから、自分の環境ではうまく処理できたが、処理の遅いPCやメモリの少ないPCだとエラーが出た際にPCやHDDを破損するかもしれません。注意してください。自己責任でお願いします。

-未分類
-

執筆者:

関連記事

no image

Play Framework 1.2.4のドキュメント

playdocja.appspot.com/documentation/1.2.4/home 矢印のところのバージョンを選択する。 前は1系と2系は別ページだったけど今は同じページから選択するようにな …

jRubyとSwingでWindowsのGUIアプリをつくる(2)~メモ帳

jRubyとSwingでメモ帳をつくってみた 環境 jRubyでexeファイル作成~rawr 参考 Swingを使ってみよう   目次1 プロジェクトを作成する2 テキストエリアを作成する3 …

yousayさんに癒される~fortune

環境 ubuntu server 12.04 ruby 1.9.3p194 fortune | cowsayというネタソフトで牛のAAに占いを喋らせるというコマンド …

jRubyでexeファイル作成~rawr

環境確認 最新のjdkをインストールしてJAVA_HOMEを指定した

目次1 gem rawrをインストール2 プロジェクトディレクト …

Bashでよく使う/使いたいキーバインド

  ctrl + c 実行中のコマンドを中断 長いコマンドを打っていて何も実行せず次の行を出したいときとかにも使う ctrl + r 過去に使ったコマンドをインクリメンタルにサーチ ctrl …