未分類

KEN_ALL.CSVを使える形にする

投稿日:

[browsershot url=”http://www.post.japanpost.jp/zipcode/download.html” width=”400″ ]

日本郵便はKEN_ALL.CSVという名前で住所と郵便番号のデータを配布している

だけど、なにか2段にわたるデータがあったりして使いづらいと評判↓

「全角となっている町域名の文字数が38文字を超える場合、また、半角カタカナとなっている町域名のフリガナが76文字を越える場合には、複数レコードに分割しています。」

これを成形するモジュールがリリースされていたのでさっそく使ってみた

参照

本物の KEN_ALL.csv の処理が簡単に出来る Parse::JapanesePostalCode をリリースした

github.com/yappo/p5-Parse-JapanesePostalCode

環境

ubuntu 11.04 デスクトップ

*macはcpanでモジュールをインストールできなかった

1 moduleをインストール

適当にyesと答えればok

個人のモジュールにしたい場合はそういう設定をしておく

2 sampleを改造してみる

サンプルはなにも出力しないのでprintとかから標準出力してみる

allken.plなどと名前をつけて保存。perl allken.plで実行。途中で止めるときはctrl + c。

ターミナルからはutf-8関係のエラーがでるので標準出力をutf8にする設定をする binmodeとかその辺り

ALL_KEN.CSVはplファイルと同じディレクトリにいれておく

 3 フリガナも加えて、csvに出力してみる

変更点はつぎのとおり

  • real_ken_all.csvという名前で出力する
  • フリガナも出力する
  • subtownやbuildがない場合は空データを追加する

*subtownは1データについて複数データがあるようだがサンプル通り”/”で区切って1データとすることにした

 

たぶんopenとかファイルの例外処理とかしないといけないぽいけどファイルハンドラとreadline関係でうまくいかなかった。

だから、自分の環境ではうまく処理できたが、処理の遅いPCやメモリの少ないPCだとエラーが出た際にPCやHDDを破損するかもしれません。注意してください。自己責任でお願いします。

-未分類
-

執筆者:

関連記事

JavaでExcelにHello World〜Apache POI

環境 Mac OSX Lion java version “1.6.0_33” Java(TM) SE Runtime Environment (build 1.6.0_33- …

オンライン会議システムをインストールする【動画】〜BigBlueButton

    By: mario     オンライン会議システムを試す〜BigBlueButton   こんどはBigBlueButtonをVirtualBoxにイン …

no image

MongoDBのチュートリアルをこなす

MonogoDBの薄い本からメモ 基礎 まず、概念のだいたいの把握から。 データベース 通常のデータベースと同じ概念 コレクション ≒ テーブル ドキュメント ≒ 行 フィールド ≒ 列 インデックス …

jRubyとSwingでWindowsのGUIアプリをつくる(2)~メモ帳

jRubyとSwingでメモ帳をつくってみた 環境 jRubyでexeファイル作成~rawr 参考 Swingを使ってみよう   目次1 プロジェクトを作成する2 テキストエリアを作成する3 …

no image

Ubuntu server12.04にPostgreSQLをインストールする

参考 UbuntuでPostgreSQLを使ってみよう 目次1 インストール2 postgresユーザー設定3 データベース管理4 psqlコンソールの使い方 インストール [crayon-58fd3 …