ソフトウェア開発者の日常

こだわりなく書きたいことを書いていきます。

大量のデータを登録したときのこと

郵便番号データを検索する仕組みを作りましたが、データを登録する方が大変でした。
データをダウンロードするとCSV形式で12万行以上あります。

Accessのリンクテーブルを使って、全データを追加貼付したら、メモリ不足でエラーになったようでした。

ここで、プログラムを作って登録するか、選択するデータ数を絞ってAccessのリンクテーブルで登録するか少し悩みました。
悩んだ結果、登録プログラムの作成およびデバッグに時間を使うより、Accessのリンクテーブルで登録をした方が、プログラムを作るより速いのではないかと判断しました。

12万行がだめなら、どれくらいなら大丈夫なのか試したところ、2万行は大丈夫でも2万6千行ではエラーになりました。
2万行ずつなら、7度で済みますが、登録にかかる時間が1時間以上かかかるので、タイミングが悪いと登録が終わっているのを忘れて、時間を無駄にしてしまいます。
結局2日がかりで、テストデータベースに登録していました。

本番データベースにも登録しなければならないので、1万行で登録したら1日で登録できました。
1万行なら登録にかかる時間は30分を切るくらいなので、作業の合間合間に確認がとりやすく、タイミングよく登録していけました。

登録後の結果は同じでも、僕にあったペースを見つけらると、効率が随分違います。