ソフトウェア開発者の日常

こだわりなく書きたいことを書いていきます。

データインポート前に事前エラーチェック

本来なら、インポートプログラムでチェックして、エラーとして表示して欲しいところです。

f:id:AJYA:20160321054507j:plain
photo credit: Code and Jazz via photopin (license)

運用を委託されているシステムで、再度データのインポート作業をすることになりました。
以前はインポート時にエラーが発生し、時間がかかりました。
ajya.hatenablog.jp
今回も同様に、時間がかかることが当然と予想されます。

プログラムを作るより短時間でチェックを可能にする

データインポートでエラーが発生する要因は、以前の作業で把握しています。
そのため、プログラムでチェックをしようと思えば、チェックは可能です。

チェックプログラムを作成し、動作確認をしながらインポートする時間を考えると、チェックプログラムの作成時間がもったいないことになりそうです。
それでもインポートエラーの時間を短縮はしたいため、Excelの関数でデータの概要をつかんで、インポートエラーが発生しそうなデータを把握することにしました。

Excelでチェックできるようにしたのは、

  • セル内の文字列の長さ
  • セル内の「,」の個数

の2点です。

インポートエラーの要因が、文字列を組み合わせたときの長さが、カラムで定義された長さに対して長いためです。
セル内の「,」の個数が1より大きければ、文字列を組み合わせてインポートすることがわかります。

セル内の文字列の長さがわかるので、どのように組み合わせても、カラムで定義された長さに対して短ければエラーが発生しないと判断して、事前チェックは不要になります。
組み合わせによっては、カラムで定義された長さに対して長くなりそうなデータは、事前にチェックして、エラーが発生すると把握できます。

この方法で事前にチェックを行って、以前より手早くデータをインポートすることができるようになりました。


セル内の「,」の個数は、以下の内容がそのまま使えました。
EXCELのセルの中の半角カンマの数を数えたい - その他MS Office | 【OKWAVE】