データクリーニングの方法

まだまだ実感がありませんが、今年も残すところ3週間ちょっとです。4月から新年度という企業の方は、来年度の計画策定に取り掛かっている時期かと思います。
営業活動、マーケティング活動の基本となるのは顧客リストですが、データを管理していく中で、重複が生じたり、入力規則が不規則になったりどうしても少しずつデータは汚れていきます。そのため、少なくとも年に1回は顧客リストのデータクリーニングを行うことが必要となります。
今回は、Excelの関数や機能を使ったデータクリーニングの方法をご紹介します。

1)セル内改行やタブ記号などを削除する
CLEAN(文字列):文字列からセル内改行を削除する。
2)文字列の前後のブランクを削除する
TRIM(文字列):データの先頭や末尾にあるスペースの削除する。また、文字列の途中に複数のスペースがあるときは一つに減らす。
3)全角、半角を統一する
ASC(文字列) :全角文字を半角にする
JIS(文字列) :半角文字を全角にする
4)名寄せをする
名寄せをする場合、ユニークなキーデータ(企業であれば電話番号や住所、個人であればメールアドレスなど)をもとに名寄せを行っていきます。COUNTIF関数を使うことで重複を見つけることができます。
COUNTIF(範囲,調べるデータ):範囲内にある調べるデータの件数を表示します。
「範囲」には重複データを抽出するセルの範囲を指定します。
「調べるデータ」には、調べるデータを文字列もしくはセルで指定します。
以上、ごくごく基本的なものですが、参考にして頂ければと思います。
作業に入る前に、下記の記事も合わせて閲覧いただければと思います。
データクリーニングを社内人員でやってはいけない理由

Avatar
アイアンドディー

「エキスパートコラム」は、株式会社アイアンドディーのコンサルタントが発信するブログです。マーケティングの最新情報や事例、その他役に立つ情報を発信して参りたいと思います。 株式会社アイアンドディーで実施するイベントの告知、取り扱い製品・サービスの紹介とご導入事例もご案内します。