INFORMATIONお役立ち情報

INFORMATION お役立ち情報

お役立ち情報

【中国A20】ダブりを排除する「名寄せ」とは2022.03.09

 

 

1. 「名寄せ」とは

 

データベースの中から、氏名・住所・電話番号などの
情報を手がかりにして、同じ人物や、同じ企業のデータを
1つにまとめる作業のこと。

 

 

そういった事態を防ぐために、
各々の人物を識別するための名前やメールアドレスなどの属性が
同じものに同一のIDを与えて統合する作業を「名寄せ」と言う。

 

 

 

 

2. なぜ名寄せが必要なのか?

 

近年、顧客情報の管理はデジタルツールで行うようになってきた。

 

しかし、誰でも入力できるため
データの不備・重複に課題を感じている企業も増えているようです。

 

顧客リストに重複などの不備があると、以下のようなことが起こる。

・自社の営業担当Aさんが先週訪問して商品説明をしたお客様に、
 別の営業担当Bさんが同じ商品を提案するアポ取り電話をかける

 

・サービスを解約した人に以下の内容の連絡をしてしまう
 「いつも弊社をご利用いただきありがとうございます」

 

 

 

もしあなたがお客様の立場なら、
このような会社に対するイメージは著しく下がるのでは。

 

このようなことを防ぐために、
顧客リストのデータは常に正確にする必要があります。

 

データ入力の際のルールを統一して運用している企業も多いが、
関係者全員にルールを徹底してもらうことは現実的には難しい。

 

そのため、顧客リストの正確性を担保するためには、
定期的なメンテナンスが必要になります。
ここで「名寄せ」作業が発生するのです。

 

 

 

 

3. 一般的な 「名寄せ作業」 のプロセス

 

 

 

①対象データの調査・選別

 

名寄せしたいデータ内の各属性の入力状況を調べ、現状を把握。
現状の入力状況に応じて最終的な入力方針を決定し、
最終的にどのような方向でデータをまとめるのかを明確にする。

 

 

 

②データ抽出

 

データベースから、顧客を特定するために必要となるデータ項目を
洗い出し、各データソースから抽出。
その際には、データ項目の検討が必要。

 

たとえば、あるデータベースでは「会社名」となっている項目が、
他のデータベースでは「社名」になっていることがある。
これらが同じものか確認する。

 

 

以下の例のように、複数のデータベースを統合したいときに、
同じ情報が異なる形式で管理されていることがある。

 

統合する際はどちらの形式で抽出するかを決める必要がある。
(例)・データベースA:住所
      ・データベースB:郵便番号/都道府県/市町村名/番地/ビル名

 

 

 

③データクレンジングとは

 

データベース内の情報を一貫したルールの元で、
全角文字と半角文字、空白や区切り記号などを統一すること。

 

データのクレンジングをしないと、次のマッチングのプロセスで、
同一人物とみなすことが困難になり、名寄せの精度が下がってしまう。

 

データ内の各要素から重複や表記上の誤り、「表記ゆれ」などを探し、
それらの削除や修正を行うことで、データの質を向上させていく。

 

 

名寄せの作業を複雑にしているもっとも大きな要因が、
「表記ゆれ」問題といわれている。

 

表記ゆれとは、以下の現象のこと。
「同じことを表現しているのに、表記が違っている」

 

典型的な表記ゆれの例として、以下が挙げられます。
(例)・氏名(「桜井さん」と「櫻井さん」)
      ・会社名(「株式会社ABC」と「株式会社エービーシー」)
      ・住所(「3丁目1番14号」と「3-1-14」)

 

 

 

④マッチング

 

同じ種類・属性と識別された各々の要素に同一のIDを付与し
同一要素として特定できるようにしていく。

 

これまでデータベース内に存在していた要素の「ダブり」を排除し、
運用に不具合が生じないようにできる。

 

 

名寄せは顧客対応やマーケティングの高度化など、
企業の競争力を高めるために重要な作業ではあるが、
それ自体だけでは価値を生みません。

 

そのため、デジタルツールの活用などで出来るだけ効率化し、
コストダウンを図ることが必要。

 

 

 

 

「この記事についてのご意見をお聞かせください」ご意見を反映させてお役立ち情報を作成していきます。

本ホームページの収録内容はすべて当社に著作権があります。
無断転載・複製は、固くお断りいたします。
以下の場合には、お気軽にお問い合わせください。
サービス内容 / 機能の実現性 / お⾒積もり