鶯谷健診センター様(以下、センター)は、旧社会保険庁の機関から平成21年に独立・民営化した医療機関です。
健診者や事業所・健康保険組合の情報を管理するセンターの基幹システムは、民営化以前からのもの。そのため「古い」「使い勝手が悪い」などの問題を抱え、近々、新システムへのリプレースが決定していました。
展示会へ足を運ぶなど情報収集を進める中、システム部門では、新システムに受け継ぐマスターデータの“品質”の重要性に着目。「古い住所や表記の乱れが目立つデータをきれいに整備した上で、新システムに搭載したい」とのご相談をいただきました。
「住所が古くなっていたり、表記規則がバラバラだったりと、不備なデータが増えていました。入力を補助する辞書機能はなく、機能の追加もできない状態でした。入力ルールはありましたが、新しいスタッフが入ってきた時にしっかり引き継ぎされなかったことも原因の一つです」と、担当者は現状を説明します。
「その時点で事業所だけでも約19万件のデータがあり、再検査のご案内などのダイレクトメールを送っていたが、住所・名称の変更など何らかの理由で戻ってくる郵便物が非常に多かった」。重複送付を減らすために、独自の名寄せも試みましたが、元となるデータに表記の乱れがありすぎて難しかったのが実情でした。
「器が良くなっても中に入れるデータに不備があっては、集計や分析ができない。事業所ごとの集計など本来やりたかったことをできるようにしたい」——センターでは新システム運用後の「データ活用」も視野に入れて動いている最中であり、データクレンジング・名寄せの必要性を痛感すると同時に、新しい基幹システムの構築に動き出した今が、まさに絶好のタイミングでした。
新しい基幹システムの本格稼働を翌年に控えた7月、いよいよクレンジング・名寄せが実施されることに。対象となるデータは健診者や事業所・健康保険組合から約36万件です。
「大字・小字の表記は省略する」「住所の分割は1行18文字まで」「省略しない法人格で統一」「姓名分割を可能な範囲でおこなう」「カナ名称を半角統一する」などの細かいルールを決め、さらに名寄せ項目と条件も決めました。
データの受渡しは、セキュリティを考慮し、当初は現地作業も検討しましたが、最終的にはセンター指定のファイル転送サービスを使い、当社内で作業することになりました。
データを預かり3日間でValu∞処理を完了。その結果、住所・名称の全角統一や住所の訂正、旧住所の新住所への変換、空白ルールの統一、姓名分割、郵便番号の補完など数多くのデータが正規化・最新化され、データクレンジング・名寄せに成功しました。
センターでは現在、新基幹システムが本格的に稼働を始め、データクレンジング・名寄せしたデータが運用され始めています。
担当者によると「データに関して現場からのクレームもなく、順調に動いています」とのこと。今回の処理結果に対しては満足をいただけたようです。
同時に「住所の区切りは仕様通りで問題ないが、区切られなかったデータがあったので今後もっと精度を高めてほしい」など、さらなる品質向上に向けてのご要望も承りました。
「新しい基幹システムでは、入力ルールを徹底させ、入力の時点でのデータ品質維持に努めます」と責任者は意気込みを示します。新システムスタートを機にデータベースマネジメントに意識的に取り組むとともに、事業所データの集計や分析などデータ活用にも 乗り出す構えとのことです。
※実データを使ってのテストクレンジングや訪問デモも承ります。お気軽にお問い合わせください。