キーワード解説(専門知識解説)

質問をクリックしていただくと、答えが表示されます。

病院・診療所等をとりまく状況

医療用データマイニングの応用分野は?

・医療リスクマネジメント(ヒヤリ・ハット等)、安全管理分野
・ターゲットサーベイランス、院内感染対策サーベイランス等
・電子カルテ診療データ分析等
・医療施設経営データ分析等
・臨床検査データ分析等
・その他

なぜ医療用リスクマネジメントなのですか?

・現在、医療事故などが、よく報道されます。
・医療に従事されている方の95%は、自分も医療事故などを生じるかもしれない、と思っておられます。
・病院の安全管理に携わっている先生方は、病院内の「インシデント」「ヒヤリハット」データを収集し、解析されようとしておられます。
・複数のリスクファクターの抽出を行うことができず、リスクの背景因子の分析はどこから着手してよいのか、手をこまねいておられます。
・このような医療安全の「インシデント」「ヒヤリハット」の解析を支援し、リスクマネジメントの、お役に立てるものと考えています。

なぜ厚生労働省院内感染対策サーベイランス分野なのですか?

・2000年7月、厚生労働省院内感染対策サーベイランス(JANIS)が開始され、2010年2月現在、約860施設が、実施中です。
・サーベイランス形式という共通フォーマットができました。
・しかし、この分野でのデータ解析結果として、医療施設には、十分な成果をフィードバックされているとは言えません。
・医療施設の諸先生方がデータマイニング解析を希望され、全国の医療施設等への普及のビジョンを持たれています。

なぜ電子カルテ分野なのですか?

・1999年より、カルテの電子媒体保存が厚生労働省通  達にて承認されました。2001年6月時点で、57病院、321診療所、(2000年6月時点で、31病院、83診療所)に、電子カルテが導入されました。
・電子カルテ導入により、患者病態情報、検査データ、診  療処置等が一体で蓄積され、データマイニングにより、  役に立つパターンを発見することができます。
・某施設では、電子カルテが導入され、その病院の感染管理ドクター等が、データマイニングによる解析を実施し、感染対策等に効果をあげておられます。

なぜ保健所関係なのですか?

・2001年2月に、某府立保健所にて、データマイニングの講習会が、当社協力の下に開催されました。
・保健所は、地域住民の保健・福祉に貢献する使命を担っておられます。
・保健所では、井戸水検査データ等を蓄積しておられます。
・近年、私たちの身の回りの「水」は悪くなる一方です。
・「水」データの解析と対策のためにも、データマイニングによる「水」の背景因子分析は、不可欠です。
・全国の保健所でのデータ解析に、お役に立てるものと、考えております。




医療データマイニング

データマイニングとはどのようなものですか?

データマイニング(Data Mining)の語源:
マイニング(Mining) とは、鉱山から金や宝石などを掘り出すことです。
ですから、データマイニングとは、蓄積されたデータの山の中から、コンピュータを用いて、原因追及に役立つ仮説(原因因子やパターン・傾向など)を見つけ出すことです。

たとえば、感染制御データにデータマイニングを適用すると、
「メタロβ産生菌が検出されるのは、投与抗菌薬がセフェム系で、かつ、11日以上投与のときに、起きていた。その確率は、◎◎パーセント。p値<0.01 」
のような仮説を、ガイドラインのような文章として求めることができます。

背景因子やパターンとはどういうことですか?

・たとえば、
 「○○医療事故が発生したのは、●●や△△や■■、、、など  の条件が重なったときに起こっていた。 ...」
においては、
 ○○医療事故の「背景因子」とは、 ●●や△△や■■など  の条件のことです。
 また、その条件の組み合わせが、「パターン」と呼ばれます。

なぜ今、医療データマイニングなのですか?

・データは、コンピュータの発達とともに、大量に蓄積されてきていますが、データの蓄積量は、人間の「経験と勘」による分析の範囲をはるかに超えています。それゆえ、蓄積されたデータは、十分に有効活用されることはなく、宝の持ち腐れ状態でした。

・医療データマイニングは、このような医療データの山の中から、コンピュータを使用し、人工知能的手法などを活用して、医療に役立つ情報を見つけ出し、データの山を有効利用することができます。

データマイニングは、どのような医療データに適用できるのですか?

・院内感染対策サーベイランスデータ、耐性菌検出データ、インシデントデータ(看護記録データ、針刺し事故データ、転倒事故データ、投薬・注射ミスデータ、検査ニアミスデータなど)、病理検査データ、消毒薬調査データ、投薬副作用データ、診療報酬データなど、どのようなデータでも適用できます。

・検査技師の作業履歴データに対しては、検査技師の検査過程の傾向分析ができるので、検査品質の向上、啓蒙に活用できます。

・その他、最近、普及し始めている電子カルテデータや、地域保健医療関係データなどにも応用できます。

データマイニングをすれば何が分かるのですか?

・蓄積された大量データの山にデータマイニングを適用することによって、データの山の中から、今、起こっている現象の基になる原因追及に役立つ情報が得られます。

・たとえば、医療事故データにデータマイニングを適用すると、「○○医療事故が発生したのは、●●や△△や■■...などの条件が重なったときに起こっていた。その確率は、◎◎パーセント。」のような情報が、得られます。

・それにより原因となる条件に着目し、条件が重ならないように予防策を講じることができます。従って、医療事故の予報、院内感染発生の予報、耐性菌発生予報など、に活用できます。

普通の統計で十分だと思うのですが、なぜデータマイニングが必要なのですか?

・従来のデータの統計は、データを集計し、その結果を、「グラフ」や「表」で表していますので、おおまかな傾向を知ることができます。しかし、その結果になった原因を知ることはできません。「多変量解析」と呼ばれる統計手法を何度も繰り返し行うことで、原因を追及することはできますが、非常に時間と手間のかかるものです。

・一方、データマイニングは、むずかしい統計理論を理解しなくても、データの山の中から、コンピュータを使用し、人工知能的手法などを活用して、時間と手間を大幅に削減して、半自動的に、その結果になった原因を見つけ出すことができます。

データマイニングの作業には、時間や手間がかかりますか?

・従来の統計は、データの山に対して、「スコップ」で宝を掘り続けることであり、データマイニングは、データの山に、「採掘マシン(削岩機、ダイナマイト、ベルトコンベア、自動選別機、など)」を用いて、宝を掘り起こすようなものです。

・たとえば、「16ヶ月のデータ」に対して、普通の統計をするのに、夜なべ仕事で「約2年半」かかりましたが、データマイニングツールを使用しますと、「4年間のデータ」を「わずか数日」で背景因子の解析まで行うことができました。

・データマイニングは、従来の統計に比べて、時間や手間がかかりません。

データマイニングと今までの統計解析とはどう違うのですか?

・今までの統計解析は、はじめに、解決したい仮説があり、たとえば「この薬は、花粉症に効く」という仮説があり、そのためにデータを集め、データに各種の統計検定などを行って、仮説を証明しています。

・データマイニングでは、すでに蓄積されたデータがあり、そのデータの山から、解決したい原因の背景となる「繰り返している条件やその組み合わせなど」を見つけ出し、原因追求に役立つ情報が得られます。すなわち、はじめに、仮説があるのではなく、データの山に「語ってもらう」ということになります。

すでにデータがたまっているのですが、データマイニングで何か答えが出ますか?

・とにかくデータがあれば、何らかの答えを得ることはできます。

・しかし、たとえば、耐性菌検出背景を知りたい場合、データの山に、「患者病態情報や投薬情報など」のような背景因子が入っていなければ、患者病態や投薬と耐性菌検出との関連性の答えを得ることはできません。

・すなわち、「背景因子」が入っていなければ、「ゴミの答え」しか出てきません。

データマイニングをすれば、役に立つ答えが出てくるのですか?

・まず、データの山があれば、何かの答えは出てきます。

・しかし、鉱山から金や宝石を掘り起こす時のように、もともと、そのデータの山の中に金や宝石が埋もれていれば、金や宝石のような答えが出てきますが、宝が埋もれていなければ、いくら掘ってもゴミしか出てきません。

データに未入力箇所(欠損値)があるのですが、データマイニングしても答えは得られますか?

・従来の統計解析では、欠損値があると計算することができません。

・しかし、データマイニングでは、データがすべて埋まっていなくても、解析を行うことができ、与えられたデータをできる限り活用して答えを出してくれます。

・現実のデータは、100パーセント完璧にデータがそろっていなくても、データマイニングは与えられたデータの範囲内で解析を行うことができ、現実のデータ事情に柔軟に対応できます。もちろん、100パーセント、データがそろっている方が、より好ましいことには違いありません。

医療データマイニングを行うソフトウエアはありますか?

・はい。
 医療データマイニング支援ソフト、ICONS Miner(アイコンズ マイナー)があります。

・ このソフトウェア、ICONS Miner は、経済産業省、次世代情報技術開発補助事業で実施された「感染症検査自動化技術開発」の研究成果ですが、感染症以外の医療データに対しても、適用可能な「医療データマイニング・ソフトウェア」です。

普通のグラフ表示や集計など、単純な統計もできますか?

・はい。
 散布図表示、棒グラフ表示、3次元グラフ表示、クロス集計  表示を行うことができます。
 また、クロス集計に対しては、カイ2乗検定、調整化残差、相関検定なども行うことができます。

コンピュータは苦手で統計学も分かりませんが、データマイニングはできますか?

・はい。
 データマイニングソフト、ICONS Minerを使用すれば、難しい統計学を知らなくても、簡単なコンピュータの操作だけで、データ解析を行うことができます。

データマイニングで得られた結果を検証するには、どうすればいいですか?

・「決定木」や「If-thenルール」を得ることができ、そのルール  の信頼性を表す数値として、「確率」、「有意性」が付加されて います。「確率」が大きく、「有意性」が有意水準(0.05や0.01) より小さい程、信頼性のあるルールであることを示しています。
 また、その「If-thenルール」に対応する元データを逆引きする ことができ、元のデータで確認することができます。

決定木(けっていぎ)とは何ですか?

・左図のようなデータマイニングの結果を「決定木」(decision tree)と呼びます。これは熱傷患者の「生死」を分ける要因を病態(敗血症、熱傷程度、年齢など)データに対する分析結果の決定木です。

・ 「敗血症の有無」が「生死」を分ける第一要因で、第二要因は「熱傷の程度」や「気道熱傷の有無」であることを示しています。

If-then(イフ・ゼン)ルールとは何ですか?

・左図の決定木から、わかりやすい文章として取り出したものが「If-thenルール」です。たとえば
 もし(If)敗血症がなし、かつ熱傷  の程度が11-30ならば(then)、生存(14人中14人、100%)。
 もし(If)敗血症が有り、かつ気道  熱傷がなしならば(then)、生存(6人中5人、83.3%)。

目的変数や説明変数とは何ですか?

・前図の決定木から、わかりやすい文章として取り出した    「If-thenルール」において、 
 もし(If)
  「敗血症の有無【説明変数1】」が「なし」、 かつ 「熱傷の程度【説明変数2】」が11-30 ならば(then)、
  「生死【目的変数】」が、「生存」(14人中14人、100%)。

調整化残差とは何ですか?

・クロス集計表から計算される調整化残差は、どこが特徴的なところであるかを示し、その絶対値が、±2以上のところが特徴的な箇所です。

データマイニングを行うにはコンピュータの容量はどの位必要ですか?

・現在市販されている通常のデスクトップパソコンやノートコンピュータであれば、性能的には問題ありません。

・コンピュータの性能ですが、メモリ容量は、256メガバイト、ハードディスク容量、10ギガバイト、CPUスピード、
1ギガHz、であれば、データマイニングを行うことができます。

・ コンピュータは、Windows 2000/Xp マシンで動作します。

データマイニング用の医療データ形式は、どのようになっていればいいですか?

・エクセルのデータのように、先頭行の1行は、データの項目名を表す行になっています。

・次の行からは、対応したデータが並んでいればよいのです。

・そのような行と列になっているテキスト形式データを、基本的な入力データのファイルとしています。

医療データはエクセルにデータが入っているのですが、使えますか?

・はい。
 エクセルにデータが入っていれば、エクセルから、テキスト形式のデータファイルを作成することで、入力データとすることができます。(注:TAB区切りで保存する必要があります。)
 エクセルでは、列の数は、最大255列までですので、現在のところ、列数の最大はエクセルと同じ255列までに制限しています。

入力データ項目数が少ないのですがデータマイニングで結果が得られますか?また、データ列やデータ行はいくつ以上あればデータマイニングできますか?

・データの項目(列)は、2つ以上、データ量(行)は、10行程度以上あれば、データマイニングすることができます。

・通常は、信頼性の視点から100行以上あるのが、望ましいと言えますが、データ量が少ないからと言って、データマイニングができない訳ではありません。

ページメーカープロ、ロータス123、アクセス、パラドックスなど、色々なソフトにデータを入れているのですが、データマイニングすることはできますか?

・はい。
 表計算ソフトのデータのように、表形式として、テキスト形式  (TAB区切り)でデータを作成すれば、データマイニングすることができます。

データマイニングは、厚生労働省、院内感染対策サーベイランス形式のデータに適用出来ますか?

・はい。
 厚生労働省、院内感染対策サーベイランス形式のデータに  対応していますので、そのサーベイランス形式のデータを読み込むことで、データマイニングを行うことができます。

医療データマイニングのソフト体験版をインターネットからダウンロードするには?

・はい。当社では、経済産業省補助事業として、医療データマイニングソフトを作成しました。(カタログをご用意しています)
・その体験版を、ホームページから、どなたでもダウンロードして頂くのは、とても便利ですし、電子メールで質問を受け付けることも、有効な手段です。
 ご質問は、当社ホームページの「問い合わせ」からどうぞ。
・現在、当社インターネットのホームページがありますが、いずれ時期をみて、ダウンロード可能にすることを考えております。
・ホームページ: http://kd-icons.co.jp/
・電子メール: info@kd-icons.co.jp

医療ではMacを使っている人がいますか?

・その通りです。医療の方々の中にはMacを以前より使用しておられます。 
・様々なデータを蓄積しておられることでしょう。
・ただし、開発用プログラム言語は、データベース言語のForthDimensionが、Windowと共通ですが、Macには  CBuilder、Delphiに相当するRADツールがありません。Macでの開発は当社では今のところ距離が遠いのです。  
現在、当社、データマイニングWindows版があります。