ホントにデータを理解できているか!?
皆さん、こんにちは。JMDCの寺島です。
酷暑だった夏も終わり、気が付けば、朝晩過ごしやすい日々になりましたが、いかがお過ごしでしょうか?この連載も『夏休み』をもらい、また、今月から毎月連載を目指して書いていきたいと思います。
今回は前半にJMDCが提供する健康保険組合由来のレセプトデータのこと、後半にチームメンバーと実施した学会発表の内容を記したいと思います。
【JMDCの保険者データとは?】
私たちのチームでもこの3-4年、さまざまな研究の支援をさせていただいています。その多くは、JMDCが古くから提供している『健康保険組合由来のレセプトデータ=保険者データ』を用いた研究です。改めてこのデータの特徴を説明するまでもないかもしれませんが、文字で書くとこんな感じになります。
また、最近では、JMDCの『データイノベーションラボ』のメンバー中心にJMDCデータを紹介する論文をリバイスしているので、引用としてお使いいただければと思います。
Journal of General and Family Medicine. 2021;22(3):118-127.
【データの特徴を知る情報とは】
研究で検討しやすいようにデータの特徴を書いておくことも重要かと思っています。というのも、データベースに登録されている人数、何年前からのデータがあるなど、利活用できる医療データが多く出てきて、標準的にデータの規模を表すようなものは世の中に多く存在しています。私も参加させていただいている日本薬剤疫学会の『薬剤疫学とデータベースタスクフォース』で毎年報告されているのが代表的な情報源になるかと思います。(薬剤疫学会HP:https://www.jspe.jp/committee/020/0210/)
ただ、その情報だけではなかなか研究は検討できないと思います。もちろん、研究対象とする病気の人が何人いる、薬剤を使っている人が何人いる、こういう情報も重要ですが、もう少し、踏み込んで、その特徴をまとめておくのも重要かと考えています。
【JMDCデータの特徴を本当に理解しているのか!?】
ちょっと衝撃的な小見出しですが、現時点で、利活用可能なデータの多くは、他の目的で作成されたデータ(例えば、レセプト自体、本来は医療費を請求するため)を二次利用しているものであり、そのデータの特性や成り立ちからすると、すべてのリサーチクエスチョンに対して回答を得るのは難しい状況です。しかも、各データは二次利用データの故にさまざまなリミテーションが存在しており、研究を企画、実施、結果を解釈する際にはそれに十分、注意をしないといけないと思います。
そこで今回は、データベースを用いた研究において、一般的に言われているリミテーションからもう一歩踏み込んで、留意すべきデータの特徴について検討をしてみました。
①加入者の観察開始年ごとの人数と観察可能年数
②加入者の観察開始と終了の年齢分布
③最新年月に在籍している人の追跡可能年数
2021年12月に在籍確認ができる約800万人において、平均で5.21年(中央値4.75年)、データを遡ることが可能であった。
データを利活用することの多い学会でこうした情報を発表しようと準備をしてみましたが、演題登録に間に合わなかったので、ひとまず、一部分ですがまとめてみました。保険者データは確かに追跡性のあるデータですが、対象とする年齢や疾患によっては、長く追跡できる人に何かしらのバイアスがあったりすることもあります。研究計画を検討する際にこうしたことを十分に理解しておくことも必要ですね。
【日本外来小児科学会のポスター発表】
さて、ここからはチームメンバーと一緒に報告したものについて紹介をしてみたいと思います。私たちのチームでは、データ利活用、研究目線を養うという一環で、自主的にデータを使った研究発表をしています。これは、8月下旬に開催された『日本外来小児科学会』で発表した内容です。
演題名:レセプトデータを用いた乳幼児における重複投与の実態
土屋志織、大高有貴、寺島玄(株式会社JMDC RWE事業部)
内容はこちら
私たちのチームには小さなお子さんを持ちながら働いているメンバーも多くいます。「ポリファーマシー」という言葉がよく使われていますが、一般的に注目されている視点ではないのですが、そうしたことからヒントを得て、かつ、彼らが子育てを通じて感じた日々の疑問から検討してみたという内容です。
こうした活動を通じて、今後もさまざま勉強していきたいと考えています。
お問い合わせはこちら:E-mail gterashima@jmdc.co.jp
Comments