RでUMINの臨床試験データを取得する

Rひとりアドベントカレンダー22日目です。終盤に差し掛かってまいりました。

さて、国内の臨床試験はUMIN-CTRに登録するようになっている(特定臨床研究はjRCTだったりするが)。

そしてUMIN-CTRはスナップショットとして登録情報をCSVで公開している。

https://www.umin.ac.jp/ctr/csvdata.html

列名が2段になっているのでとりあえず1行目はスキップして2行目を列名として読み込むようにする。

library(readr)
ctr <- read_csv("https://upload.umin.ac.jp/ctr_csv/ctr_data_j.csv.gz", skip = 1)

ただし、1行目とひもづけることでユニークになる列名も多数あるようで列名が重複してるぜというメッセージが出るので注意。

ちゃんと分析に使いたい場合は自分で列名を綺麗にした方が良い。

ちなみにアメリカの場合、clinicaltrials.govという臨床試験登録サイトがある。

こちらはWeb APIを提供している。

https://clinicaltrials.gov/api/gui

APIがあれば誰かがパッケージを作ってくれているのが世の常。嬉しい。

https://github.com/sachsmc/rclinicaltrials

どうかな。