RでUMINの臨床試験データを取得する
Rひとりアドベントカレンダー22日目です。終盤に差し掛かってまいりました。
さて、国内の臨床試験はUMIN-CTRに登録するようになっている(特定臨床研究はjRCTだったりするが)。
そしてUMIN-CTRはスナップショットとして登録情報をCSVで公開している。
https://www.umin.ac.jp/ctr/csvdata.html
列名が2段になっているのでとりあえず1行目はスキップして2行目を列名として読み込むようにする。
library(readr) ctr <- read_csv("https://upload.umin.ac.jp/ctr_csv/ctr_data_j.csv.gz", skip = 1)
ただし、1行目とひもづけることでユニークになる列名も多数あるようで列名が重複してるぜというメッセージが出るので注意。
ちゃんと分析に使いたい場合は自分で列名を綺麗にした方が良い。
ちなみにアメリカの場合、clinicaltrials.govという臨床試験登録サイトがある。
こちらはWeb APIを提供している。
https://clinicaltrials.gov/api/gui
APIがあれば誰かがパッケージを作ってくれているのが世の常。嬉しい。
https://github.com/sachsmc/rclinicaltrials
どうかな。