希少疾病用医薬品・希少疾病用医療機器のデータをRDF化しよう。その2
さあ,RDF化しよう。
predicateを探せ。
では,どうやってRDF化をしていくのか,ということですが,まずは,グラフの点と点をつなぐ線に意味をつけていきます。この意味付けがとても大事で,オレオレで書くと,前回のエントリに書いたような話が通じん!てことが起こってしまうので,出来るだけ,世界共通語を探します。
どう探す?
とはいえ,RDF化初心者の私には,分からないことが多いので,いろいろ,聞いて,まとめました。
開始
まず,元データからサンプルを用意します。
markdownで書こうかと思ったのですが,見にくくなったので,Google Docsに置きます。
ここから見てね☆
参考にしたサイトは,以下のとおり,地道に,predicateはねーかー,当てはまりそうなのはねーかー,と探していきます。 drugbankで幾つか埋まりました。んー,あんまりぴったりこないのもある〜。
bio2rdfで公開されているdrugabankのデータ例:http://bio2rdf.org/page/drugbank_target:1056
他にも,DBpedia(例:http://dbpedia.org/page/HIV)や,bioportalも 見たのですが,しっくりこなくて,といった時に,FDA(アメリカ食品医薬品局)のデータをRDF化したったぜ,という[ブログを発見] (http://semantically-challenged.blogspot.jp/2010/02/fda-electronic-orange-book-in-rdf.html)。こっからダウンロード出来るぜ,(当然英語だから,ぜ,とか書いていませんが)と書いてあったのでダウンロードして,開いてみたら。Oh... OWL でござる。そしてよく見たら,orangebook(ジェネリック等一般的な医薬品についてまとめたページ→参照ジェネリック医薬品FAQ)のOWLだぜ。(続く)