maoring blog

このブログはセマンティックウェブ関連の技術的なあれこれを綴ったブログです。

希少疾病用医薬品・希少疾病用医療機器のデータをRDF化しよう。その2

さあ,RDF化しよう。

predicateを探せ。

では,どうやってRDF化をしていくのか,ということですが,まずは,グラフの点と点をつなぐ線に意味をつけていきます。この意味付けがとても大事で,オレオレで書くと,前回のエントリに書いたような話が通じん!てことが起こってしまうので,出来るだけ,世界共通語を探します。

どう探す?

とはいえ,RDF化初心者の私には,分からないことが多いので,いろいろ,聞いてまとめました

開始

まず,元データからサンプルを用意します。 markdownで書こうかと思ったのですが,見にくくなったので,Google Docsに置きます。
ここから見てね☆
参考にしたサイトは,以下のとおり,地道に,predicateはねーかー,当てはまりそうなのはねーかー,と探していきます。 drugbankで幾つか埋まりました。んー,あんまりぴったりこないのもある〜。 bio2rdfで公開されているdrugabankのデータ例:http://bio2rdf.org/page/drugbank_target:1056

他にも,DBpedia(例:http://dbpedia.org/page/HIV)や,bioportalも 見たのですが,しっくりこなくて,といった時に,FDA(アメリカ食品医薬品局)のデータをRDF化したったぜ,という[ブログを発見] (http://semantically-challenged.blogspot.jp/2010/02/fda-electronic-orange-book-in-rdf.html)。こっからダウンロード出来るぜ,(当然英語だから,ぜ,とか書いていませんが)と書いてあったのでダウンロードして,開いてみたら。Oh... OWL でござる。そしてよく見たら,orangebook(ジェネリック等一般的な医薬品についてまとめたページ→参照ジェネリック医薬品FAQ)のOWLだぜ。(続く)