2019.1.4
, EurekAlert より:
出版されたがん研究の山を探索する助けになる新しい人工知能(AI)システムが開発された。英国ケンブリッジ大学からの研究報告。
ケンブリッジ大学のコンピュータ科学者とがん研究者のチームによってLION LBDと呼ばれるシステムが開発された。これはがん関連の知見を検索する科学者を補助するようデザインされた、初の文献ベースの発見システムであるという。
世界中で莫大ながん研究費が多くのがん研究者を惹きつけており数多くの学術論文が毎年発表されるため、研究者はそれをフォローするだけでも大変で、しばしば重要な仮説を提出する論文が発表後かなりたってから発見されることもしばしばであるという。
がんは、未だに完全には解明されていない複雑な発症メカニズムをもつ疾患であり、全世界の死亡原因の第2位に位置する。がんの発症には多くの生化学反応、代謝経路の変化が含まれる。がん研究は、科学の広範な分野に広がっている。
「がん研究者としては、何を探すかが分かっている場合でも、数千の文献に取り組まなければならない」とLION LBDの開発を、英国がん研究所の成田匡志博士やスウェーデン・カロリンスカ研究所のウーラ・ステニウス教授らと共に率いたアンナ・コルホーネン教授は述べている。
「LION LBDはAIを使って科学者らがこの分野で出版された発見の情報を常に最新状態に保つことを助けるだけでなく、文献から得られる既知の(けれども見かけ上なんの繋がりもない)情報を結合させて新しい発見を作り出すことを助ける」と教授は言う。
LION LBDの「LBD」は、文献ベースの発見(Literature-Based Discovery)の頭文字で、この概念は1980年代に発展した、繋がっていない情報源からの情報の断片を結合することで新しい発見を作り出そうというものであり、オリジナル版の背後にある鍵となるアイデアは、明示的に文献中でリンクされたことがない概念は、媒介的な概念を介して間接的にリンクされるだろうというものだ。
LION LBDシステムのデザインは、オリジナルの文脈における意味を探求する能力を保持したままで、文献データベース中のエンティティの間に間接的な関連を発見するためのリアルタイムの検索ができるようになっている。
「例えば、あなたがある抗がん薬がある代謝経路に影響することを知っているとき、LION LBDは、全く関係ない疾患に開発された薬が同じ代謝経路に影響することを教えてくれることができる」とコルホーネン教授は語っている。
LION LBDは、がん研究に特化した最初のシステムである。それはがんの分子生物学に特に焦点を当てており、最先端の機械学習と自然言語処理技術が用いられていて、テキスト中のがんに関する参照を検出することができる。システムの評価は、未発見のリンクを同定する能力と、潜在的な繋がりの間にある関連概念をランク付けする能力を証明したという。
このシステムはオープンデータ、オープンソース、オープンスタンダードを使って構築されており、インタラクティブなウェブベースのインターフェイスとプログラマブルAPIが利用可能である。
出典は『バイオインフォマティクス』。 (論文要旨)
|