← ニュースAll
医療特化の日本語LLMを東大松尾研らが開発
要約
東京大学の松尾・岩澤研究室が医療向け日本語LLM「Weblab-MedLLM-Qwen-2.5-109B-Instruct」を発表しました。2025年の医師国家試験で高い正答率を示したと伝えられ、さくらインターネットらと連携して開発し、研究者向けに3月5日から8月31日まで無償提供するとしています。診断用途には利用できないとしています。
本文
東京大学の松尾・岩澤研究室は3月5日、医療分野に特化した日本語大規模言語モデル「Weblab-MedLLM-Qwen-2.5-109B-Instruct」を開発したと発表しました。開発はAlibabaのオープンモデルを基に行われ、さくらインターネットやELYZA、ABEJA、理化学研究所、医療機関と連携して進められたと伝えられています。研究チームは同モデルが日本語の医学知識や国内の医療制度に関する情報を学習していると説明しています。提供は研究者向けに限定され、診断や診療、治療行為には利用できないとしています。
報じられている点:
・モデル名はWeblab-MedLLM-Qwen-2.5-109B-Instructで、Qwen-2.5-72B-Instructを基盤に開発したとされます。
・2025年の医師国家試験での正答率は93.3%と報告され、o1の92.8%やR1の91.5%を上回ったと伝えられています。
・外部データ参照(RAG)を組み合わせると、図表や計算を除いて正答率が最大約98%に高まる可能性があるとしています。
・電子カルテの名称標準化に関するタスクでも高い性能を示したとアピールしています。
・研究者向け無償提供は3月5日から8月31日までで、診断用途は禁止とされています。
・開発は政府の「戦略的イノベーション創造プログラム」第3期の補助を受けて実施されたとしています。
まとめ:
今回の発表は医療領域に特化した日本語LLMの研究開発が進んでいることを示しています。研究用途での無償提供期間は3月5日から8月31日までと公表されており、臨床での診断・治療利用は認められていません。今後の公的な評価や運用方針については現時点では未定とされています。
