GM Abstract Scanは、LLM(large language model, 大規模言語モデル)を用いるPubMed検索補助アプリケーションです。1)任意の指示文(あるいは単語)から検索式をLLMで作成し、PubMedを検索;2)ダウンロードしたアブストラクトをLLMで分析します。
ユーザーの入力は「検索」ボックスと「分析」ボックスで行います。アプリケーションの応答は「応答」ボックスに出力されます。
1.検索したい内容を「検索内容」ボックスに入力します。
2.検索件数とソート条件を入力します。
ソート条件の説明:most recent, ネット公開日順;publication date, 正規出版日順;best match, 検索クエリへの適合度順(NCBI自慢のアルゴリズムによる;NCBI PubMed検索のデフォルト設定)。
3.「検索」ボタンをクリックします。
作業過程が「応答」ボックスに表示されます。アブストラクト・ファイルがローカルPCにダウンロードされ、最後のメッセージ「4) 保存完了」が出現したら終了です。
例:「EGFR変異陽性肺癌の治療法」 件数50件で検索したときに表示されたメッセージ。
1) クエリ作成完了
(((EGFR[Title/Abstract] OR "Epidermal Growth Factor Receptor"[Title/Abstract] OR EGFR[MeSH
Terms])
AND (mutation[Title/Abstract] OR mutated[Title/Abstract] OR mutant[Title/Abstract] OR "EGFR Mutations"[MeSH
Terms])
AND (positive[Title/Abstract] OR positivity[Title/Abstract])) AND (lung cancer[Title/Abstract] OR "Lung
Neoplasms"[MeSH Terms] OR NSCLC[Title/Abstract] OR "Non-Small Cell Lung Carcinoma"[MeSH Terms])) AND
(treatment[Title/Abstract] OR therapy[Title/Abstract] OR "Therapeutics"[MeSH Subheading] OR "Drug Therapy"[MeSH
Terms])
2) PubMed検索完了(50件)
3) 取得完了(50件)
4) 保存完了: (((EGFR_Title_Abstract_ OR _Epidermal Growth Factor
Receptor_50_abstracts.txt
1.LLMへの指示を「ユーザー指示」ボックスに書き込む;空欄の場合は検索上位20件を要約します。
2.「分析」ボタンをクリック ー>「応答」ボックスに「LLMに要約/解析を依頼中…」 ー> 返答が表示されれば終了。
注1.ダウンロードしたPubMedアブストラクトはローカルPCのメモリに保持されているので「分析」ボタンのクリックを繰り返すだけで、連続して分析を行うことができます。
注2.低頻度でLLMエラーが発生します。アブストラクトのダウンロードエラーも低頻度で発生します。
「応答」ボックス下の「コピー」ボタンをクリックして内容をテキストファイルにコピー、マークダウン形式(拡張子.md)で保存します。txt, rtf, docxで保存してもよいが、表やリンクの表示を的確に行うためにはmdを推奨。
mdファイル閲覧には、ブラウザ拡張機能やマークダウンエディタを用います。
ブラウザ拡張機能:Markdown Viewer など。
エディタ:VSCodeが一般的。MacではMarkEdit;マークダウン表示には機能拡張 MarkEdit-previewを用います。
ChatGPTを使用。システムレベルで次の設定を行ってます:情報源はアブストラクトのみ。外部情報使用禁止、推論禁止;日本語・マークダウン形式の出力;引用はPubMed ID(NCBIへのハイパーリンク付);要約の出力は表形式。
研究動向調査は研究者の日常作業ですが、医学・生命科学ではPubMedを使う事が多い。専門分野の場合、自身の知識で内容を補完するので、論文の概要を把握するためにはアブストラクト全文を読む必要はなく、「要約の要約」で十分です。GM Abstract Scan は、PubMedアブストラクトのタイトル、アブストラクトの要約、掲載誌名とPubMedサイトへのハイパーリンクを表形式(マークダウン)で出力します。
個別要約は「ユーザー指示」ボックスで検索順位を指定して行います(例:検索上位51位から100位までをそれぞれ要約して)。一度に処理するアブストラクトが多い場合、出力が不安定になることがあります。
臨床医学では日夜大量の臨床試験、症例報告が公開されています。大量の論文の「要約の要約」から、読むべき論文を選択することができます。
「分析」ボックスでの指示で、ダウンロードした全アブストラクトの内容を要約し、レポートを作成します。AI 分析には「外部情報使用禁止」「推論禁止」の2つの制限があり、アブストラクトの内容のみを分析したレポートになります。
全体要約の例文:ダウンロードファイル全体について2000字程度の報告書をつくって;本文中の引用には、PubMed IDを使い、NCBI PubMedへのハイパーリンクを必ず付加すること;アブストラクトの個別要約は不要。
検索されたPubMedアブストラクトはローカルPCのメモリだけでなく、ハードディスク(あるいはSSD)にもダウンロードされます。このダウンロードファイルをチャットボットに添付すれば、上記の制限のない解析を行う事が可能です。
本アプリケーションのコードは、MIT ライセンスで公開しています(ライセンス)。MIT ライセンス保護下の内容(アプリケーションの動作など)については、開発者個人ホームページ(GM Abstract Scan 質問窓口)で質問を受け付けています。