[09/25] 【オンラインLive配信・WEBセミナー】自然言語処理、大規模言語モデルの活用による専門知識・データ収集への対応と化学および 生成AI時代における材料開発への応用の可能性
開催日時:2025年09月25日(木) 13:00-17:05
¥49,500 (税込)
0ポイント
| 注文数 |
|
|---|
close
受講料
|
1名様
在庫:あり
|
¥49,500(税込) | shopping_cartカゴに入れる | |
|
2名様以上(追加お一人につき)
在庫:あり
|
¥16,500(税込) | shopping_cartカゴに入れる |
SOLD OUT
- 主催:(株)AndTech
【オンラインLive配信・WEBセミナー】自然言語処理、大規模言語モデルの活用による専門知識・データ収集への対応と化学および 生成AI時代における材料開発への応用の可能性
■日時:2025年09月25日(木) 13:00-17:05
■会場:※会社やご自宅のパソコンで視聴可能な講座です
※ お申込み時に送られるWEBセミナー利用規約・マニュアルを必ず、ご確認ください。
■定員:30名
■受講料:49,500円(税込、テキスト費用を含む)
※複数でのご参加を希望される場合、お申込み追加1名ごとに16,500円が加算となります
■主催:(株)AndTech
■講師:
第1部 物質・材料研究機構/オムロンサイニックスエックス/MatQ-lab NIMS特別研究員 / プロジェクトリサーチャー / 個人事業主 吉武 道子 氏
第2部 株式会社TDAI Lab 代表取締役社長 福馬 智生 氏
第3部 シュレーディンガー株式会社 エンタープライズ・インフォマティクス部 / ストラテジック・デプロイメント兼ビジネス開発マネージャー 石崎 貴志 氏
■プログラム:
∽∽───────────────────────∽∽
第1部 生成AI時代の材料科学分野における言語処理の応用展望:マテリアルズインフォマティクスの一部として
【講演主旨】
以下のような事柄について、概要を理解していただき、自社で展開する際の参考にしていただく。
生成AI時代に材料科学分野で自然言語処理技術を利用してどのようなことができるのか、やりたいことを実現するのにどの種類の技術を用いればよいのか、市販ツールがどのような技術を用いているのか、市販ツールを自社カスタマイズする発注の際に言語モデル的に注意すべき点、今後どのようなことができるようになると期待されるか。
【プログラム】
1.概観
1.1 マテリアルズインフォマティクス
物性値、分子構造、結晶構造、化学構造式、物性名、数式、自然言語
1.2 対象とする文書の種類と特徴
論文、特許、書籍、安全・規制に関わる法的文書、社内文書
1.3 求められる処理の種類と特徴
文書分類、検索(目的文書の抽出)、情報の抽出(文中の特定情報の抽出)、文書の関連性、情報の関連性、知識グラフ
1.4 生成AIが得意なこと・不得意なこと
2.言語処理の種類と活用
2.1 単純な統計処理(処理は生成AIがプログラム作成)
・WordCloudなど:文書群の概観
・TF-IDEなど:文書群の分類や大規模言語モデルの拡張への利用
2.2 単語・文のベクトル化(処理は生成AIがプログラム作成)
・Word2Vec、Doc2Vec:文書群の分類や大規模言語モデルの前処理や拡張への利用
2.3 文法ベース(大規模言語モデルの前処理にも使われている)
・品詞解析
・構文解析/照応解析
2.4 大規模言語モデル(生成AIの基盤)
・アテンション付きトランスフォーマー:GPTやBERT
・大規模言語生成モデル
3.材料関連分野に特化したモデル
3.1 様々なモデル
・Word2Vec系:Mat2Vec
・BERT系:SciBERT、BioBERT、BatteryBERT、MatSciBERT、MatBERT、MaterialBERT
・モデル作成時の条件に注意
3.2 言語生成AIの材料分野応用
・Q&A、プロンプトエンジニアリング、添付ファイルからの情報抽出
・RAG(Retrieval-Augmented Generation):検索拡張生成
・KAG(Knowledge-Augmented Generation)またはGraphRAG: 知識拡張生成
3.3 言語生成AI時代の材料分野のモデル評価指標
3.4 材料知識グラフ
4.マルチモーダル化
4.1 画像などテキストとは種類の異なるデータとテキスト(自然言語)のデータとの組み合わせ
4.2 材料科学分野の画像と画像読み取りを要する問題の同時入力と回答
4.3 材料科学分野の画像出力を要する問題の入力と回答
5.各自の用途に合った材料AIボットの自作
毎回問い合わせの文章を入力しなくても、材料名とか特性を入れ替えるだけなど、レシピ作成AI的に使えるAIボットの自作方法
【質疑応答】
【キーワード】
文書の種類・目的別処理、材料特化型モデル、言語生成AIの自社知識適応、マルチモーダル化
【講演のポイント】
最先端の大規模言語モデルの基礎となる様々な技術には、目的によってはそれぞれの技術単体あるいは組み合わせが文書処理に有効な場合がある。時と場合に応じて、材料科学へ応用するのにどの言語処理技術を用いたらよいかがわかる。
【習得できる知識】
・自然言語処理技術の種類による活用法の違い
・材料関連分野の文書の種類による言語処理技術活用の違い
・統計処理(深層学習を含む)言語処理の特徴と活用
・言語生成AIの材料分野への応用例や自社情報の組み合わせ方
・マルチモーダル化(画像データとの組み合わせ)
∽∽───────────────────────∽∽
第2部 大規模言語モデルを活用した専門分野におけるQAシステムの開発とファクトチェックの仕組み
【講演主旨】
※現在、講師の先生に最新のご講演主旨をご考案いただいております。完成次第、本ページを更新いたします。
【プログラム】
※現在、講師の先生に最新のご講演プログラムをご考案いただいております。完成次第、本ページを更新いたします。
はじめに
1. 背景知識
1.1 どうやって言葉を覚えた?
1.2 さらにAIは進化する
2. 専門知識・最新知識への対応
2.1 知識の外挿
2.1.1 コンテキストを用いた応答の例
3. コンテキスト長さの限界
3.1 再帰的要約(Recursive Summarization)
3.2 検索との組み合わせ
3.3 ツールの紹介
4. ファクトチェック
4.1 Hallucination
4.2 ファクトチェックの仕組み
おわりに
【質疑応答】
∽∽───────────────────────∽∽
第3部 自然言語処理、大規模言語モデルによる活用可能なデータの収集に向けた課題と商用パッケージソフトを活用したインフォマティクス基盤構築
【講演主旨】
材料研究では、月報や報告書への文書としての記録が中心で、活用を前提としたデータの記録や蓄積、特に失敗データの記録は少ない。近年、自然言語処理やLLMによる報告書からのデータ抽出が実用化に近づいているが、Excel方眼紙のような自由なフォーマットからの抽出は正確ではない。本講演では、データ活用で先行する製薬研究を参考に、データ記録・蓄積、データ加工、付加価値計算、幅広いユーザによる活用を可能にする仕組みについて解説する。
【プログラム】
1.マテリアルズ・インフォマティクスの現在地
1.1 MI向けソフトウェアの歴史
1.2 企業研究における一般的なMIの課題
1.3 データ駆動型研究
2.データの記録
2.1 登録システム(付番管理)
2.2 電子実験ノート/ELN
2.3 アッセイデータ管理システム
3.データの活用
3.1 研究で生じるデータの種類
3.2 Pythonなどによるデータ処理
3.3 データ計算システム
4.データ駆動型研究の実現のために
4.1 商用パッケージソフトか自社開発か
4.2 製薬研究で使うソフト
4.3 ソフトウェアベンダーの事情
【質疑応答】
【キーワード】
マテリアルズ・インフォマティクス、データ駆動型研究、電子実験ノート、機械学習、データの利活用、研究DX、社内開発
【講演のポイント】
ゼロベースで機械学習などを社内展開するために不可欠な、研究データの記録や活用について、先行する製薬会社での例を説明する。またパッケージソフトを使うメリット・デメリットについて知ることで、自社に適した手段を選択できるようになる。
【習得できる知識】
・研究データの記録のベストプラクティス
・電子実験ノートの概要
・研究データの活用方法
・パッケージソフト導入と自社開発の利点・欠点
カテゴリから本を選ぶ
生物の科学 遺伝
無料試読について
セミナー一覧