特集記事 原子力保全DXに係る我が国が目指すべき方向性
公開日:1.変遷を続ける核セキュリティ脅威
我々原子力に関わる人間が最上段に掲げる共通の目的は「原子力・核物質の平和利用」であり、その為のミッションとして原子力安全、核セキュリティ、核不拡散の3つがある。このうち、核不拡散は核兵器国を増やさず保有国の核兵器の増加を抑制及び減らすことであり、その対象は「国家」である。一方、核セキュリティは核物質、RI、関連施設、輸送等の犯罪行為又は故意の違反行為の防止、探知及び対応であり、その対象はテログループなどの「非国家主体」となる。核セキュリティと核不拡散はしばしば混同されるが、実はこのように明確な違いがあるのである。
図1 原子力安全、核セキュリティ、
核不拡散のミッションと手段および対象
核セキュリティが対象とする脅威は、時代と共に変遷してきた。初期の脅威は核テロ脅威、すなわち核兵器の盗取と核物質の盗取が主であったが、2001年9月11日の米国同時多発テロを受けて、ダーティボム用RIの盗取や原子力施設への妨害破壊行為などの社会を対象としたテロも核セキュリティ脅威に追加された。また、テロの手段自体も巧妙化していることから、IAEAは内部脅威者・サイバー攻撃・Stand-off攻撃などの新たな手段への対策を提唱している。さらに2022年には、ロシア軍のザポリージャ原子力発電所占拠という、これまでの想定を超えた「戦時の核セキュリティ」という新たな概念への対策も必要となった。このように、核セキュリティ脅威は現在進行形で多様化・巧妙化・拡大を続けているが、一方で世界の核セキュリティ対策は、「新たな脅威」や「想定を超える脅威(BDBT; Beyond Design Based Threats)」に対し後れを取っている。
図2 新たな核セキュリティ脅威(手段)
2.DXの潜在力を持つ原子力とその課題
Society5.0とは、狩猟社会、農耕社会、工業社会、情報社会につづく新たな社会と定義づけられている。また、サイバー空間(仮想空間)とフィジカル空間(現実空間)を高度に融合させたシステムにより、経済発展と社会的課題の解決を両立する、人間中心の社会の実現を目指す取り組みともされている。さらに、内閣府による説明では、IoTで全ての人とモノがつながり新たな価値がうまれる社会、イノベーションにより様々なニーズに対応できる社会、AIにより必要な情報が必要な時に供給される社会、ロボットや自動走行車などの技術で人の可能性が広がる社会が、Society5.0で実現する社会のイメージであるとしている。これらに共通なのは、いずれもその実現手段がDXなことである。
3.Society5.0を満たすDXのあるべき姿
米国ではLWRSというDOEの研究・技術開発プログラムで、プラントの活動を個別に変革するために必要な以下の研究領域を設定し、他産業には遅れるものの、デジタル化を始動した。また、NRCによる原子力産業界へ「導入が有益なデジタル技術」の一斉アンケートを行い、結果をweb公開している。
DX実用化の成否を分けるのは、最後にはいかに豊富な学習データを持つか、でもあり、保守管理データ等を長年にわたり豊富に蓄積した原子力業界は、DXの拠点の一つとなる潜在力を秘めているのである。
一方、国内の原子力産業の現状をみると、極めて厳しい規制や安全性への影響評価の労力とコストを懸念し、米国のような原子力DXの導入には慎重である。そのためか、導入のための業界ルール等も全く考えられていない。ここで考えられるのは、日本の原子力業界は、原子力DXのあるべき姿をまだ誰も共有できていないのでは?ということである。
これは原子力以外でも同様である。我が国では個別のデジタル技術研究・開発の事例は少なくはないのであるが、いずれも既存のシステムを単にデジタル化しただけのものをDXとして宣伝しているものも多い。
そもそも、図3で述べた内閣府によるSociety5.0は、実現のしやすさに重点を置いてかなりブレークダウンしたイメージになっている。現在、国内外で開発されているDXのほとんどは、まさにこのイメージに近い。
図4 Society 4.0からSociety 5.0へ (内閣府HPより) [1]
一方、内閣府はSociety 5.0を図4のようにも説明している。ここでは、フィジカル空間にいる人間やモノが、サイバー空間のクラウドに対してアクセスして情報を入手・分析する社会をSociety 4.0としているのに対し、人工知能AIがビッグデータを解析し人に最適提案までをも提供してくれる社会をSociety 5.0と位置付けている。この観点からは、現状の国内外のDXはSociety 5.0のレベルに到達しているとはとても言えず、せいぜいSociety 4.5止まりである。
日本が今後、世界をリードしてDX及び原子力DXを牽引していくための一つの手段が、Society 5.0の概念に合致した「AIが自ら思考するDX」の開発ではないだろうか。そのカギとなるのは、最近話題の強化学習であろう。
図5 強化学習AIの基本構造
強化学習AIとは、図5のようにある環境内におけるエージェントが現在の状態を観測し、取るべき行動を決定する問題を扱う機械学習の一種である。エージェントは行動を選択することで環境から報酬を得られ、一連の行動を通じて報酬が最も多く得られるような方策(policy)を学習する。
これを原子力に適用する場合、プラントデータや保全計画、保守保全データなどのあらゆる情報を時系列で関連づけ、学習データとして強化学習AIに学習させ、「安全リスクの抑制」、「運転コストの効率化」、「非常時の最適対応」などの経営要求を「報酬」を設定することで、経営要求を満たす方向への提案を出力してくれる強化学習AIこそが、知性をもって人間のために働くSociety 5.0に合致する原子力DXであると言える。
図6 原子力DXにおける強化学習AIのイメージ
4.核セキュリティDXの提案
ここで再度、話を核セキュリティに戻す。先ほども述べたように、核セキュリティ脅威は現在進行形で多様化・巧妙化・拡大を続ける一方、世界の核セキュリティ対策は「新たな脅威」「想定を超える脅威」に対し後れを取っている。
しかし、我が国は規制も事業者もBDBTへの対応を互いに丸投げして責任回避をしているのではないだろうか。すなわち、規制側は航空機衝突などを想定した特重(特定重大事故等対処施設)だけでBDBTへの対応がそれ以上に進まぬ思考停止に陥り、一方で事業者側も、BDBTは国の管轄だからと国の求める特重以外は未対応である。実はこれには、BDBTは脅威の規模も種類も多すぎて何も決められない、という理由もある。しかし、福島第一原発事故のときに我々が多用した「想定外」という言葉を二度と使いたくはないと筆者は考える。ではどうすればよいのだろうか?
その有力な解の候補が、机上訓練を用いてBDBT時の「想定外」を減らすことだと考えられる。すなわち、まずは、コストのかからない机上訓練でできるだけ多様なBDBTの状況を想定し、現在の「人」と「ハード」でどこまで対応可能かを見極めることが必要である。
さらにここで一歩踏み込んで、机上訓練の結果を強化学習AIに活用することで、BDBT時における「人」と「ハード」の最適対応案を提示する核セキュリティDXの開発を提案する。机上訓練では、多様な状況下での各プレーヤーの行動とそれに対する環境の状態が言語の形で得られる。これらを前処理して要約し、学習データとして利用することで、この核セキュリティDXは実現できる。
その全体像は、図7のようになる。すなわち、不法侵入やスタンドオフ攻撃や内部脅威者やサイバー攻撃、機器・プラントの異常や故障などの異常をリアルタイムで検知した結果を、最適対応案提示システムの入力とすることで、緊急時対策本部等に最適な対応案を提示することを目指す。その要素となるのは図7に示すA~Fである。このうちここではB~Eについて説明する。
図7 核セキュリティDXのイメージ
まず、B.プラントシミュレータのサロゲートAIとは物理モデルの入力&出力データを教師データとして学習し、再現できるAIのことである。これは、回帰時系列AIを活用することで実現でき、プラントシミュレータによる十分な学習データがあれば、技術的には難しくない。また、学習後のサロゲートモデルはプラントシミュレータに比べて計算速度が高いというメリットがあり、緊急時には特に有効である。回帰時系列AIモデルとしては注意機構を盛り込むことが望ましい。注意機構とは、入力データのどこに注目すべきか動的に特定するモデルであり、直近の過去のデータに縛られず、既存の回帰モデルに比べ高い成績を出す。
図8 核セキュリティDXにおけるサロゲートAIのイメージ
C.の2S机上演習は、安全と核セキュリティの両方を含む机上演習である。原子力プラントにおけるBDBT時の核セキュリティの最大の目的は、核燃料の防護ではなく原子力安全の確保であり、このためには安全システムを如何に守るかのシナリオとの連携は欠かせない。このため、最低でもプレーヤーとしてセキュリティ、安全、対抗部隊、そしてテロリストの4種が必要である。そしてさらに、プレーヤーに事象の進展を伝えるプラントシミュレータやゲームエンジンも必要である。そして、1つの事象の訓練が終わると、各プレーヤーの一連の行動、およびそれがもたらす安全の確保の成功もしくはテロリスト側の成功という結果も含め、事象のシーケンスが「文」の形で得られる。
図9 核セキュリティDXにおける強化学習AIのイメージ
D.の机上演習の文章解析は、C.で「文」の形で出力されたプレーヤー行動と結果のセットのシーケンスを、強化学習に入れるための前処理である。そのために、机上訓練における各プレーヤーの行動と文の形で表現された結果を、出町研で開発済みの「文情報のグラフ変化」手法を用いて階層型グラフ構造(図10)として要約し、これをE.の強化学習AIによる対応案作成の学習データに使用する。
図10 階層型グラフ構造の例。内側からIf, must not, mustの円
E.の対応案作成には強化学習AIを用いる。すなわち、机上訓練で得られた各プレーヤーの行動シーケンスを機械学習の学習データとし、BDBTに対して最善の対応案を出力するように強化学習AIを学習する。
以上を1つにまとめたアルゴリズムのフローチャートが図11である。黒のフローでは先ほどの各AIモデルを学習し、学習後は赤のフローで実際の安全、セキュリティ事象に対する最適対応案を提案する。
図11 核セキュリティDXの全体アルゴリズム
5.まとめ
内閣府の提唱するSociety5.0の実現にDXの適用は欠かせないが、現在あるDXはいずれもSociety5.0の概念に合致するものではない。よって、強化学習AIの活用により自ら考え最適提案を出力するDXの開発が必要である。
日本においてはBDBTへの対応の空白を早急に埋める必要があるが、そのための方策として強化学習AIを用いた核セキュリティDXの開発が有効である。
参考文献
[1] 内閣府HP, https://www8.cao.go.jp/cstp/society5_0/
(2023年5月5日)