特集記事「AIと保全」(7) 予知保全・故障予測~ AIの実践的活用例~
公開日:
特集記事「AIと保全」(7)
予知保全・故障予測~ AIの実践的活用例~
MathWorks Japan
井上 道雄 Michio INOUE
1.はじめに
近年、製造業をはじめとする様々な現場において「予知保全(Predictive Maintenance)」の取り組みが注目を浴びている。予知保全とは、機器に取り付けられた各種センサーから得られる情報から、機器の故障時期を予測し適切なタイミングでのメンテナンス実施を目指すものである。余計なメンテナンス作業を避けることによるコストの削減だけでなく、予期しない故障を減らすことによる稼働率や安全性の向上も期待されている。稼働率ダウンが致命的になる発電設備や、安全性を追求する航空機業界では早い段階から取り組みが進んでいた。ここ数年は Internet of Things (IoT) 関連技術の飛躍的な発展も手伝いその適応範囲は広がりを見せ、工作機械や生産設備なども含め、様々なところで予知保全が実現されつつある [1]。多くのプラントで老朽化が進むほか、保守・安全管理の実務を担ってきた多くのベテラン技術者が引退の時期を迎えつつある。技術者の勘・コツ・経験を AIで補完する観点からも、今後予知保全のニーズは更に高まることが予想される。
2.故障予測アルゴリズム開発における課題
故障や性能劣化を予測診断するような高度な診断システム開発に取り組む際の課題を、機械学習の適用という側面から考えてみる。まず監視対象の機械から取得されるデータを活用する為に必要なステップを一般化してみると下記の4項目に大別される(図 1)。
1. 時系列データへのアクセス
2. 異常値処理・変数選定などデータの前処理
3. 機械学習の適用・評価を実施し予測モデルを構築
4. システムへの統合とアプリケーション化
システム全体を構築するのに必要なステップを俯瞰すると、予測モデルの構築自体は全体の一部分であること
に注目してほしい。
図1 データ解析全体像を構成する 4ステップ。各項目の具体的な内容については [2]でMondi 社の実例をもとに解説している。
2.1 機械学習の限界
AI・深層学習などのキーワードが注目を集める昨今、大量のデータさえ集めることができれば欲しい結果を算出してくれるといった印象があるが、様々な対象・用途に対して汎用的に使用できる手法は、残念ながら存在しないというのが現実である。データの集め方、データの種類、サンプリング周波数などの諸条件が異なれば、前処理に必要な作業も適切に変更する必要がある。最適な機械学習アルゴリズムも異なる。見逃されがちだが機械学習はノイズと意味ある重要な情報を自動で区別できるほど万能ではない。異常値を無視してよいのか、あるいはその異常値はモデルが考慮すべき現象 (すなわち機械の故障や異常 )を表しているのかを見極める必要もあるので、データの分析には必ず監視対象の機器に詳しい技術者の知見や経験が求められる。
特にセンサーデータは機械学習モデルに直接入力するのではなく、高いレベルの情報を捉えた「特徴量」に変換することが一般的であり成功の鍵を握る重要なステップである。次節では時系列データから異常を見つける際に有効な特徴量の例を紹介する。
2.2 故障予測を可能にする特徴量例
Los Alamos National Lab. の研究グループが公開する構
特集記事「AIと保全」(7)「予知保全・故障予測~ AIの実践的活用例~」
造ヘルスモニタリング( SHM)で利用される振動データの解析を題材に、異常・正常の区別を可能にする特徴量を紹介する。本稿では技術的な詳細には触れず代表的な結果のみを紹介するにとどめるため、詳細は [3,4] を参照していただきたい。
図2 実験セットアップイメージ図
図 2に示すのは試験用に作られた 3階建ての構造体のイメージ図である。こちらに取り付けられた加速度センサーから取得された時系列データのサンプルを図 3に示す。ここでは 1つの柱にバンパーが接触する仕組みにより正常時・異常時を模擬している。
正常時・異常時それぞれで取得された2つの時系列データを例に、 2つを区別するために有用な情報を簡易的に調査してみる。図 4はそれぞれの加速度値の分布を表すヒストグラムだが、平均値や分散に決定的な違いがあるようには見られない。次に周波数領域の情報を調査するためにスペクトル推定を実施したのが図 5である。エネルギー密度が高い周波数帯では似た結果を示している。しかし 100Hz以上の領域において異常時のデータの方が高い値を示しており、異常であることを示す特徴量候補として、100Hz以上のバンドパワーが考えられる。
自己回帰( AR)モデルの係数を比較したのが図 6であり、これまでの比較方法よりも明確に違いが表現されていることが分かる。この手法は時系列データそれぞれを自己回帰( AR)モデルにフィッティングさせ、それぞれのモデルに表れる係数値を比較する。
Xnが時刻 n における計測値、εtは残差項、aiが算出される AR係数である。係数の変化はデータ発生源の特性変化ととらえることもできる。図 6ではモデルの次数を
図 3振動データ波形:(上)正常時(下)異常時
図 4 加速度値の分布:(上)正常時(下)異常時。いずれも似た分布であり平均値・分散などの特徴では区別が難しい。
図 5 正常時と異常時のスペクトル推定比較:(青線)正常時(赤線)異常時
10(すなわち N=10)とし、正常時・異常時のデータそれぞれから算出された係数を平行座標プロットで描いている。図 3で表示した正常時・異常時のデータとは別に計測された正常時・異常時のデータから同様に算出された係数も薄い線で示した。正常時・異常時で係数の値に明らかな違いが存在し、異常時のデータでは係数値の分散も大きい傾向にあることがわかる。
[3]では他にも様々な特徴量が検討されているが、もしこのように区別したい事象間で大きく異なる特性を見つけることができれば、異常検知を実施するのは非常に単純な課題となる。場合によってはしきい値での判断だけで十分な可能性もある。
図 6 N=10とした時の自己回帰モデル係数比較:(青)正常時(赤)異常時。薄い線は同様の状況で計測されたその他のデータからの係数値を示す。
次の例は多少分野が異なるが Human Activity Recognition (HAR) のサンプルデータを紹介する。スマートフォン持つ被験者が、歩く、寝る、階段を上るなどの Activities of Daily Living (ADL) を行っている際の加速度データである [5]。[6]では時系列データからそれぞれの ADLを正確に予測する課題に取り組んでおり、本稿ではその一部を紹介する。
図7 スペクトル推定結果:(青)平地歩行時(赤)階段上昇時
図 7はある被験者の 2つの行動時にとられた加速度データからスペクトルを推定したものを示している。青線が平地を歩行時、赤線が階段を上っている時に観測されたスペクトル値である。歩行時は 2Hz あたりに大きなピークがあるのに比べて、階段を上昇時は 1.5Hz付近と比較的低い周波数でピークが観測されている。ここか
ら階段を上っている時の方が、動作が緩やかであったことが想像できる。また 4Hzより高い周波数帯では歩行時より階段上昇時の方がエネルギー密度は小さく、よりハーモニックな、すなわちより一定のテンポで階段を上昇する姿も予測できる。
このように、直感的にも「なるほど」と感じるような特徴量をデータから導き出すことができれば、課題は半分以上成功したと考えてよい。直感に沿う特徴量を探すには予測対象の機器に詳しい技術者の勘・コツ・経験を活かした解析が必要である。平均、分散といった単純な統計量であっても十分な場合もある。特徴量と聞くと身構えてしまうこともあるが、まずはヒストグラムを描いてみるところから始めるとよい。複数の特徴量を算出して比較検討する試行錯誤は手間がかかる部分でもあるが、その工程を一部自動化する方法を [7] で紹介しているので、興味のある方は参照してほしい。
2.3 機械学習による予測モデルの構築
正常・異常などの性質の違いをとらえる特徴量を複数使用する場合や、しきい値による単純な判断が不可能な場合は機械学習による予測が力を発揮する。ただ機械学習アルゴリズムには何十種類もあり、学習方法もそれぞれ異なるため、用途に合った手法を選択する作業が発生する。 [8]では代表的な機械学習手法の概要を紹介しているので参照してほしい。
一般的に機械学習手法を決める上では予測精度だけではなく、学習速度、メモリの使用量や予測結果の解釈のしやすさも重要な要素になってくる。例えば、予測のアルゴリズムを機器に組み込むことを考えると、大量のメモリを必要する計算負荷の高いアルゴリズムは適さない。新しく得られる機器からのデータを使って、予測モデルを都度アップデートすることを考えるならば、学習にかかる時間も検討しなければならない。場合によってはブラックボックスでの予測ではなく、予測の過程がある程度人間にも解釈が可能であるという要求がある場合もあり、その場合は前節で紹介した特徴量の調査が役に立つだろう。
よい特徴量の特定は予測精度を高めるだけでなく、必要なメモリ容量を減らしたり、処理時間を短縮したりすることができ、予測結果も解釈しやすくなることにも繋がる。
3.システムへの統合
最後に、前述した 4つのステップの最後となるシステ
特集記事「AIと保全」(7)「予知保全・故障予測~ AIの実践的活用例~」
ムへの統合について触れる。構築した予測アルゴリズムの実際の運用方法を考えると図 8に示す通り様々な実装先の可能性やそれに伴う課題が見えてくる。前述したように、ハードウェア側の制約からアルゴリズムの幅が狭まる可能性もあるので、事前に運用方法を検討しておくことはアルゴリズムを設計する際にも役に立つ。
図 8アルゴリズムの実装先もデータ転送量、計算量、運用方法に
よってデバイス上、エッジ上、クラウド上など様々な選択肢
が存在
センサーデバイスの消費電力や通信帯域を考慮する場合、ここでも効果的な特徴量の算出が重要である。例えば特徴量の抽出を予測対象となる機器上で行うことができれば、データ転送量を大幅に削減することができる。特に振動や音といった情報から異常を検知する場合には高いサンプリングレートが要求されるため、機器上で必要な前処理を実施し予測に必要なデータだけを転送するといった仕組み(エッジコンピューティング)が効果的となる。異常検知や寿命予測は圧縮された情報をもとにクラウド上で集中管理してもよい。
ここまではデータを予測に結び付ける部分の話だが、予測結果の活用方法についても考察が必要である。予測結果を見るのは整備スタッフか、機器のオペレーターなのか。その場合 PC上で動くアプリが適切な場合もあれば、タブレットで持ち運べる実装がよい場合もある。予測結果をどう運用に反映させていくのかについての議論を深める必要がある。
このように実際の開発段階においてはシステム全体にかかわる議論が必要であるため、早い段階から全体をカバーするプロトタイプを構築し、素早く PDCAのサイクルを回すことが重要である。ここで少し、開発環境としてのソフトウェア MATLABRを紹介させていただきたい。 MATLABで開発したアルゴリズムは、人の手によるコードの書き直しをすることなく、 JavaTM、 MicrosoftR .NET、PythonR、C/C++ など、他の開発環境と互換性のある配布可能なコンポーネントとしてパッケージ化できるという点でも開発工数削減に寄与する
[9]。PC上で起動する単独のアプリケーションとして共有するだけでなく、Apache TomcatRや Microsoft IISといった Webサーバーや SOAP/RESTといった Webサービスを連携させ、 Webアプリケーション、データベースアプリケーション、デスクトップアプリケーションおよびエンタープライズアプリケーションの一部として実行することも可能である。
4.まとめ
本稿では異常検知や予知保全の仕組みを構築するうえ
で重要となる要素である特徴量について紹介した。 AI
というと機械学習を適用する部分だけが注目を集めがち
だが、データはどこから来るのか、そして最終的にアル
ゴリズムはどう実装するのか、それらの点も踏まえてシ
ステム全体を考えた開発が重要になる。特に故障の兆候
を示す特徴量の選定・評価には多くの試行錯誤が求めら
れ、機器に対する深い理解が必要不可欠である。このス
テップを効率よく実行するための機能については [7]を
参照頂きたい。
MATLABをアルゴリズム開発からシステムへの統合
まで、プラットフォームとして組織的に利用することに
より、より一層資産共有及び再利用が加速され、開発効
率向上及びメンテナンスコスト削減が期待できる。
MATLABとは
MATLABは、数値計算、可視化、プログラミングのための高水準言語による対話型の環境であり、データ解析、アルゴリズム開発、モデルやアプリケーションの作成が可能である。 35年以上の実績を持つソフトウェアであり、世界中で 300万人を超えるエンジニアや科学者が、アイデアの共有や専門分野を超えた共同プロジェクトのために、 MATLAB を共通言語として使用している。予知保全に関連する機能・ソリューションについて詳しく知りたい方は「予知保全」で検索。今回紹介した処理内容は [4,6,7] にて MATLABのプログラムも合わせて公開しているので興味のある方はダウンロードして試していただきたい。
参考文献
[1]MathWorks, "Mondi、機械学習を使用した統計ベースの状態監視および予知保全を製造プロセスに導入 " (ユーザー事例 ) https://jp.mathworks.com/ company/user_stories/mondi-implements-statistics-based-health-monitoring-and-predictive-maintenance-for-manufacturing-processes-with-machine-learning.html
[2]MathWorks, "実例に学ぶ予知保全向けデータ解析
" (White Paper) https://jp.mathworks.com/campaigns/
o.ers/predictive-maintenance-failure-prediction.html
[3]Figueiredo, Eloi, Gyuhae Park, Joaquim Figueiras, Charles Farrar, and Keith Worden. "Structural health monitoring algorithm comparisons using standard data sets." No. LA-14393. Los Alamos National Lab. (LANL), Los Alamos, NM (United States), 2009.
[4]太田英司 : "センサーデータ解析と機械学習~振動データからの異常検出~ " (Webinar) https:// jp.mathworks.com/videos/sensor-data-analysis-and-machine-learning-anomaly-detection-using-vibration-data-100241.html
[5]Anguita, Davide, Alessandro Ghio, Luca Oneto, Xavier Parra, and Jorge Luis Reyes-Ortiz. "A public domain dataset for human activity recognition using smartphones." In Esann. 2013.
[6]竹本佳充 , "機械学習のための信号処理 " (Webinar) https://jp.mathworks.com/videos/signal-processing-for-machine-learning-119299.html
[7]井上道雄 , "予知保全を可能にする特徴量選択 " (Webinar) https://jp.mathworks.com/ videos/part-3-feature-extraction-for-predictive-maintenance-1545052389165.html
[8]MathWorks, "MATLABによる機械学習 " (eBook) https://jp.mathworks.com/campaigns/offers/machine-learning-with-matlab.html
[9]MathWorks, "Respiri、喘鳴検出および喘息管理のモバイルアプリとサーバーソフトウェアを開発 " (ユーザー事例)https://jp.mathworks.com/company/ user_stories/respiri-develops-mobile-app-for-wheeze-detection-and-asthma-management.html
(2019年 4月 19日)
著者紹介
著者:井上道雄所属: MathWorks Japan専門分野:異常検知・故障予測