非線形識別手法による回転機音響監視の高度化
公開日:
カテゴリ: 第6回
1. 緒言
新検査プログラムの開始に伴って、状態監視保全 (CBM)の役割はますます大きくなってくる。その際、 振動、温度、油分析といういわゆる3種の神器による 詳細な機器状態の監視手法が焦点となっているが、そ れを補完する活動として、パトロールなどでの音響を 用いた遠隔からの俯瞰的な監視も重要であろう。この 音響による監視は運転員の経験に基づく定性的判断で もあり、その客観化・定量化が可能であれば、より精 度のよい状態監視に寄与できることになる。しかしな がら、遠隔・非接触で計測される音響情報は、複雑な 音響伝播過程を経て、変調・劣化した形で計測される ため、診断に際しての障害となることがしばしばある。 このため、このため、本来の機器状態に関する情報を ・抽出・定量化するための高度な信号処理技術の導入が 欠かせないと考える。
このような背景から、著者は、各種の信号処理法を 組み合わせた音響信号の自動分類問題に取り組んでき た。[1-3] そこでは、音響信号を用いた異常監視性能 は、信号の前処理手法(特徴抽出法)や状態分類手法 に大きく依存し、これらをうまく組み合わせることで 大きく異常検出感度を向上できることが明らかにされ ている。一方で、機器の運転状態や運転環境に依存し て、計測信号の表面的な形が異なってくるため、環境 変化に影響されないロバストな状態監視手法も重要で あることが指摘されている。これらの研究の継続として、本稿では対象とする音 響データベースをさらに拡充し、新たな信号前処理法(特徴抽出法)と状態識別法(分類法)を組み合わせ た監視手法を提案する。さらに、これらの手法の適切 な組み合わせによって、高感度でロバストな異常監視 が可能なことを示す。特徴抽出法では、音声認識分野 での信号処理法であるケプストラム解析などの利用を 試みている。また、状態識別法では、従来提案してき た確率ニューラルネットワーク(PAN) [4] の他に、 Support Vector Data Description(SVDD)[5]を導入し、両者 の識別性能の比較を行った。これらは、1クラス分類 問題として、正常状態のみのデータから識別クラスを 構成し、外れ値(Outlier)や特異値(Novelty)を検出 するという問題を扱っており、今回のような異常監視 問題に適している手法といえる。著者は前報[1-3]で転がり軸受け異常模擬試験装置を 用いて計測したデータでの検証結果を報告しているが、 本報では、同様の試験装置を用いて新たに音響データ の計測を行い、前記の状態識別法の性能評価を行った。 2. 信号処理手法 2.1 特徴抽出法 * 音響信号を用いた状態識別に際しての特徴抽出法と しては、多くの場合、周波数分析により得られる自己 パワースペクトル密度(APSD)が用いられる。類似の 研究分野である音声信号処理分野では、音声認識 (Speech Recognition) や話者認識 (Speaker Recognition) のための特徴抽出として、人間の心理的な認知特性を 反映して、APSD の振幅や周波数を対数変換した特徴 量や、対数 APSD の逆フーリエ変換により求めるケプ ストラムのような特徴量が用いられ、認識性能はこれ
徴量とする。このとき、特徴空間での相関関数はMml染により、16385 次元C ==> x(m):x(m)* いて に点については らの特徴抽出法に大きく依存するといわれている。本 研究では、これらの研究を参考に、以下の特徴抽出法 を用いる。 (a) **APSD(log-APSD)今回の試験では、音響データを 48kHzサンプリング で収集している。一方、今回用いる試験用回転機の基 本周波数が 1400RPM(23Hz)であることを考慮して、 32768 点単位でフーリエ変換すると、△f=1.5Hz分解 能での APSD が得られる。しかしながら、特徴空間の 次元が 16385 次元となり、そのまま識別に用いるには 次元数が大きくなりすぎる問題があり、何らかの次元 縮約の工夫が必要である。振幅軸に関しては、人間の 値獲得性を考慮して対数変換をして利用した。 (b) メルスケール APSD(Melscalse-APSD)メルスケールの周波数軸は、人間の知覚特性を考慮 したスケールとしていくつかの定義が音声認識の分野 でなされているが、ここでは、下記の変換を用いた。m=1127xlog (1+ -今回の場合、このスケール変換により、16385 次元 を 512 次元に縮約して用いている。振幅については、 前項と同様に対数変換して用いる。 (C) ケプストラム(Cepstrum)ケプストラムは、音声認識でよく用いられる特徴抽 出法であるが、音声の観測周波数スペクトル X(w)が、 音源の周波数特性G(w) と声道の周波数特性H(w)の 積で与えられることを考慮し、振幅の対数変換の逆 フーリエ変換として下記のように定義される。c(7) = F''log|X(0) = F log|G(0)\ + F 'log|H(0) (2) ここで、ではケフレンシ(quefrency)と呼ばれるイ ンデクスであるが、これの低ケフレンシ側、即ち、 低次元側のケプストラムは、対数スペクトルの包絡 線に対応しており、微細構造を持つ音源のスペクト ルではなく、声道の伝達特性、即ち、発音に対応す るため、音声認識の精度が向上するとされている。 本稿では、このケプストラムの低ケフレンシ側の 512 点を特徴量として用いる。 (d) 包絡波形の APSD(Overall-APSD) - 回転機の診断では、加速度信号を包絡処理し、その 周波数変換により求めた overall-APSD をしばしば用い る。転がり軸受けでは、基本回転周期 N とその高調波が異常原因の推定に役立つ。この高調波は、軸受け内 の傷の内外輪やボールの接触により発生するため、内 外輪やボールのサイズで与えられから数に関係して与 えられる。この高調波を精度よく求めるため、48kHz サンプリングの生データを、50 点単位で包絡処理し、 そのフーリエ変換により APSD を求めた。この APSD の最大周波数は 480Hz であり、前述の回転機の基本周 波数 23Hz の 20 倍までをカバーしている。 2.2 次元縮約前記の特徴ベクトルは、生波形に比べると大きく時 限が縮約されているが、それでも、512-16835 の大きな 次元となる。この空間での状態識別も可能であるが、 ここでは、状態の可視化のためにいくつかの次元縮約 法を提案する。ここでは、可視化の容易さを考慮して、 2次元空間への縮約で状態の分離可能性を議論する。 (a) 主成分分析による縮約 . 特徴量の次元を IP、学習データとして与えられるサ ンプル数を M として、ta(i,m)、i=1,IP、m=1,M) を特 徴量とする。このとき、特徴空間での相関関数は1MT=2x(m) xm)で与えられ、この固有値解析により IP 個の固有値と固 有ベクトル V を求めることが出来る。このとき、M個 の特徴ベクトルの、k 番目の固有ベクトルへの射影値 (主成分スコア値)はz, (m) = V().x(m)-4となる。主成分分析による方法では、IP 個の固有ベク トルから選んだ少数個(K 次元)の射影データ zx(m)、 (k=1,K)を特徴ベクトルとする。さらに、この中から識 別性能の最も良い二つの固有ベクトルを選ぶことで、 二次元空間での状態表示を行う。 (D) 非線形主成分分析 (KPCA)による縮約Kernel PCA(KPCA)[6]は、主成分分析の非線形空間へ の拡張である。ここでは、x→p(x)という非線形変換を 考えが、この変換関数 P(x)を明示的に定義せず、その 内積のみをカーネル関数として定義する。本報告では、 下記の Gaussian Kernel を用いている。K(x, xj) =< P(x)) P(x,) >= exp(202 )このカーネル空間での相関関数は、(3)式の代わりに、KCA, E) < P(x) -@Cs) >= exp(-..-)このカーネル空間での相関関数は、(3)式の代わりに、424、 > (mal,M)rr-6下記のように定義される。で--< p(x.) (x)) > この固有ベクトルを V とすると、このV は、M 個の非 線形空間でのデータ(s(m))で張られる空間にあるこ とから、次の関係式が成り立つ。 _
新検査プログラムの開始に伴って、状態監視保全 (CBM)の役割はますます大きくなってくる。その際、 振動、温度、油分析といういわゆる3種の神器による 詳細な機器状態の監視手法が焦点となっているが、そ れを補完する活動として、パトロールなどでの音響を 用いた遠隔からの俯瞰的な監視も重要であろう。この 音響による監視は運転員の経験に基づく定性的判断で もあり、その客観化・定量化が可能であれば、より精 度のよい状態監視に寄与できることになる。しかしな がら、遠隔・非接触で計測される音響情報は、複雑な 音響伝播過程を経て、変調・劣化した形で計測される ため、診断に際しての障害となることがしばしばある。 このため、このため、本来の機器状態に関する情報を ・抽出・定量化するための高度な信号処理技術の導入が 欠かせないと考える。
このような背景から、著者は、各種の信号処理法を 組み合わせた音響信号の自動分類問題に取り組んでき た。[1-3] そこでは、音響信号を用いた異常監視性能 は、信号の前処理手法(特徴抽出法)や状態分類手法 に大きく依存し、これらをうまく組み合わせることで 大きく異常検出感度を向上できることが明らかにされ ている。一方で、機器の運転状態や運転環境に依存し て、計測信号の表面的な形が異なってくるため、環境 変化に影響されないロバストな状態監視手法も重要で あることが指摘されている。これらの研究の継続として、本稿では対象とする音 響データベースをさらに拡充し、新たな信号前処理法(特徴抽出法)と状態識別法(分類法)を組み合わせ た監視手法を提案する。さらに、これらの手法の適切 な組み合わせによって、高感度でロバストな異常監視 が可能なことを示す。特徴抽出法では、音声認識分野 での信号処理法であるケプストラム解析などの利用を 試みている。また、状態識別法では、従来提案してき た確率ニューラルネットワーク(PAN) [4] の他に、 Support Vector Data Description(SVDD)[5]を導入し、両者 の識別性能の比較を行った。これらは、1クラス分類 問題として、正常状態のみのデータから識別クラスを 構成し、外れ値(Outlier)や特異値(Novelty)を検出 するという問題を扱っており、今回のような異常監視 問題に適している手法といえる。著者は前報[1-3]で転がり軸受け異常模擬試験装置を 用いて計測したデータでの検証結果を報告しているが、 本報では、同様の試験装置を用いて新たに音響データ の計測を行い、前記の状態識別法の性能評価を行った。 2. 信号処理手法 2.1 特徴抽出法 * 音響信号を用いた状態識別に際しての特徴抽出法と しては、多くの場合、周波数分析により得られる自己 パワースペクトル密度(APSD)が用いられる。類似の 研究分野である音声信号処理分野では、音声認識 (Speech Recognition) や話者認識 (Speaker Recognition) のための特徴抽出として、人間の心理的な認知特性を 反映して、APSD の振幅や周波数を対数変換した特徴 量や、対数 APSD の逆フーリエ変換により求めるケプ ストラムのような特徴量が用いられ、認識性能はこれ
徴量とする。このとき、特徴空間での相関関数はMml染により、16385 次元C ==> x(m):x(m)* いて に点については らの特徴抽出法に大きく依存するといわれている。本 研究では、これらの研究を参考に、以下の特徴抽出法 を用いる。 (a) **APSD(log-APSD)今回の試験では、音響データを 48kHzサンプリング で収集している。一方、今回用いる試験用回転機の基 本周波数が 1400RPM(23Hz)であることを考慮して、 32768 点単位でフーリエ変換すると、△f=1.5Hz分解 能での APSD が得られる。しかしながら、特徴空間の 次元が 16385 次元となり、そのまま識別に用いるには 次元数が大きくなりすぎる問題があり、何らかの次元 縮約の工夫が必要である。振幅軸に関しては、人間の 値獲得性を考慮して対数変換をして利用した。 (b) メルスケール APSD(Melscalse-APSD)メルスケールの周波数軸は、人間の知覚特性を考慮 したスケールとしていくつかの定義が音声認識の分野 でなされているが、ここでは、下記の変換を用いた。m=1127xlog (1+ -今回の場合、このスケール変換により、16385 次元 を 512 次元に縮約して用いている。振幅については、 前項と同様に対数変換して用いる。 (C) ケプストラム(Cepstrum)ケプストラムは、音声認識でよく用いられる特徴抽 出法であるが、音声の観測周波数スペクトル X(w)が、 音源の周波数特性G(w) と声道の周波数特性H(w)の 積で与えられることを考慮し、振幅の対数変換の逆 フーリエ変換として下記のように定義される。c(7) = F''log|X(0) = F log|G(0)\ + F 'log|H(0) (2) ここで、ではケフレンシ(quefrency)と呼ばれるイ ンデクスであるが、これの低ケフレンシ側、即ち、 低次元側のケプストラムは、対数スペクトルの包絡 線に対応しており、微細構造を持つ音源のスペクト ルではなく、声道の伝達特性、即ち、発音に対応す るため、音声認識の精度が向上するとされている。 本稿では、このケプストラムの低ケフレンシ側の 512 点を特徴量として用いる。 (d) 包絡波形の APSD(Overall-APSD) - 回転機の診断では、加速度信号を包絡処理し、その 周波数変換により求めた overall-APSD をしばしば用い る。転がり軸受けでは、基本回転周期 N とその高調波が異常原因の推定に役立つ。この高調波は、軸受け内 の傷の内外輪やボールの接触により発生するため、内 外輪やボールのサイズで与えられから数に関係して与 えられる。この高調波を精度よく求めるため、48kHz サンプリングの生データを、50 点単位で包絡処理し、 そのフーリエ変換により APSD を求めた。この APSD の最大周波数は 480Hz であり、前述の回転機の基本周 波数 23Hz の 20 倍までをカバーしている。 2.2 次元縮約前記の特徴ベクトルは、生波形に比べると大きく時 限が縮約されているが、それでも、512-16835 の大きな 次元となる。この空間での状態識別も可能であるが、 ここでは、状態の可視化のためにいくつかの次元縮約 法を提案する。ここでは、可視化の容易さを考慮して、 2次元空間への縮約で状態の分離可能性を議論する。 (a) 主成分分析による縮約 . 特徴量の次元を IP、学習データとして与えられるサ ンプル数を M として、ta(i,m)、i=1,IP、m=1,M) を特 徴量とする。このとき、特徴空間での相関関数は1MT=2x(m) xm)で与えられ、この固有値解析により IP 個の固有値と固 有ベクトル V を求めることが出来る。このとき、M個 の特徴ベクトルの、k 番目の固有ベクトルへの射影値 (主成分スコア値)はz, (m) = V().x(m)-4となる。主成分分析による方法では、IP 個の固有ベク トルから選んだ少数個(K 次元)の射影データ zx(m)、 (k=1,K)を特徴ベクトルとする。さらに、この中から識 別性能の最も良い二つの固有ベクトルを選ぶことで、 二次元空間での状態表示を行う。 (D) 非線形主成分分析 (KPCA)による縮約Kernel PCA(KPCA)[6]は、主成分分析の非線形空間へ の拡張である。ここでは、x→p(x)という非線形変換を 考えが、この変換関数 P(x)を明示的に定義せず、その 内積のみをカーネル関数として定義する。本報告では、 下記の Gaussian Kernel を用いている。K(x, xj) =< P(x)) P(x,) >= exp(202 )このカーネル空間での相関関数は、(3)式の代わりに、KCA, E) < P(x) -@Cs) >= exp(-..-)このカーネル空間での相関関数は、(3)式の代わりに、424、 > (mal,M)rr-6下記のように定義される。で--< p(x.) (x)) > この固有ベクトルを V とすると、このV は、M 個の非 線形空間でのデータ(s(m))で張られる空間にあるこ とから、次の関係式が成り立つ。 _
=< (xm) TV > (m = 1, M) v = 20p(x)m%3D1ここで定義した M 次元ベクトルa は、(5) (7)式より、Μλα = Κα を満たすので、この固有値解析によって固有ベクトル Vが得られる。データ xの非線形空間での値(x)の、k 番目の固有ベクトルへの射影値は、以下のように計算 できる。2. =< 1 ) . (x) >= 20ml““ aw(x,) (x> (9)n%3D1これが、(4)式に相当するカーネル空間でのスコア値で ある。従って、前節と同様の手続きで2次元のスコア 値を選ぶことで状態の可視化が可能になる。線形の主 成分分析では、固有ベクトルの数が、データの属性値 の次元 IP を超えられないが、KPCAでは、学習データ 数 M まで可能になる。例えば、入力となる特徴ベクト ルが2次元の場合、主成分分析では、二つのスコア値 しか求まらないが、KPCA では、データ数に応じたス コア値を求めることができ、より詳細な状態識別が可 能になる。 (c) Heuristic Search による次元縮約 2.1 節で定義した多次元の特徴ベクトルから、任意の2 軸を選ぶことで、二次元空間での状態可視化ができる。 この 2 軸を、E、F, としたとき、選択した空間での正 常データと異常データの間の Maharanobis 距離を用い て、以下のような評価尺度を定義する。C(F,F)= Dra(F,F)-Dow(FF)-DA(F,F) (10) ここで、DNA(F; FF) は Maharanobis 距離で以下のよ うに定義される。 DA(F, F) = (u_u) - ANI) (2) + END) '(WSD-40)DM(F, F) = (us*2 UNI) (2 ) + 2,' (u880-407)(11) “N' と'A' は、それぞれ、正常と異常のインデクスであり、学習データとして、運転状態の異なる複数 の正常、異常クラスのデータが準備されていること を仮定している。山ととは、それぞれ、各状態の平 均と分散を示す。この(10)式は、特徴空間内で、正 常と異常状態が離れており、また、正常状態同士、 異常状態同士の距離が小さいほど大きくなる。 (10)式を最大化するインデクス(L,j)を見つけること で、運転状態に左右されず、正常と異常のみを識別 する最適な観測量を求めることができる。この最大 化は、500 次元程度の特徴空間から二つのパラメー タを捜すのであれば、全ての組み合わせを探索でき るが、これ以上の次元となると、全組み合わせ探索 は困難となるため、本研究では、Particle Swarm Optimization(PSO)も利用している。これは、ランダ ム探索に近い手法で、必ずしも、最適な解が獲られ ない場合もあるが、大きな空間内で比較的良い結果 が安定して得られる。 2.3 状態識別 - 統計的識別法の多くは、音声認識や文字認識のよう に、学習データとして準備された複数の既知のクラス のどれに該当するかを識別する多クラス分類問題とし て扱われている。一方、今回対象としているような異 常監視では、正常時のデータしかない場合が多く、そ こからの有意な偏差(特異値)を識別するという1ク ラス分類問題として扱う必要がある。場合によって、 少数の異常データの蓄積がある場合、それを用いた識 別アルゴリズムの改良も可能である。ここでは、1 ク ラス分類問題の 2 つの手法の適用を試みその性能を比 較する。 (a) 確率ニューラルネットワーク(PNN)による識別PAN は混合ガウス分布の確率密度関数を識別関数と するもので、以下で定義される[5]。ここで、x, は、j グループに属する(i=1,n)個の特徴ベクトルであり、 平滑化パラメータ oを用いたガウス関数の和で次式の ように識別関数を計算する。> explf(x)=_1_13 [(x-x.ru(2no2)““, 日202200」この確率が、ある閾値以下かどうかで、特徴パターン xがグループ G; に属するかどうかを判断できる。 (b) SVDD による識別 SVDD は、1クラス分類問題として利用されてい る [5] 。本論文で対象としているような異常監視425R,a,5の場合、通常は、正常時のデータしか観測されな いことが多く、そこからの有意な偏差(特異値) を検出することが必要とされる。このための方法 として、特徴空間における正常クラスのデータを 全て包絡する球体を求める方法がある。 N 個の正 * 常データを x, (i=1, 1) 、球体の中心を a、半径をR としたとき、下記の関数を最小化することで最 小の球体(中心a 、半径 ) が得られる。 min R2 + C25(13) st. (x, - a) (x, -a) < R2 + 5,5, 2 0, (i = 1,..N) ここで、球体からの多少のはずれを許容するため スラック変数と」を導入しており、係数 C は、許 容の程度を制御するトレードオフパラメータで ある。これを具体的に解くために、制約条件を考 慮した双対問題に変換するが、これが、特徴ベク トルの内積だけで構成されていることを利用し、 SVDD では、(6) 式のカーネル関数を用いたカーネ ル空間での次字形核問題による最適化を行う。 minara, K(x, x)) - Ea,K(x, x, )(14) st. Osa, sc,Ea, = 1,得られた解のうち、a=0 に対応する x, は球体の 内部に存在し、0