宮崎  亮一

Miyazaki  Ryoichi
学科

情報電子工学科

職名

准教授

学位

博士(工学)

校務

寮務主事補(副主事)

クラブ顧問

テニス部(主顧問)

メールアドレス

miyazaki@tokuyama.ac.jp

電話番号

0834296303

専門分野

音響信号処理

リサーチマップURL

https://researchmap.jp/miyazaki-ryoichi


授業科目
  • 基礎プログラミング(1年)
  • コンピュータの基礎知識(1年)
  • コンピュータ演習(1年)
  • コンピュータシステム概論(3年)
  • 情報理論(4年)
  • 統計学(5年)
  • 情報システム実験(5年)
  • メディア信号処理(専攻科2年)
学歴
平成22年 3月 大阪府立工業高等専門学校総合工学システム専攻機械工学コース 卒業
平成24年 3月 奈良先端科学技術大学院大学情報科学研究科情報処理学専攻博士前期課程修了 工学修士
平成26年 3月 奈良先端科学技術大学院大学情報科学研究科情報科学専攻博士後期課程修了 博士(工学)
職歴
平成24年 4月 大阪府立大学工業高等専門学校メカトロニクスコース非常勤講師 (総合工学実験実習II,CADII,情報処理I,計測技術担当)(平成26年3月まで)
平成25年 4月 日本学術振興会特別研究員(DC2)(平成26年3月まで)
平成26年 4月 徳山工業高等専門学校情報電子工学科助教(現在に至る)
学会及び社会活動
平成22年 4月 一般社団法人日本音響学会会員(現在に至る)
平成24年 1月 IEEE Membership(現在に至る)
平成26年 4月 一般社団法人日本音響学会学生・若手フォーラム幹事会員(現在に至る)
平成27年 4月 電子情報通信学会正員(現在に至る)
平成27年 4月 日本高専学会正会員(現在に至る)
賞罰
平成23年 9月 一般社団法人日本音響学会第4回学生優秀発表賞受賞
平成23年11月 第26回信号処理シンポジウムSIP学生奨励賞受賞
平成24年 3月 奈良先端科学技術大学院大学最優秀学生賞受賞
平成24年11月 第14回エリクソン・ベストスチューデント・アワード受賞
平成24年11月 第6回IEEE SPS Japan Chapter Student Paper Award受賞
平成25年 3月 第28回電気通信普及財団賞(テレコム技術学生賞)受賞
平成25年10月 APSIPA ASC2013 Best Paper Award受賞
平成28年 3月 一般社団法人日本音響学会独創研究奨励賞板倉記念受賞
平成28年10月 IEEE CES West Japan Chapter Young Researcher Award 受賞(指導学生)
平成29年 3月 平成28年度国立高等専門学校機構学生表彰「理事長賞」受賞(指導学生)
平成30年12月 電気音響研究会 学生研究奨励賞受賞(指導学生)
教育上の能力に関する事項
教育方法の実践例
深層学習勉強会の実施 平成30年4月〜

Deep Learning に関する研究は世界中で行われており,日々新しいテクノロジーが生み出されている.また,様々なフレームワークや環境が提供されており,Deep Learning の敷居は下がってきている.理論より実装することを目的とし,定期的にDeep Learning勉強会を実施した.

サウンドプログラミング講座の実施 平成30年4月〜

2020 年に小学校でプログラミング教育が必修化さ れることが決定しており,その影響で小学生を対象と したプログラミング教室が急激に増加するなど,子供 のプログラミング学習が注目されている.小学生を対象とした「親子で挑戦!サウンドプログラミング」という題目で徳山工業高等専門学校の公開講座を実施した.本講座ではピアノの鍵盤をイメージした,音の出るアプリケーションの作成を目指し,参加者が所有するスマートフォンに転送して操作することを目標とした.

経済産業省の情報処理技術者試験の学生の受検・合格支援 平成27年4月〜

コンピュータシステム概論の授業では,経済産業省の情報処理技術者で出題されるようなコンピュータとその応用に関する実践的な基礎知識を習得させるような授業を行っている.また,試験対策として過去問題を授業や小テスト,定期テストに取り入れ,解説も行っている.その結果、5年生時までにクラスの半数以上の合格者を出すことができた.

情報システム実験でのネットワーク構築 平成26年4月〜

情報システム実験を担当し,IPアドレスやネットマスク等の基礎知識の確認から,ルーティングテーブルの作成,ネットワーク上に流れるパケットをキャプチャリングして解析することによって,ネットワークの仕組みについて深く理解させることができた.

大阪府立大学工業高等専門学校における非常勤講師 平成24年4月 〜平成26年3月

総合工学実験実習,CAD, 情報処理,計測技術の講義や実験を担当し,講義資料や定期テストを作成した.

作成した教科書・教材
Audio Source Separation(分担執筆) 平成30年3月

非負値行列因子分解,深層学習,スパース分析に基づく音楽音源分離について網羅的に記した書籍である.本書籍において非線形信号処理の最適化について執筆した.

音響学入門ペディア(分担執筆) 平成29年2月

これから音響分野の研究をしようとする人たちが,その分野では日常的に使われて入るが理解が難しい点に関して,研究室の先輩が後輩に教えるような内容の書籍である.本書籍において畳込みの解説について執筆した.

ティーチングポートフォリオ 平成27年8月

自らの教育に対する理念を意識化するために,また,自らの教育理念を確立することにより,数年後の自分自身の教育者像を明確にすることも目的としてティーチングポートフォリオを作成した.

Advanced in Modern Blind Source Separation Techniques: Theory and Applications(分担執筆) 平成26年1月

ブラインド信号分離についての近年の手法をまとめた著書である.本書籍において,マイクロホンアレーを用いた非線形信号処理と音声認識率の関係について執筆した.

学校の評価
 
実務経験 特記事項
該当なし
 
その他
共同研究(株式会社エス・エム・エイ) 平成29年〜

片耳難聴者のために,難聴側の耳で観測される信号を健常側の耳で聞き取れるアプリケーションの製作を行う.マイクロホン付きイヤホンを両耳に装着し,難聴側の耳で聞こえるはずの信号を Bluetooth 通信によってスマートフォン等のデバイス経由で健常側のイヤホンから再生する.また,スマートフォンで信号処理を施すことによって,難聴者の聞こえの改善を目指す.学生が本事業の一部を分担し,リアルタイムで動作するアプリケーションを作成した.

日本学術振興会科学研究費助成事業若手研究B採択 平成28年4月 〜平成31年3月

ハンズフリー音声認識・視線検出システムによる上肢不自由者のための文書作成支援の確立を目指す.上肢障害があると,一般のキーボードや携帯電話のデバイスの操作が困難で,メールやレポート等の比較的長い文書を作成するには多大な労力を要する.現行の音声認識システムは文字の入力速度が速く,認識精度も向上しているものの,雑音や残響の影響により音声認識率は100%とはならず,誤認識に対しては健常者がキーボード等で修正することが想定 されている.しかし,上肢不自由者は上記の誤認識に対する修正ができないといった問題がある.そこで,文書の概形の作成を音声認識で作成し,誤認識を修正するために視線や顔の情報を用いるシステムを確立し,上肢不自由者が高速に文書を作成できるようになることを目指す.本科の卒業研究および専攻科の応用研究で本課題の一部を分担することで,学生の国際会議採択を目指す.

一般財団法人水西倶楽部事業助成金採択 平成27年4月 〜平成28年3月

音声認識システムとジェスチャー認識を組み合わせた,上肢不自由者のための文書作成支援アプリケーションの開発を行った.学生が本事業の一部を分担し,リアルタイムで動作するアプリケーションを作成した.また,国内での学会発表も行った.

日本学術振興会科学研究費助成事業研究活動スタート支援採択 平成26年4月 〜平成28年3月

高齢者・難聴者が様々な雑音が存在する実環境下で,コミュニケーションを取りやすくするための補聴器の開発である.雑音環境下で補聴器を使用するには,目的音声を強調するための雑音抑圧技術が有効であるが,環境によっては目的音声が歪みすぎるなどの問題がある.そこで本研究では,雑音抑圧後の音声信号の品質を高次統計量の基づき自動制御する手法について研究を行った.本課題で得た知見を今後の卒業研究や教育に活かしてきた.

日本学術振興会特別研究員(DC2)採択 平成25年4月 〜平成26年3月

本研究においては,音声強調部と音響モデル・言語モデルなどの音声認識部を含めたハンズフリー音声対話システムを想定し,システム全体の統合的な自律的最適化を行う理論の研究を行った.この課題を解決するために,音響モデルや言語モデルも扱ったため,研究の幅が広がり,学生の研究で多種多様なテーマを設定できるようになった.

トヨタ自動車株式会社との共同研究 平成22年4月 〜平成26年3月

雑音環境下で動作するロボットを目指して,ロボットの聴覚部分に必要な音源分離や雑音抑圧に関する研究を共同で行った.この共同研究によって得られた,音声認識性能を向上させるための信号処理やアルゴリズムの知見が,現在の研究教育につながっている.

ヤマハ株式会社との共同研究 平成22年4月 〜平成26年3月

非線形信号処理によって発生する人工的な雑音の定量的な評価方法や,人工的な雑音が発生しないアルゴリズムの研究などを共同で行った.この共同研究によって得られた,統計的信号処理や雑音抑圧手法の知見が,現在の研究教育につながっている.

職務上の能力に関する事項
資格・免許
該当なし
 
特許等
雑音抑圧装置 特願2012ー147594 特開2014ー010279 平成24年 6月

複数のチャネルの音響信号を利用した構成のもとで雑音成分を高精度に抑圧する.雑音抑圧部は,相異なる位置に配置された複数の収音機器Mが生成するD個のチャネルの音響信号xd(t)に対して雑音成分を抑圧する雑音抑圧処理を実行する.制御部は,複数の周波数の各々について,当該周波数での平均強度が高いチャネルの音響信号xd(t)が雑音抑圧処理に優先的に反映されるように雑音抑圧部を制御する.

係数設定装置および雑音抑圧装置 特願2102ー123779 特開2013ー250356 平成24年 5月

ミュージカルノイズの発生を有効に抑制し得る雑音抑圧を実現する.係数設定装置は,音響信号Sx(t)の各周波数fの観測成分X(f,τ)に乗算されて音響信号Sx(t)の雑音成分を抑圧する処理係数G(f,τ)の算定にて事前SNRに適用に適用される忘却係数αを設定する.係数設定部は,観測成分X(f,τ)の強度分布をガンマ分布で近似する確率密度関数P(x)の積分に一般化ガウス・ラゲール求積法を適用した演算式を利用して雑音成分の形状母数ηと忘却係数αとに応じたモーメントμmを算定する尖度指標算定処理により,雑音抑圧前後の尖度変化を示す尖度指標Kを算定し,尖度指標Kが目標値Ktarを下回るように忘却係数αを設定する.

雑音抑圧係数設定装置および雑音抑圧装置 特願2011-245206 特開2013-68919 平成23年11月

入力音響信号の強度分布の形状に応じた雑音特性値を算定する特性値算定手段と,音響信号の強度分布の尖度が雑音抑圧処理の前後で変化しない場合における当該音響信号の雑音特性と雑音抑圧処理のフロアリング処理に適用されるフロアリング係数との関係を規定する関係式を満たすように,特性値算定手段が算定した雑音特性値に応じてフロアリング係数を可変に設定する第1係数設定手段とを具備する.

実務経験 特記事項
該当なし
 
その他
該当なし
 
著作、学術論文等
著作
音声認識及び視線検出を用いたテキスト作成アプリケーションの開発 地域ケアリング 共著 2018年 11月

宮崎亮一, 五十嵐辰哉

Musical-noise-free blind speech extraction based on higher-order statistics analysis (in book chapter) Springer 2018年

Hiroshi Saruwatari, Ryoichi Miyazaki

音響学入門ペディア コロナ社 200p 9784339008951 2017年

日本音響学会

Statistical analysis and evaluation of blind speech extraction algorithms Advances in Modern Blind Source Separation Techniques: Theory and Applications (G. Naik and W. Wang Eds.), Springer 2014年

章分担 Hiroshi Saruwatari, Ryoichi Miyazaki

学術論文
Musical-noise-free noise reduction by using biased harmonic regeneration and considering relationship between a priori SNR and sound quality (査読付) ELSEVIER SCI LTD APPLIED ACOUSTICS APPLIED ACOUSTICS 168巻 0003-682X 2020年 11月

This paper focuses on two representative single-microphone noise reduction problems: speech distortion and musical noise. Many noise reduction methods have been proposed for each problem. Harmonic regeneration noise reduction (HRNR) was introduced for the improvements of speech distortion and the a priori signal-to-noise ratio (SNR) estimator. HRNR involves using a unique signal to regenerate harmonics, which had been eliminated. Musical-noise-free noise reduction based on the minimum-mean square error short-time spectral amplitude estimator (musical-noise-free MMSE-STSA estimator) has also been proposed. This method can suppress a noisy signal without generating musical noise by introducing a bias into the classical a priori SNR estimator. We propose a noise reduction method for addressing these problems simultaneously by improving the classical a priori SNR estimator. We investigated the behavior of the internal parameters for the proposed and conventional methods with regard to speech quality and show the effectiveness of the proposed method in terms of speech distortion and musical noise. We consider and discuss the relationship between the estimation accuracy of an a priori SNR and speech quality. Specifically, we consider the factors to improve speech quality in terms of biasing. (C) 2020 The Author(s). Published by Elsevier Ltd. Masakazu Une, Ryoichi Miyazaki

Stable Training of Dnn for Speech Enhancement Based on Perceptually-Motivated Black-Box Cost Function. (査読付) pp.7524~7528 2020年

Masaki Kawanaka, Yuma Koizumi, Ryoichi Miyazaki, Kohei Yatabe

Cross Conditional Network for Speech Enhancement. (査読付) pp.1~2 2019年

Haruki Tanaka, Yosuke Sugiura, Nozomiko Yasui, Tetsuya Shimamura, Ryoichi Miyazaki

Single-Channel Noise Spectral Estimation Based on Compensated Speech Presence Probability. (査読付) pp.741~742 2019年

Masaki Kawanaka, Masakazu Une, Ryoichi Miyazaki

Generative approach using the noise generation models for DNN-based speech synthesis trained from noisy speech. (査読付) IEEE Asia-Pacific Signal and Information Processing Association Annual Summit and Conference, APSIPA ASC 2018, Honolulu, HI, USA, November 12-15, 2018 Asia-Pacific Signal and Information Processing As 2018年

Masakazu Une, Yuki Saito, Shinnosuke Takamichi, Daichi Kitamura, Ryoichi Miyazaki, Hiroshi Saruwatari

Musical-Noise-Free Speech Enhancement with Low Speech Distortion by Biased Harmonic Regeneration Technique. (査読付) IEEE 16th International Workshop on Acoustic Signal Enhancement, IWAENC 2018, Tokyo, Japan, September 17-20, 2018 16th International Workshop on Acoustic Signal Enhancement, IWAENC 2018, Tokyo, Japan, 2018年

Masakazu Une, Ryoichi Miyazaki

Speech Statistics Estimation for Speech Quality Evaluation in Noisy Environment. (査読付) pp.200~204 2018年

Ryoichi Miyazaki

Estimation of spectral subtraction parameter-set for maximizing speech recognition performance. (査読付) IEEE IEEE 5th Global Conference on Consumer Electronics, GCCE 2016, Kyoto, Japan, October 11-14, 2016 IEEE 5th Global Conference on Consumer Electronics, GCCE 2016, Kyoto, Japan, October 11-14, 2016 p 2016年

Shintaro Kubo, Ryoichi Miyazaki

Musical-noise-free blind speech extraction integrating microphone array and iterative spectral subtraction (査読付) ELSEVIER SCIENCE BV SIGNAL PROCESSING SIGNAL PROCESSING 102巻 pp.226~239 0165-1684 2014年 09月

In this paper, we propose a musical-noise-free blind speech extraction method using a microphone array for application to nonstationary noise. In our previous study, it was found that optimized iterative spectral subtraction (SS) results in speech enhancement with almost no musical noise generation, but this method is valid only for stationary noise. The proposed method consists of iterative blind dynamic noise estimation by, e.g., independent component analysis (ICA) or multichannel Wiener filtering, and musical-noise-free speech extraction by modified iterative SS, where multiple iterative SS is applied to each channel while maintaining the multichannel property reused for the dynamic noise estimators. Also, in relation to the proposed method, we discuss the justification of applying ICA to signals nonlinearly distorted by SS. From objective and subjective evaluations simulating a real-world hands-free speech communication system, we reveal that the proposed method outperforms the conventional methods. (C) 2014 The Authors. Published by Elsevier B.V. Ryoichi Miyazaki, Hiroshi Saruwatari, Satoshi Nakamura, Kiyohiro Shikano, Kazunobu Kondo, Jonathan Blanchette, Martin Bouchard

Musical-Noise-Free Speech Enhancement Based on Higher-Order Statistics Pursuit Nara Institute of Science and Technology Nara Institute of Science and Technology 2014年 03月

Ryoichi Miyazaki

THEORETICAL ANALYSIS OF BIASED MMSE SHORT-TIME SPECTRAL AMPLITUDE ESTIMATOR AND ITS EXTENSION TO MUSICAL-NOISE-FREE SPEECH ENHANCEMENT (査読付) IEEE 2014 4TH JOINT WORKSHOP ON HANDS-FREE SPEECH COMMUNICATION AND MICROPHONE ARRAYS (HSCMA) 2014 4TH JOINT WORKSHOP ON HANDS-FREE SPEECH COMMUNICATION AND MICROPHONE ARRAYS (HSCMA) pp.122~126 2014年

In this paper, we provide a theoretical analysis of the minimum mean-square error short-time spectral amplitude (MMSE-STSA) estimator with the biased a priori SNR estimation and its extension to musical-noise-free speech enhancement. Recently, musical-noise-free speech enhancement has been proposed, where no musical noise is generated in iterative spectral subtraction. However, no existence of the musical-noise-free condition in the MMSE-STSA estimator has been reported. Therefore, in this paper, we show that the musical-noise-free condition exists in the biased MMSE-STSA estimator via the theoretical analysis. In addition, we perform comparative experiments and clarify the efficacy of the proposed musical-noise-free speech enhancement. Shunsuke Nakai, Hiroshi Saruwatari, Ryoichi Miyazaki, Satoshi Nakamura, Kazunobu Kondo

Information-Geometric Optimization for Nonlinear Noise Reduction Systems (査読付) IEEE 2013 INTERNATIONAL SYMPOSIUM ON INTELLIGENT SIGNAL PROCESSING AND COMMUNICATIONS SYSTEMS (ISPACS) 2013 INTERNATIONAL SYMPOSIUM ON INTELLIGENT SIGNAL PROCESSING AND COMMUNICATIONS SYSTEMS (ISPACS) 2013年

In this paper, we introduce an optimization theory of nonlinear noise reduction with a perfectly musical-noise-free property. To achieve high-quality noise reduction, an iterative spectral subtraction method, i.e., recursively applied weak nonlinear signal processing, has been proposed. Although evaluation experiments indicated the existence of an appropriate parameter setting that gives a musical-noise-free state, no theoretical studies have been carried out so far. Therefore, first, we theoretically derive parameters that satisfy the musical-noise-free condition by analysis based on higher-order statistics. It is clarified that finding a fixed point in the kurtosis of noise spectra enables the reproduction of the musical-noise-free state. Next, we derive a musical-noise-free condition in iterative Wiener filtering. Also, we provide an analogical perspective between the musical-noise-free noise reduction algorithm and the conventional information-geometric optimization theory. Finally, comparative experiments with commonly used noise reduction methods show the efficacy of the proposed method. Hiroshi Saruwatari, Ryoichi Miyazaki

Musical Noise Analysis for Bayesian Minimum Mean-Square Error Speech Amplitude Estimators Based on Higher-Order Statistics (査読付) ISCA-INT SPEECH COMMUNICATION ASSOC 14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION (INTERSPEECH 2013), VOLS 1-5 14TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNI 2013年

In this study, we perform a theoretical analysis of the amount of musical noise generated in Bayesian minimum mean-square error speech amplitude estimators. In our previous study, a musical noise assessment based on kurtosis has been successfully applied to spectral subtraction. However, it is difficult to apply this approach to the methods with a decision-directed a priori SNR estimator because it corresponds to a nonlinear recursive process for noise power spectral sequences. Therefore, in this paper, we analyze musical noise generation by combining Breithaupt-Martin's approximation and our higher-order statistics analysis. We also compare the result of theoretical analysis and that of objective experimental evaluation to indicate the validity of the proposed closed-form analysis. Hiroshi Saruwatari, Suzumi Kanehara, Ryoichi Miyazaki, Kiyohiro Shikano, Kazunobu Kondo

Theoretical analysis of musical noise generation for blind speech extraction with generalized MMSE short-time spectral amplitude estimator (査読付) IET Conference Publications IET Conference Publications 2013巻 619号 2013年

In this paper, we discuss the amount of musical noise generation for blind speech extraction using minimum mean-square error short-time spectral amplitude (MMSE-STSA) estimator. To achieve high quality speech enhancement, we have previously proposed blind spatial subtraction array (BSSA). However, BSSA always suffers from artificial distortion, so-called musical noise, owing to nonlinear signal processing. Therefore, we propose the improved BSSA using the MMSE-STSA estimator and its generalized method as the post-processing part of BSSA. Also, we conduct a theoretical analysis for the amount of musical noise generation in the proposed method. From the theoretical analysis and objective evaluation results, we derive the optimal parameter for the proposed method. Shunsuke Nakai, Ryoichi Miyazaki, Hiroshi Saruwatari, Satoshi Nakamura

Toward Musical-Noise-Free Blind Speech Extraction: Concept and Its Applications (査読付) IEEE 2013 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA) 2013 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE 2013年

In this paper, we review a blind musical-noise-free speech extraction method using a microphone array that can be applied to nonstationary noise. In our previous study, it was found that optimized iterative spectral subtraction (SS) results in speech enhancement with almost no musical noise generation, but this method is valid only for stationary noise. The proposed method consists of iterative blind dynamic noise estimation by, e.g., ICA or multichannel Wiener filtering, and musical-noise-free speech extraction by modified iterative SS, where multiple iterative SS is applied to each channel while maintaining the multichannel property reused for the dynamic noise estimators. Also, related to the proposed method, we discuss the justification of applying ICA to such signals nonlinearly distorted by SS. From objective and subjective evaluations simulating real-world hands-free speech communication system, we reveal that the proposed method outperforms the conventional methods. Ryoichi Miyazaki, Hiroshi Saruwatari, Satoshi Nakamura, Kiyohiro Shikano, Kazunobu Kondo, Jonathan Blanchette, Martin Bouchard

Musical-Noise-Free Speech Enhancement Based on Optimized Iterative Spectral Subtraction (査読付) IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC IEEE TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING IEEE TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING 20巻 7号 pp.2080~2094 1558-7916 2012年 09月

In this paper, we provide a theoretical analysis of the amount of musical noise in iterative spectral subtraction, and its optimization method for the least musical noise generation. To achieve high-quality noise reduction with low musical noise, iterative spectral subtraction, i.e., iteratively applied weak nonlinear signal processing, has been proposed. Although the effectiveness of the method has been reported experimentally, there have been no theoretical studies. Therefore, in this paper, we formulate the generation process of musical noise by tracing the change in kurtosis of noise spectra, and conduct a comparison of the amount of musical noise for different parameter settings but the same achieved level of noise attenuation. Furthermore, we theoretically derive the optimal internal parameters that generate no musical noise. It is clarified that to find a fixed point in kurtosis yields the no-musical-noise property. Comparative experiments with commonly used noise reduction methods show the proposed method's efficacy. Ryoichi Miyazaki, Hiroshi Saruwatari, Takayuki Inoue, Yu Takahashi, Kiyohiro Shikano, Kazunobu Kondo

ミュージカルノイズフリー雑音抑圧とブラインド信号抽出手法への拡張 奈良先端科学技術大学院大学 奈良先端科学技術大学院大学 2012年 03月

宮崎亮一

Theoretical Analysis of Amounts of Musical Noise and Speech Distortion in Structure-Generalized Parametric Blind Spatial Subtraction Array (査読付) IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICA 2012年 02月

We propose a structure-generalized blind spatial subtraction array (BSSA), and the theoretical analysis of the amounts of musical noise and speech distortion. The structure of BSSA should be selected according to the application, i.e., a channelwise BSSA is recommended for listening but a conventional BSSA is suitable for speech recognition. Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano

Blind Speech Extraction for Non-Audible Murmur Speech with Speaker's Movement Noise (査読付) IEEE 2012 IEEE INTERNATIONAL SYMPOSIUM ON SIGNAL PROCESSING AND INFORMATION TECHNOLOGY (ISSPIT) 2012 IEEE INTERNATIONAL SYMPOSIUM ON SIGNAL PROCESSING AND INFORMATION TECHNOLOGY (ISSPIT) pp.320~325 21 2012年

In this paper, we address an improved method of noise reduction used in multichannel Non-Audible Murmur (NAM) based on blind source separation. Recently, speech processing with NAM has been proposed for applying versatile speech interface into quiet environments where we hesitate to utter. NAM is a very soft whispered voice signal detected with the NAM microphone, which is one of the body-conductive microphone. The detected NAM signal always suffers from nonstationary noise caused by speaker's movement because it changes the setting condition of the NAM microphone. In order to reduce the noise signal, blind noise reduction using stereo NAM signals detected with two NAM microphones has been proposed by some of the authors. In this paper, we aim to achieve further improvement in the noise reduction ability by changing the noise estimation and postprocessing algorithms to enhance the target NAM signal. In addition, we evaluate the application of recording the NAM signals with various types of microphones. Miyuki Itoi, Ryoichi Miyazaki, Tomoki Toda, Hiroshi Saruwatari, Kiyohiro Shikano

Comparative Study on Various Noise Reduction Methods with Decision-Directed a Priori SNR Estimator via Higher-Order Statistics (査読付) IEEE 2012 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC) 2012 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERE 2012年

In this paper, we propose a new theoretical analysis of amount of musical noise generated in several noise reduction methods with a decision-directed a priori SNR estimator using higher-order statistics. In our previous study, a musical noise assessment based on kurtosis has been successfully applied to spectral subtraction and Wiener filter. However, this approach cannot be applied to some high-quality noise reduction methods, namely, the minimum mean-square error short-time spectral amplitude estimator, the minimum mean square error log-spectral amplitude estimator and the maximum a posteriori estimator, because such methods include the decision-directed a priori SNR estimator, which corresponds to a nonlinear recursive (infinite) process for noise power spectral sequences. Therefore, in this paper, we introduce a computationally efficient higher-order-moment calculation method based on generalized Gauss-Laguerre quadrature. We also mathematically clarify the justification of using a typical decision-directed parameter, namely, magic number 0.98, in the three types of the decision-directed-based estimators from a viewpoint of amounts of musical noise and speech distortion. In addition, we perform comparison between these noise reduction methods based on the mathematical analysis and human perception test. Suzumi Kanehara, Hiroshi Saruwatari, Ryoichi Miyazaki, Kiyohiro Shikano, Kazunobu Kondo

MUSICAL-NOISE-FREE SPEECH ENHANCEMENT: THEORY AND EVALUATION (査読付) IEEE 2012 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) 2012 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP) pp.4565~4568 1520-614 2012年

In this paper, we propose a new theory of nonlinear noise reduction with a perfectly musical-noise-free property, where no musical noise is generated even for a high signal-to-noise ratio. To achieve high-quality noise reduction with low musical noise, an iterative spectral subtraction method, i.e., recursively applied weak nonlinear signal processing, has been proposed. Although evaluation experiments indicated the existence of an appropriate parameter setting that gives a musical-noise-free state, no theoretical studies have been carried out. Therefore, in this paper, we theoretically derive pairs of internal parameters that satisfy the musical-noise-free condition by analysis based on higher-order statistics. It is clarified that finding a fixed point in the kurtosis of noise spectra enables the reproduction of the musical-noise-free state, and comparative experiments with commonly used noise reduction methods show the efficacy of the proposed method. Ryoichi Miyazaki, Hiroshi Saruwatari, Takayuki Inoue, Kiyohiro Shikano, Kazunobu Kondo

Musical-Noise-Free Blind Speech Extraction Using ICA-Based Noise Estimation with Channel Selection. (査読付) VDE-Verlag IWAENC 2012 - International Workshop on Acoustic Signal Enhancement, Proceedings, RWTH Aachen University, Germany, September 4th - 6th, 2012. IWAENC 2012 - International Workshop on Acousti 2012年

Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano, Kazunobu Kondo

Musical-noise-free blind speech extraction using ICA-based noise estimation and iterative spectral subtraction (査読付) IEEE 2012 11th International Conference on Information Science, Signal Processing and their Applications, ISSPA 2012 2012 11th International Conference on Information Science, Signal Processing and th 2012年

In this paper, we propose a new iterative signal extraction method using a microphone array that can be applied to nonstationary noise. In our previous study, it was found that optimized iterative spectral subtraction (SS) results in speech enhancement with almost no musical noise generation, but this method is valid only for stationary noise. The proposed method consists of iterative blind dynamic noise estimation by independent component analysis (ICA) and musical-noise-free speech extraction by modified iterative SS, where multiple iterative SS is applied to each channel while maintaining the multi-channel property reused for ICA. Also, related to the proposed method, we discuss the justification of applying ICA to such signals nonlinearly distorted by SS. From objective and subjective evaluations, we reveal that the proposed method outperforms the conventional method. ? 2012 IEEE. Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano, Kazunobu Kondo

Theoretical Analysis of Musical Noise Generation in Noise Reduction Methods with Decision-Directed a Priori SNR Estimator. (査読付) VDE-Verlag IWAENC 2012 - International Workshop on Acoustic Signal Enhancement, Proceedings, RWTH Aachen University, Germany, September 4th - 6th, 2012. IWAENC 2012 - International Workshop on Acousti 2012年

Suzumi Kanehara, Hiroshi Saruwatari, Ryoichi Miyazaki, Kiyohiro Shikano, Kazunobu Kondo

Theoretical analysis of amounts of musical noise and speech distortion in structure-generalized parametric blind spatial subtraction array (査読付) Institute of Electronics, Information and Communication, Engineers, IEICE IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences IEICE Transactions on Fundamentals of 2012年

We propose a structure-generalized blind spatial subtraction array (BSSA), and the theoretical analysis of the amounts of musical noise and speech distortion. The structure of BSSA should be selected according to the application, i.e., a channelwise BSSA is recommended for listening but a conventional BSSA is suitable for speech recognition. Copyright ? 2012 The Institute of Electronics, Information and Communication Engineers. Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano

Theoretical analysis of musical noise in nonlinear noise reduction based on higher-order statistics (査読付) IEEE 2012 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC) 2012 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERE 2012年

In this paper, we review a musical-noise-generation analysis of nonlinear noise reduction techniques with using higher-order statistics (HOS). Recently, an objective metric based on HOS to analyze nonlinear artifacts, i.e., musical noise, caused by nonlinear noise reduction techniques has been proposed. Such metric enables us to perform objective comparison of any nonlinear methods from the perspective of the amount of musical noise generated. Furthermore, such metric enables us to control the musical noise generated by nonlinear noise reduction techniques. In the paper, first, the mathematical principle of the analysis for the amount of musical noise based on HOS is described, and analyses and comparison examples of typical nonlinear noise reduction techniques are demonstrated. Next, it is clarified that to find a fixed point in HOS leads to no-musical noise property in noise reduction. Finally, several expansions on the theory are discussed. Yu Takahashi, Ryoichi Miyazaki, Hiroshi Saruwatari, Kazunobu Kondo

Theoretical analysis of musical noise and speech distortion in structure-generalized parametric blind spatial subtraction array (査読付) ISCA-INT SPEECH COMMUNICATION ASSOC 12TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH COMMUNICATION ASSOCIATION 2011 (INTERSPEECH 2011), VOLS 1-5 12TH ANNUAL CONFERENCE OF THE INTERNATIONAL SPEECH CO 2011年

In this paper, we propose a structure-generalized parametric blind spatial subtraction array (BSSA), and the theoretical analysis of the amounts of musical noise and speech distortion is conducted via higher-order statistics. We theoretically prove a tradeoff between the amounts of musical noise and speech distortion in various BSSA structures. From the analysis and experimental evaluations, we reveal that the structure should be carefully selected according to the application, i.e., a channelwise BSSA structure is recommended for listening but a normal BSSA is more suitable for speech recognition. Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano

Theoretical analysis of parametric blind spatial subtraction array and its application to speech recognition performance prediction (査読付) 2011 Joint Workshop on Hands-free Speech Communication and Microphone Arrays, HSCMA'11 2011 Joint Workshop on Hands-free Speech Communication and Microphone Arrays, HSCMA'11 pp.19~24 2011年

In this paper, an improved parametric postfiltering is introduced in our previously proposed blind spatial subtraction array (BSSA), and its theoretical analysis of the amounts of musical noise and noise reduction is conducted via higher-order statistics. Compared with the conventional BSSA, it is clarified that parametric BSSA can improve speech recognition performance. Next, we propose an unsupervised speech-recognition-performance prediction metric based on higher-order statistics in BSSA. We successfully reveal that the noise and speech kurtosis can be used for predicting speech recognition performance without using any reference speech signals. ? 2011 IEEE. Ryoichi Miyazaki, Hiroshi Saruwatari, Ryo Wakisaka, Kiyohiro Shikano, Tomoya Takatani

その他
入力SNRを考慮した音声存在確率に基づく単一チャネル雑音スペクトル推定 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2019巻 pp.ROMBUNNO.2‐Q‐41~ 1880-7658 2019年 02月 19日

河中昌樹, 宇根昌和, 宮崎亮一

小学生を対象としたPure Dataによるサウンドプログラミング講座の実施報告 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2019巻 pp.ROMBUNNO.3‐3‐8~ 1880-7658 2019年 02月 19日

宮崎亮一

バイアス付き倍音復元技術における内部パラメータと音質の関係性の調査 電子情報通信学会技術研究報告 電子情報通信学会技術研究報告 118巻 357(EA2018 81-92)号 pp.7‐14~ 0913-5685 2018年 12月 06日

宇根昌和, 宮崎亮一

アドホックマイクロホンアレイのための音の発信を利用しない録音機器間の距離推定 第21回日本音響学会関西支部若手研究者交流研究発表会 第21回日本音響学会関西支部若手研究者交流研究発表会 2018年 12月

半田礼子, 宮崎亮一

スマートデバイスを用いた一側性難聴者向け集音器システムの開発 スマートデバイスを用いた一側性難聴者向け集音器システムの開発 スマートデバイスを用いた一側性難聴者向け集音器システムの開発 2018年 12月

田島健太朗, 河村泰雅, 藤本佳吾, 宮崎亮一, 福田充

雑音の過小推定を防ぐ高精度な雑音推定に関する研究 第21回日本音響学会関西支部若手研究者交流研究発表会 第21回日本音響学会関西支部若手研究者交流研究発表会 2018年 12月

河中昌樹, 宇根昌和, 宮崎亮一

Generative Approach using the Noise Generation Models for DNN-based Speech Synthesis Trained from Noisy Speech, Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2018 国際会議 口頭発表(招待・特別) 2018年 11月

宇根昌和, 斎藤佑樹, 高道慎之介, 北村大地, 宮崎亮一, 猿渡洋

Speech Statistics Estimation for Speech Quality Evaluation in Noisy Environment International Symposium on Intelligent Signal Processing and Communication Systems 国際会議 口頭発表(招待・特別) 2018年 11月

宮崎亮一

音声認識及び視線検出を用いたテキスト作成アプリケーションの開発 地域ケアリング 地域ケアリング 20巻 11号 pp.101‐103~ 1345-0123 2018年 10月 12日

宮崎亮一, 五十嵐辰哉

Musical-Noise-Free Speech Enhancement with Low Speech Distortion by Biased Harmonic Regeneration Technique International Workshop on Acoustic Signal Enhancement 国際会議 ポスター発表 2018年 09月

宇根昌和, 宮崎亮一

アレー信号処理による音声認識及び視線検出を用いたテキスト作成アプリケーションの開発 電子情報通信学会技術研究報告 電子情報通信学会技術研究報告 117巻 502(WIT2017 66-91)号 pp.115‐119~ 0913-5685 2018年 03月 02日

五十嵐辰哉, 宮崎亮一

Estimation of beta-order MMSE-STSA parameter set for maximizing speech recognition performance with multiple regression analysis 2018 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP18) 国際会議 口頭発表(一般) 2018年 03月

久保慎太郎, 宮崎亮一

雑音環境下音声を用いたDNN音声合成のための雑音生成モデルの敵対的学習 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2018巻 pp.ROMBUNNO.3‐8‐8~ 1880-7658 2018年 02月 27日

宇根昌和, 宇根昌和, 齋藤佑樹, 高道慎之介, 北村大地, 宮崎亮一, 猿渡洋

雑音環境下音声を用いた音声合成のための雑音生成モデルの敵対的学習 情報処理学会研究報告(Web) 情報処理学会研究報告(Web) 2017巻 SLP-118号 pp.Vol.2017‐SLP‐118,No.1,1‐6 (WEB ONLY)~ 2017年 10月 06日

宇根昌和, 宇根昌和, 齋藤佑樹, 高道慎之介, 北村大地, 宮崎亮一, 猿渡洋

倍音復元技術に基づくバイアス付き事前SNR推定を導入したミュージカルノイズフリーMMSE‐STSA法の音質改善に関する研究 情報処理学会研究報告(Web) 情報処理学会研究報告(Web) 2017巻 MUS-115号 pp.Vol.2017‐MUS‐115,No.47,1‐6 (WEB ONLY)~ 2017年 06月 10日

宇根昌和, 宮崎亮一

Evaluation of Sound Quality and Speech Recognition Performance using Harmonic Regeneration for Various Noise Reduction Techniques 2017 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP17) 国際会議 口頭発表(一般) 2017年 02月 28日

音声認識性能を最大と雑音抑圧の内部パラメータ推定に関する研究 IEEE CEソサイエティ西日本合同チャプタ主催1月研究会 国内会議 口頭発表(招待・特別) 2017年 01月 20日

宮崎亮一, 久保真太郎

Estimation of Spectral Subtraction Parameter-Set for Maximizing Speech Recognition Performance 5th IEEE Global Conference on Consumer Electronics 国際会議 口頭発表(一般) 2016年 10月 11日

音声認識性能を最大とするスペクトル減算法のパラメータ推定 電子情報通信学会大会講演論文集(CD-ROM) 電子情報通信学会大会講演論文集(CD-ROM) 2016巻 pp.ROMBUNNO.A‐5‐4~ 1349-144X 2016年 09月 06日

久保真太郎, 宮崎亮一

音声認識システムおよび顔の情報を用いた上肢不自由者のためのテキスト作成アプリケーションの開発 (応用音響) 電子情報通信学会 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 115巻 359号 pp.59~62 0913-5685 2015年 12月 11日

礒本 俊弥, 宮崎 亮一

音声認識システムおよび顔の情報を用いた上肢不自由者のためのテキスト作成アプリケーションの開発 電子情報通信学会技術研究報告 電子情報通信学会技術研究報告 115巻 359(EA2015 40-54)号 pp.59‐62~ 0913-5685 2015年 12月 04日

礒本俊弥, 宮崎亮一

創造演習・創造製作によるICT人材の育成 日本高専学会年会講演会講演論文集(CD-ROM) 日本高専学会年会講演会講演論文集(CD-ROM) 21st巻 pp.ROMBUNNO.C3‐1~ 2015年

山田健仁, 高山泰博, 古賀崇了, 宮崎亮一

複数のKinectを用いた2次元音源位置推定に関する研究 日本高専学会年会講演会講演論文集(CD-ROM) 日本高専学会年会講演会講演論文集(CD-ROM) 21st巻 pp.ROMBUNNO.P204~ 2015年

山本慎隆, 宮崎亮一

降雨環境下における補聴システム開発を目的とした降雨雑音の収録及び解析 日本高専学会年会講演会講演論文集(CD-ROM) 日本高専学会年会講演会講演論文集(CD-ROM) 21st巻 pp.ROMBUNNO.P203~ 2015年

原田佳幸, 宮崎亮一, 平栗靖皓

雑音中からの音声モーメントの推定精度に関する評価 日本高専学会年会講演会講演論文集(CD-ROM) 日本高専学会年会講演会講演論文集(CD-ROM) 21st巻 pp.ROMBUNNO.P201~ 2015年

垣元宏太, 宮崎亮一

音声認識性能を最大限に引き出すスペクトル減算法のパラメータに関する調査 日本高専学会年会講演会講演論文集(CD-ROM) 日本高専学会年会講演会講演論文集(CD-ROM) 21st巻 pp.ROMBUNNO.P202~ 2015年

久保真太郎, 宮崎亮一

顔の方向情報を用いたテキスト編集補助アプリケーションの開発 日本高専学会年会講演会講演論文集(CD-ROM) 日本高専学会年会講演会講演論文集(CD-ROM) 21st巻 pp.ROMBUNNO.P206~ 2015年

礒本俊弥, 宮崎亮一

工業高等専門学校について 日本音響学会誌 日本音響学会誌 70巻 7号 pp.410~ 2014年 07月

宮崎亮一

Theoretical Analysis of Biased MMSE Short-Time Spectral Amplitude Estimator and Its Extension to Musical-Noise-Free Speech Enhancement 4th Joint Workshop on Hands-free Speech Communication and Microphone Arrays (HSCMA2014) 国際会議 ポスター発表 2014年 05月

Shunsuke Nakai, Hiroshi Saruwatari, Ryoichi Miyazaki, Satoshi Nakamura, Kazunobu Kond

スマートポスターボードにおける音響情報と画像情報の統合による話者区間検出 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2014巻 pp.ROMBUNNO.2-Q4-7~ 1880-7658 2014年 03月 03日

若林佑幸, 井上昂治, 河原達也, 中井駿介, 宮崎亮一, 猿渡洋

Control Method of Number of Iterations Based on Speech Kurtosis Ratio in Musical-Noise-Free Blind Speech Extraction RISP 2014 International Workshop on Nonlinear Circuits, Communication and Signal Processing (NCSP2014) 国際会議 口頭発表(一般) Hawaii, USA 2014年 02月

Yuka Hirano, Ryoichi Miyazaki, Hiromichi Kawanami, Hiroshi Saruwatari, Satoshi Nakamura, Tomoya Takatani

Semi-Blind Multiple Speech Extraction under Diffuse Noise Condition for Smart Posterboard RISP 2014 International Workshop on Nonlinear Circuits, Communication and Signal Processing 国際会議 口頭発表(一般) Hawaii, USA 2014年 02月

Shunsuke Nakai, Ryoichi Miyazaki, Hiromichi Kawanami, Hiroshi Saruwatari, Satoshi Nakamura, Kazunobu Kondo

ミュージカルノイズフリーMMSE短時間振幅スペクトル推定器におけるバイアス付き事前SNR推定についての検討 (応用音響 音響・超音波サブソサイエティ合同研究会) 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113巻 413号 pp.87~92 0913-5685 2014年 01月 27日

本研究では,最小平均二乗誤差規範短時間振幅スペクトル(MMSE-STSA)推定器に基づくミュージカルノイズフリー音声強調法におけるバイアス付き事前SNR推定について検討を行う.先行研究において我々は,ミュージカルノイズを全く発生させずに雑音を抑圧するミュージカルノイズフリー音声強調法を提案している.また,筆者らはMMSE-STSA推定器にバイアス付き事後SNRを導入することで,ミュージカルノイズフリー状態を達成できることを明らかにしている.本研究では,先行研究で示されたものとは異なる,新しいバイアス付き事前SNR推定を提案する. 中井 駿介, 宮崎 亮一, 猿渡 洋, 中村 哲, 近藤 多伸

高次統計量に基づく教師なし音声品質評価尺度を用いた音声認識率予測の検討 (応用音響 音響・超音波サブソサイエティ合同研究会) 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113巻 413号 pp.93~98 0913-5685 2014年 01月 27日

本論文では,音声認識率の予測における音声歪みの教師なし評価尺度として音声カートシス比を導入する.音声認識率予測の説明変数である音声カートシス比には雑音抑圧処理前後の音声カートシスの推定が必要である.雑音抑圧処理前の音声カートシスの推定に関しては,我々は動的に推定した雑音を用いた音声カートシス推定法を提案した.しかし,雑音抑圧処理後の音声カートシス推定についてはまだ検討されていない.本稿では,雑音抑圧処理後の音声カートシス推定の検討を行い,音声認識実験を行った.その結果,提案手法を用いた場合においても,音声カートシスは音声認識率を予測するための指標になることが確認できた. 平野 佑佳, 宮崎 亮一, 猿渡 洋, 中村 哲, 高谷 智哉

ミュージカルノイズフリーMMSE短時間振幅スペクトル推定器におけるバイアス付き事前SNR推定についての検討 電子情報通信学会技術研究報告 電子情報通信学会技術研究報告 113巻 413(EA2013 103-119)号 pp.87~92 0913-5685 2014年 01月 20日

中井駿介, 宮崎亮一, 猿渡洋, 中村哲, 近藤多伸

高次統計量に基づく教師なし音声品質評価尺度を用いた音声認識率予測(ニューロコンピューティングの実装及び人間科学のための解析・モデル化,一般) 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. EA, 応用音響 電子情報通信学会技術研究報告. EA, 応用音響 113巻 413号 pp.93~98 0913-5685 2014年 01月 20日

本論文では,音声認識率の予測における音声歪みの教師なし評価尺度として音声カートシス比を導入する.音声認識率予測の説明変数である音声カートシス比には雑音抑圧処理前後の音声カートシスの推定が必要である.雑音抑圧処理前の音声カートシスの推定に関しては,我々は動的に推定した雑音を用いた音声カートシス推定法を提案した.しかし,雑音抑圧処理後の音声カートシス推定についてはまだ検討されていない.本稿では,雑音抑圧処理後の音声カートシス推定の検討を行い,音声認識実験を行った.その結果,提案手法を用いた場合においても,音声カートシスは音声認識率を予測するための指標になることが確認できた. 平野 佑佳, 宮崎 亮一, 猿渡 洋, 中村 哲, 高谷 智哉

MAP推定器におけるミュージカルノイズフリー雑音抑圧理論の確立 日本音響学会 日本音響学会研究発表会講演論文集 日本音響学会 編 日本音響学会研究発表会講演論文集 日本音響学会 編 2014巻 pp.547~550 1880-7658 2014年

宮崎 亮一

スマートポスターボードにおける実環境を想定した複数話者分離 日本音響学会 日本音響学会研究発表会講演論文集 日本音響学会 編 日本音響学会研究発表会講演論文集 日本音響学会 編 2014巻 pp.133~136 1880-7658 2014年

中井 駿介, 宮崎 亮一, 猿渡 洋

ミュージカルノイズフリー音声抽出における音声カートシス比に基づく反復回数の制御 日本音響学会 日本音響学会研究発表会講演論文集 日本音響学会 編 日本音響学会研究発表会講演論文集 日本音響学会 編 pp.669~672 1880-7658 2014年

平野 佑佳, 宮崎 亮一, 猿渡 洋

工業高等専門学校について(ちょっとしたエッセイ,コーヒーブレーク) 一般社団法人 日本音響学会 日本音響学会誌 日本音響学会誌 70巻 7号 pp.410~410 0369-4232 2014年

宮崎 亮一

Theoretical Analysis of Musical Noise Generation for Blind Speech Extraction with Generalized MMSE Short-Time Spectral Amplitude Estimator ntelligent Signal Processing Conference (ISP2013) 国際会議 口頭発表(一般) London, UK 2013年 12月

Shunsuke Nakai, Ryoichi Miyazaki, Hiroshi Saruwatari, Satoshi Nakamura

Information-Geometric Optimization for Nonlinear Noise Reduction Systems Intelligent Signal Processing and Communication Systems (ISPACS2013) 国際会議 口頭発表(招待・特別) Naha, Japan 2013年 11月

Hiroshi Saruwatari, Ryoichi Miyazaki

Toward Musical-Noise-Free Blind Speech Extraction: Concept and Its Applications APSIPA Annual Summit and Conference 2013 (APSIPA2013) 国際会議 口頭発表(招待・特別) Kaohsiung, Taiwan 2013年 10月

Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano, Satoshi Nakamura, Kazunobu Kondo, Jonathan Blanchette, Martin Bouchard

バイアス付きMMSE短時間振幅スペクトル推定法の理論解析およびミュージカルノイズフリー雑音抑圧への拡張 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2013巻 pp.ROMBUNNO.2-1-1~ 1880-7658 2013年 09月 17日

中井駿介, 宮崎亮一, 猿渡洋, 中村哲, 近藤多伸

ブラインド音声抽出システムにおける音声認識率予測のための音声カートシス推定法 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2013巻 pp.ROMBUNNO.2-1-6~ 1880-7658 2013年 09月 17日

平野佑佳, 宮崎亮一, 猿渡洋, 中村哲, 高谷智哉

様々なミュージカルノイズフリー音声強調法における音質評価 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2013巻 pp.ROMBUNNO.2-1-2~ 1880-7658 2013年 09月 17日

宮崎亮一, 猿渡洋, 中村哲, 近藤多伸

Musical Noise Analysis for Bayesian Minimum Mean-Square Error Speech Amplitude Estimators Based on Higher-Order Statistics INTERSPEECH2013 国際会議 口頭発表(一般) Lyon, France 2013年 08月

Hiroshi Saruwatari, Suzumi Kanehara, Ryoichi Miyazaki, Kiyohiro Shikano, Kazunobu Kondo

Evaluation of Musical-Noise-Free Blind Speech Extraction under Nonstationary Noise Environment (応用音響) 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113巻 134号 pp.105~110 0913-5685 2013年 07月 18日

我々は,非定常雑音を含む実環境下において,高いSNRを達成しつつミュージカルノイズを全く発生させないマイクロホンアレーを用いたブラインド音声抽出手法を提案している.本稿では,二種類の実環境雑音を用いて代表的な単一チャネルの音声強調手法,従来のブラインド音声抽出手法と提案手法における比較実験を行う.そして,客観評価実験,主観評価実験より提案法は従来手法より総合的な音質の面で優位であることを示す. 宮崎 亮一, 猿渡 洋, 中村 哲, 鹿野 清宏, 近藤 多伸

非定常雑音環境におけるミュージカルノイズフリーブラインド音声抽出の評価 日本音響学会 聴覚研究会資料 = Proceedings of the auditory research meeting 聴覚研究会資料 = Proceedings of the auditory research meeting 43巻 5号 pp.461~466 1346-1109 2013年 07月 18日

宮崎 亮一, 猿渡 洋, 中村 哲

一般化MMSE振幅スペクトル推定に基づくブラインド音声抽出法のミュージカルノイズ発生量解析 (信号処理) 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113巻 28号 pp.73~78 0913-5685 2013年 05月 16日

本研究では,一般化MMSE振幅スペクトル推定に基づくブラインド音声抽出法のミュージカルノイズ発生量について解析を行う.ブラインド音声抽出の従来手法としてブラインド空間的サブトラクションアレー(BSSA)が提案されている.しかし,BSSAではミュージカルノイズ発生量が多いという問題がある.そこで,本稿ではBSSAのポスト処理部に一般化MMSE振幅スペクトル推定器を導入し,一般化MMSE振幅スペクトル推定器を導入したBSSAのミュージカルノイズ発生量について,理論値とシミュレーション実験により検討を行う. 中井 駿介, 金原 涼美, 宮崎 亮一, 猿渡 洋, 鹿野 清宏

一般化MMSE振幅スペクトル推定に基づくブラインド音声抽出法のミュージカルノイズ発生量解析 (応用音響) 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113巻 27号 pp.73~78 0913-5685 2013年 05月 16日

本研究では,一般化MMSE振幅スペクトル推定に基づくブラインド音声抽出法のミュージカルノイズ発生量について解析を行う.ブラインド音声抽出の従来手法としてブラインド空間的サブトラクションアレー(BSSA)が提案されている.しかし,BSSAではミュージカルノイズ発生量が多いという問題がある.そこで,本稿ではBSSAのポスト処理部に一般化MMSE振幅スペクトル推定器を導入し,一般化MMSE振幅スペクトル推定器を導入したBSSAのミュージカルノイズ発生量について,理論値とシミュレーション実験により検討を行う. 中井 駿介, 金原 涼美, 宮崎 亮一, 猿渡 洋, 鹿野 清宏

一般化MMSE振幅スペクトル推定に基づくブラインド音声抽出法のミュージカルノイズ発生量解析 (音声) 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113巻 29号 pp.73~78 0913-5685 2013年 05月 16日

本研究では,一般化MMSE振幅スペクトル推定に基づくブラインド音声抽出法のミュージカルノイズ発生量について解析を行う.ブラインド音声抽出の従来手法としてブラインド空間的サブトラクションアレー(BSSA)が提案されている.しかし,BSSAではミュージカルノイズ発生量が多いという問題がある.そこで,本稿ではBSSAのポスト処理部に一般化MMSE振幅スペクトル推定器を導入し,一般化MMSE振幅スペクトル推定器を導入したBSSAのミュージカルノイズ発生量について,理論値とシミュレーション実験により検討を行う. 中井 駿介, 金原 涼美, 宮崎 亮一, 猿渡 洋, 鹿野 清宏

一般化MMSE振幅スペクトル推定に基づくブラインド音声抽出法のミュージカルノイズ発生量解析 電子情報通信学会技術研究報告 電子情報通信学会技術研究報告 113巻 29(SP2013 1-30)号 pp.73~78 0913-5685 2013年 05月 09日

中井駿介, 金原涼美, 宮崎亮一, 猿渡洋, 鹿野清宏

ポスタ会議発表の音声アーカイブを目的とした音源分離の高音質化 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2013巻 pp.ROMBUNNO.2-10-3~ 1880-7658 2013年 03月 05日

中井駿介, 大沼侑司, 宮崎亮一, 猿渡洋, 鹿野清宏

ポスタ会議発表マルチモーダルアーカイブ構築のための音声区間検出 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2013巻 pp.ROMBUNNO.1-P-35~ 1880-7658 2013年 03月 05日

大沼侑司, 中井駿介, 宮崎亮一, 猿渡洋, 鹿野清宏

ユーザ動作雑音を含む非可聴つぶやき音声における多チャネル異種センサ統合に基づくブラインド音声抽出の評価 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2013巻 pp.ROMBUNNO.2-10-2~ 1880-7658 2013年 03月 05日

糸井三由希, 宮崎亮一, 戸田智基, 猿渡洋, 鹿野清宏

様々な音声強調法におけるミュージカルノイズ発生量の数理解析の妥当性に関する検討 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2013巻 pp.ROMBUNNO.3-10-15~ 1880-7658 2013年 03月 05日

金原涼美, 猿渡洋, 宮崎亮一, 鹿野清宏, 近藤多伸

非線形信号処理後の信号に対する雑音推定精度の検討 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2013巻 pp.ROMBUNNO.1-P-45~ 1880-7658 2013年 03月 05日

宮崎亮一, 猿渡洋, 鹿野清宏, 近藤多伸

ユーザ動作雑音を含む非可聴つぶやき音声における多チャネル異種センサ統合に基づくブラインド音声抽出 (応用音響) 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告 : 信学技報 電子情報通信学会技術研究報告 : 信学技報 112巻 388号 pp.1~6 0913-5685 2013年 01月 24日

本論文では,多チャネル非可聴つぶやき(Non-Audible Murmur : NAM)における,ブラインド音源分離に基づく雑音抑圧の改善について論じる.近年,発話行為が躊躇されるような静寂な環境においても音声インターフェイスを可能とするため, NAMを用いた音声処理が提案されている.NAMは非常に小さな無声音声信号であり,体表に圧着させるNAMマイクロホンというものによって収録される.そのため,ユーザが動くとNAMマイクロホンの圧着状況が変動し,常に非定常な雑音が混入する.この雑音を抑圧するために, 2つのNAMマイクロホンによって収録されるステレオNAM信号を用いた,ブラインド雑音抑圧法が著者らによって提案されている.本報告では, NAM信号を強調するために,各種の異なるマイクロホンを用いて得られた複数NAM信号を統合し,雑音推定アルゴリズムや後段処理を変えることで,さらなる雑音抑圧性能の向上を達成する. 糸井 三由希, 宮崎 亮一, 戸田 智基, 猿渡 洋

ユーザ動作雑音を含む非可聴つぶやき音声における多チャネル異種センサ統合に基づくブラインド音声抽出 電子情報通信学会技術研究報告 電子情報通信学会技術研究報告 112巻 388(EA2012 119-140)号 pp.1~6 0913-5685 2013年 01月 17日

糸井三由希, 宮崎亮一, 戸田智基, 猿渡洋, 鹿野清宏

Blind Speech Extraction for Non-Audible Murmur Speech with Speaker's Movement Noise IEEE International Symposium on Signal Processing and Information Technology (ISSPIT2012) 国際会議 口頭発表(一般) Ho Chi Minh, Vietnam 2012年 12月

Miyuki Itoi, Ryoichi Miyazaki, Tomoki Toda, Hiroshi Saruwatari, Kiyohiro Shikano

Comparative Study on Various Noise Reduction Methods with Decision-Directed a Priori SNR Estimator via Higher-Order Statistics APSIPA Annual Summit and Conference 2012 国際会議 ポスター発表 Hollywood, USA 2012年 12月

Suzumi Kanehara, Hiroshi Saruwatari, Ryoichi Miyazaki, Kiyohiro Shikano, Kazunobu Kondo

Musical-Noise-Free Speech Enhancement based on Iterative Wiener Filtering IEEE International Symposium on Signal Processing and Information Technology (ISSPIT2012) 国際会議 口頭発表(一般) Ho Chi Minh, Vietnam 2012年 12月

Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano, Kazunobu Kondo

Theoretical Analysis of Musical Noise in Nonlinear Noise Reduction Based on Higher-Order Statistics APSIPA Annual Summit and Conference 2012 国際会議 口頭発表(招待・特別) Hollywood, USA 2012年 12月

Yu Takahashi, Ryoichi Miyazaki, Hiroshi Saruwatari, Kazunobu Kondo

様々な動的雑音推定器に基づくミュージカルノイズフリー雑音抑圧処理の評価 [電子情報通信学会信号処理研究専門委員会] 信号処理シンポジウム講演論文集 信号処理シンポジウム講演論文集 27巻 pp.436~441 1881-4654 2012年 11月 28日

宮崎 亮一, 猿渡 洋, 鹿野 清宏

様々な非線形音声強調法における近似モデルを用いたミュージカルノイズ発生量解析 [電子情報通信学会信号処理研究専門委員会] 信号処理シンポジウム講演論文集 信号処理シンポジウム講演論文集 27巻 pp.430~435 1881-4654 2012年 11月 28日

金原 涼美, 猿渡 洋, 宮崎 亮一

―近年の音響信号処理における数理科学の進展―高次統計量に基づく非線形雑音抑圧処理の数理解析とその応用 日本音響学会誌 日本音響学会誌 68巻 11号 pp.578~583 0369-4232 2012年 11月 01日

高橋祐, 宮崎亮一, 猿渡洋

チャネル選択型ICAに基づく雑音推定を用いたミュージカルノイズフリーブラインド音声強調 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2012巻 pp.ROMBUNNO.3-9-9~ 1880-7658 2012年 09月 11日

宮崎亮一, 猿渡洋, 鹿野清宏, 近藤多伸

判定帰還型推定法に基づく音声強調法におけるミュージカルノイズ発生量の数理解析 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2012巻 pp.ROMBUNNO.2-9-3~ 1880-7658 2012年 09月 11日

金原涼美, 猿渡洋, 宮崎亮一, 鹿野清宏, 近藤多伸

異種センサを用いて収録された非可聴つぶやき音声におけるブラインド音声抽出 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2012巻 pp.ROMBUNNO.3-9-10~ 1880-7658 2012年 09月 11日

糸井三由希, 宮崎亮一, 戸田智基, 猿渡洋, 鹿野清宏

Musical-Noise-Free Blind Speech Extraction using ICA-Based Noise Estimation with Channel Selection International Workshop on Acoustic Signal Enhancement (IWAENC2012) 国際会議 ポスター発表 Aachen, Germany 2012年 09月

Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano, Kazunobu Kondo

Real-Time Semi-Blind Speech Extraction with Motion Tracking on Kinect International Workshop on Acoustic Signal Enhancement (IWAENC2012) 国際会議 ポスター発表 Aachen, Germany 2012年 09月

Yuji Onuma, Noriyoshi Kamado, Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano

Theoretical Analysis of Musical Noise Generation in Noise Reduction Methods with Decision-Directed a Priori SNR Estimator International Workshop on Acoustic Signal Enhancement (IWAENC2012) 国際会議 ポスター発表 Aachen, Germany 2012年 09月

Suzumi Kanehara, Hiroshi Saruwatari, Ryoichi Miyazaki, Kiyohiro Shikano, Kazunobu Kondo

Musical-Noise-Free Blind Speech Extraction using ICA-Based Noise Estimation and Iterative Spectral Subtraction 11th International Conference on Information Science, Signal Processing and their Applications (ISSPA2012) 国際会議 ポスター発表 Montreal, Canada 2012年 07月

Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano, Kazunobu Kondo

ユーザ動作に伴う雑音を含む非可聴つぶやき音声におけるブラインド音声抽出 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. EA, 応用音響 電子情報通信学会技術研究報告. EA, 応用音響 112巻 76号 pp.43~48 0913-5685 2012年 06月 01日

本論文では、多チャネル非可聴つぶやき(Non-Audible Murmur:NAM)における、ブラインド音源分離に基づく雑音抑圧の改善について論じる.発話行為が躊躇されるような静寂な環境においても音声インターフェイスを可能とするため、NAMを用いた音声処理が提案されている.NAMは非常に小さな無声音声信号であり,体表に圧着させるNAMマイクロホンというものによって収録される.そのため,ユーザが動くとNAMマイクロホンの圧着状況が変動し,常に非定常な雑音が混入する.この雑音を抑圧するために,2つのNAMマイクロホンによって収録されるステレオNAM信号を用いた,ブラインド雑音抑圧法が著者らによって提案されている。本報告では,NAM信号を強調するために、雑音推定アルゴリズムや後段処理を変えることで,さらなる雑音抑圧性能の向上を達成する.また,各種の異なるマイクロホンを用いて得られた複数NAM信号の応用可能性性についても評価を行う. 糸井 三由希, 宮崎 亮一, 戸田 智基, 猿渡 洋, 鹿野 清宏

様々な非線形音声強調法におけるミュージカルノイズ発生量の数理指標 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. EA, 応用音響 電子情報通信学会技術研究報告. EA, 応用音響 112巻 76号 pp.67~72 0913-5685 2012年 06月 01日

本稿では,高次統計量に基づくミュージカルノイズ評価尺度を用いて,事前SNRの推定に判定帰還型推定法を用いたいくつかの雑音抑圧手法について,ミュージカルノイズ発生量の理論解析を行った結果を述べる.先行研究において,ミュージカルノイズ評価尺度を用いて,スペクトル減算法におけるミュージカルノイズ発生量の理論解析が行われた.しかし,例えば最小平均二乗誤差規範短時間振幅スペクトル推定法などの高品質な雑音抑圧手法については,この尺度を用いた解析を行うことが出来なかった.これらの手法には事前SNRの推定に判定帰還型推定法を用いているが,判定帰還型推定法には雑音のパワースペクトルについて非線形な無限回の再帰処理が含まれるからである.そこで,本稿では一般化ガウス・ラゲール求積法を用いて効率的に高次統計量の計算を行った.また本稿では,ミュージカルノイズ発生量と音声歪の観点から,判定帰還型推定法のパラメータとして0.98が標準的に用いられている理論的根拠も明らかにした. 金原 涼美, 宮崎 亮一, 猿渡 洋, 鹿野 清宏, 近藤 多伸

音声強調処理における高次統計量の利用 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. EA, 応用音響 電子情報通信学会技術研究報告. EA, 応用音響 112巻 47号 pp.121~126 0913-5685 2012年 05月 17日

本稿では,音声強調信号処理における高次統計量の利用について解説を行う.まず,その基礎数理の説明を通じて,信号処理音の音質評価尺度への応用可能性を論じる.次に,高次統計量の不動点を求めることにより,ミュージカルノイズを一切発生させない雑音抑圧手法が実現できることを示す.最後に,上記理論の発展について論じる. 猿渡 洋, 宮崎 亮一, 鹿野 清宏

音声強調処理における高次統計量の利用 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. SIP, 信号処理 : IEICE technical report 電子情報通信学会技術研究報告. SIP, 信号処理 : IEICE technical report 112巻 48号 pp.121~126 0913-5685 2012年 05月 17日

本稿では,音声強調信号処理における高次統計量の利用について解説を行う.まず,その基礎数理の説明を通じて,信号処理音の音質評価尺度への応用可能性を論じる.次に,高次統計量の不動点を求めることにより,ミュージカルノイズを一切発生させない雑音抑圧手法が実現できることを示す.最後に,上記理論の発展について論じる. 猿渡 洋, 宮崎 亮一, 鹿野 清宏

音声強調処理における高次統計量の利用 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. SP, 音声 電子情報通信学会技術研究報告. SP, 音声 112巻 49号 pp.121~126 0913-5685 2012年 05月 17日

本稿では,音声強調信号処理における高次統計量の利用について解説を行う.まず,その基礎数理の説明を通じて,信号処理音の音質評価尺度への応用可能性を論じる.次に,高次統計量の不動点を求めることにより,ミュージカルノイズを一切発生させない雑音抑圧手法が実現できることを示す.最後に,上記理論の発展について論じる. 猿渡 洋, 宮崎 亮一, 鹿野 清宏

拡散性雑音におけるミュージカルノイズ音声強調のための反復型ブラインド空間的サブトラクションアレー 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. EA, 応用音響 電子情報通信学会技術研究報告. EA, 応用音響 111巻 490号 pp.31~36 0913-5685 2012年 03月 09日

本稿では,非定常な雑音に対応可能なマイクロホンアレーを用いた新たな信号抽出手法を提案する.過去の研究において,ミュージカルノイズがほとんど発生しない最適化された反復型スペクトル減算法(SS)が提案されているが,この手法は定常な雑音のみに有効である.提案法は,独立成分分析(ICA)によるブラインドな動的雑音推定と,最適化された反復型SSによるミュージカルノイズフリー音声強調より構成され,ICAに必要なマルチチャネルの特性を維持しながら,各チャネルに反復型SSが適用される.また,提案法に関して,SSによって非線形に歪んだ信号にICAを適用することの正当性について議論する.客観評価実験と主観評価実験より,提案法は従来の手法より優れていることが明らかになった. 宮崎 亮一, 猿渡 洋, 鹿野 清宏, 近藤 多伸

ポスタ会議発表の音声アーカイブ構築を目的としたブラインド音声抽出と発話区間推定 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2012巻 pp.ROMBUNNO.1-1-17~ 1880-7658 2012年 03月 06日

岡本広大, 宮崎亮一, 猿渡洋, 鹿野清宏

ミュージカルノイズフリー雑音抑圧における音声歪み量の性能評価 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2012巻 pp.ROMBUNNO.3-1-22~ 1880-7658 2012年 03月 06日

宮崎亮一, 猿渡洋, 鹿野清宏, 近藤多伸

Musical-Noise-Free Speech Enhancement: Theory and Evaluation EEE International Conference in Acoustics, Speech and Signal Processing (ICASSP2012) 国際会議 ポスター発表 Kyoto, Japan 2012年 03月

Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano, Kazunobu Kondo

ポスタ会議発表音声アーカイブ構築を目的としたブラインド音声抽出の評価 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. EA, 応用音響 電子情報通信学会技術研究報告. EA, 応用音響 111巻 402号 pp.19~24 0913-5685 2012年 01月 19日

本稿ではポスタ会議発表の音声アーカイブ構築のため,目的話者の音声のみを高品質に抽出する事を目的とした19チャネルマイクロホンアレーを用いた収録システムと,画像情報を用いた目的音抽出によるダイアライゼーションを提案する.音源分離実験では,発表者抽出の場合は4.9dBから6.6dB程度の音声歪みで, 8.9dBから34.0dB程度の雑音抑圧量を,質問者抽出の場合は6.0dBから8.1dB程度の音声歪みで, 4.6dBから10.1dB程度の雑音抑圧量を実現した.また,ダイアライゼーション実験では,発表者の場合は.0.99のF値,質問者の場合は0.88のF値に相当する推定精度を実現した. 岡本 広大, 宮崎 亮一, 猿渡 洋, 鹿野 清宏

実環境におけるミュージカルノイズフリー雑音抑圧の評価 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. EA, 応用音響 電子情報通信学会技術研究報告. EA, 応用音響 111巻 402号 pp.25~30 0913-5685 2012年 01月 19日

本稿では,高いSN比を達成しつつミュージカルノイズが全く発生しない(ミュージカルノイズフリー),非線形雑音抑圧の新たな理論を提案する.ミュージカルノイズが少ない高品質な雑音抑圧を達成するために,反復型スペクトル減算法のような弱い非線形信号処理を繰り返し適用する手法が提案されている.評価実験においてミミュージカルノイズフリー状態を達成する適切なパラメータセットの存在が示されたが,理論的には明らかにされていない.そこで本稿では,ミュージカルノイズフリー状態を達成する内部パラメータセットを,高次統計量に基づく解析によって理論的に明らかにする.そして,雑音スペクトルのカートシスの不動点を見つけることで,ミュージカルノイズブリー状態の再現を可能にした.更に,従来の雑音抑圧手法との比較実験により,提案法の実環境における有効性を明らかにした. 宮崎 亮一, 猿渡 洋, 鹿野 清宏, 近藤 多伸

高次統計量に基づく非線形雑音抑圧処理の数理解析とその応用(<小特集>近年の音響信号処理における数理科学の進展) 一般社団法人 日本音響学会 日本音響学会誌 日本音響学会誌 68巻 11号 pp.578~583 0369-4232 2012年

高橋 祐, 宮崎 亮一, 猿渡 洋

ポスタ会議発表の音声アーカイブ構築を目的としたブラインド音声抽出 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2011巻 pp.ROMBUNNO.2-6-11~ 1880-7658 2011年 09月 13日

岡本広大, 宮崎亮一, 猿渡洋, 鹿野清宏

ミュージカルノイズフリー雑音抑圧理論とその評価 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2011巻 pp.ROMBUNNO.1-4-2~ 1880-7658 2011年 09月 13日

宮崎亮一, 猿渡洋, 井上貴之, 鹿野清宏, 近藤多伸

Theoretical Analysis of Musical Noise and Speech Distortion in Structure-Generalized Parametric Blind Spatial Subtraction Array INTERSPEECH2011 国際会議 口頭発表(一般) Florence, Italy 2011年 08月

Ryoichi Miyazaki, Hiroshi Saruwatari, Kiyohiro Shikano

様々なブラインド空間的サブトラクションアレーにおける音声歪み量の数理尺度 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. EA, 応用音響 電子情報通信学会技術研究報告. EA, 応用音響 111巻 26号 pp.49~54 0913-5685 2011年 05月 05日

本稿では,構造が一般化されたブラインド空間的サブトラクションアレー(BSSA)を提案し,高次統計量によるミュージカルノイズ発生量と音声歪み量の理論解析を導入する.まず,様々なBSSAにおけるミュージカルノイズ発生量と音声歪み量のトレードオフの関係を理論的に証明する.そして,理論解析と実験より,BSSAの構造は使用するアプリケーションによって選択されるべきであることを明らかにする.例えば,人が聞いて好む雑音抑圧処理はチャネルワイズ型のBSSAであり,音声認識に適している雑音抑圧処理は従来のBSSAである. 宮崎 亮一, 猿渡 洋, 鹿野 清宏

様々なブラインド空間的サブトラクションアレーにおける音声歪み量の数理尺度 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. SIP, 信号処理 : IEICE technical report 電子情報通信学会技術研究報告. SIP, 信号処理 : IEICE technical report 111巻 27号 pp.49~54 0913-5685 2011年 05月 05日

本稿では,構造が一般化されたブラインド空間的サブトラクションアレー(BSSA)を提案し,高次統計量によるミュージカルノイズ発生量と音声歪み量の理論解析を導入する.まず,様々なBSSAにおけるミュージカルノイズ発生量と音声歪み量のトレードオフの関係を理論的に証明する.そして,理論解析と実験より,BSSAの構造は使用するアプリケーションによって選択されるべきであることを明らかにする.例えば,人が聞いて好む雑音抑圧処理はチャネルワイズ型のBSSAであり,音声認識に適している雑音抑圧処理は従来のBSSAである. 宮崎 亮一, 猿渡 洋, 鹿野 清宏

様々なブラインド空間的サブトラクションアレーにおける音声歪み量の数理尺度 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. SP, 音声 電子情報通信学会技術研究報告. SP, 音声 111巻 28号 pp.49~54 0913-5685 2011年 05月 05日

本稿では,構造が一般化されたブラインド空間的サブトラクションアレー(BSSA)を提案し,高次統計量によるミュージカルノイズ発生量と音声歪み量の理論解析を導入する.まず,様々なBSSAにおけるミュージカルノイズ発生量と音声歪み量のトレードオフの関係を理論的に証明する.そして,理論解析と実験より,BSSAの構造は使用するアプリケーションによって選択されるべきであることを明らかにする.例えば,人が聞いて好む雑音抑圧処理はチャネルワイズ型のBSSAであり,音声認識に適している雑音抑圧処理は従来のBSSAである. 宮崎 亮一, 猿渡 洋, 鹿野 清宏

Theoretical Analysis of Parametric Blind Spatial Subtraction Array and Its Application to Speech Recognition Performance Prediction Proceedings of Joint Workshop on Hands-free Speech Communication and Microphone Arrays (HSCMA2011) 国際会議 口頭発表(一般) Edinburgh, UK 2011年 05月

Ryoichi Miyazaki, Hiroshi Saruwatari, Ryo Wakisaka, Kiyohiro Shikano, Tomoya Takatani

ブラインド雑音推定に基づく非線形雑音抑圧処理におけるミュージカルノイズ発生量と音声認識率の関係 日本音響学会研究発表会講演論文集(CD-ROM) 日本音響学会研究発表会講演論文集(CD-ROM) 2011巻 pp.ROMBUNNO.1-9-14~ 1880-7658 2011年 03月 02日

宮崎亮一, 井上貴之, 平田将久, 猿渡洋, 鹿野清宏, 高谷智哉

非線形処理におけるミュージカルノイズ発生量と音声認識率の関係 一般社団法人電子情報通信学会 電子情報通信学会技術研究報告. SP, 音声 電子情報通信学会技術研究報告. SP, 音声 110巻 401号 pp.19~24 0913-5685 2011年 01月 20日

本稿では,非線形処理におけるミュージカルノイズ発生量と音声認識率の関係について述べる.近年,音声対話ロボットなどの音声認識を利用したアプリケーションが増加している.従来,音声認識率を事前に予測する尺度として,ケプストラム歪みを用いることが多かった.しかし,ケプストラム歪みの測定には,雑音が混入される前のクリーンな音声が必要となり,実環境での測定は不可能である.そこで,ケプストラム歪みの代わりとなる尺度として,実環境でも測定可能なミュージカルノイズ発生量にあたる雑音部分のカートシス比を導入する. 宮崎 亮一, 井上 貴之, 平田 将久, 猿渡 洋, 鹿野 清宏, 高谷 智哉

Kinectにおけるリアルタイム・ブラインド空間サブトラクションアレーの実装と評価 人工知能学会AIチャレンジ研究会(Web) 人工知能学会AIチャレンジ研究会(Web) 34th巻 pp.B102-8 (WEB ONLY)~ 2011年

大沼侑司, 鎌土記良, 宮崎亮一, 猿渡洋, 鹿野清宏

自律型掃除ロボット「Beauto」を用いた多人数向けロボット工作教室 日本高専学会 高等専門学校の教育と研究 高等専門学校の教育と研究 14巻 3号 pp.9~12 1343-456X 2009年 10月

自律型掃除ロボット「Beauto」を用いて多人数向けロボット教室を行った成果を検証した.参加者全員が基本を学習できるよう時間区切りで説明しながら課題を出し,段階的にプログラム学習を行った.工作教室の参加者と保護者を対象にアンケート調査を行い,いくつかの重要な成果が得られたことを確認した.アンケート結果から,参加者と保護者ともに満足してもらえる内容であり,多人数向け工作教室の有効性を実証できた. 伊藤 隆洋, 荒井 純樹, 伊勢谷 光輝, 柿元 泰, 澤野 堅太, 宮崎 亮一, 坂田 光輝, 金田 忠裕