研究者業績

黒岩 眞吾

クロイワ シンゴ  (Shingo Kuroiwa)

基本情報

所属
千葉大学 大学院工学研究院 教授
学位
博士(電気通信大学大学院電気通信学研究科電子工学専攻)

研究者番号
20333510
J-GLOBAL ID
200901017262764603
researchmap会員ID
1000356498

外部リンク

経歴

 1

論文

 132

MISC

 591
  • 小林 邦嘉, 柘植 覚, 任 福継, 黒岩 眞吾
    日本音響学会研究発表会講演論文集 2003(1) 179-180 2003年3月18日  
  • 中村 哲, 武田 一哉, 黒岩 眞吾, 山田 武志, 北岡 教英, 山本 一公, 西浦 敬信, 藤本 雅清, 水町 光徳
    情報処理学会研究報告音声言語情報処理(SLP) 2003(14) 51-55 2003年2月7日  
    本稿では,2001年10月に音声言語情報処理研究会内に設立した雑音下音声認識の評価に関するワーキンググループの活動状況の報告を行う.このワーキンググループでは,雑音下音声認識の評価のための共通のコーパスの策定、および収録、その評価法の検討を進めている.現在までに行ったデータベース収集、評価系の構築について経過報告を行う.This paper reports current status of the SLP working group establised in October 2001 on the noisy speech recognition. The working group aims to develop standards, common corpus, and noisy speech recognition system in conjunction with Europian ETSI AURORA evaluation projects. In this paper, we report current status of data collection, standard backend recognition system, snd other activities of the working grpop.
  • 柘植 覚, 獅々堀正幹, 黒岩 眞吾, 北 研二
    情報処理学会論文誌 44(1) 59-67 2003年1月15日  
    近年のインターネット技術の発展により,World Wide Web(WWW)を代表とする個人で扱えるオンラインテキストデータの量が増加している.それにともない,莫大なテキストデータ中から必要な情報を検索する機会も増え,情報検索に関する研究への関心が高まっている.情報検索システムとして,検索対象文書と検索質問を多次元ベクトルで表現するベクトル空間モデル(VSM: Vector Space Model)が広く使用されている.VSMを用いた検索システムの精度を改善する手法の1つとして,適合性フィードバック手法(Relevance Feedback)が提案されている.この手法は,VSMを用いた1次検索結果に対し,利用者が適合・不適合の判断を行いその情報をシステムにフィードバックし,再検索を行うことで検索精度を向上させている.本論文では,この利用者からのフィードバック情報を検索対象文書全体の適合・不適合の判別に用いた.判別を行う識別器として,従来手法より,判別の能力が高く,汎化性に優れたサポートベクターマシン(SVM: Support Vector Machine)を用いた.このフィードバック手法をサポートベクターマシンによる適合性フィードバックとして本論文で提案する.日本語テストコレクション(BMIR-J2)を用いた類似文書検索実験において,提案手法は従来手法と比較し,利用者が判断し,システムにフィードバックされる文書数が50の場合,24.0%の検索精度改善を得ることが可能であった.With the rapid growth of online information, e.g., the World Wide Web(WWW), a large collection of full-text documents is available andopportunity for getting a useful piece of information is increased.Information Retrieval (IR) is now becoming one of the most importantissues for handling large text data.Relevance feedback is a technique that improves retrieval performancebased on relevance judgments from the user. Here, we propose therelevance feedback method using Support Vector Machine (SVM).Experiment results on Japanese test collection BMIR-J2 show that theproposed method is useful feedback method comparing to theconventional feedback method. Especially, the proposed method improvedthe performance of IR system.
  • Proceedings of IEEE Automatic speech recognition and understanding workshop (ASRU2003) 619-623 2003年  
  • IEEE International Conference on System, Man & Cybernetics 2003 (SMC2003) 1666-1672 2003年  
  • Proceedings of IEEE International Conference on Natural Language Processing and Knowledge Engineering (NLPKE2003) 368-373 2003年  
  • Proc. of Eurospeech 2003 1769-1772 2003年  
  • Proceedings of 2003 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2003) 1 392-395 2003年  
  • 中村 哲, 武田 一哉, 黒岩 眞吾, 山田 武志, 北岡 教英, 山本 一公, 西浦 敬信, 藤本 雅清, 水町 光徳
    情報処理学会研究報告音声言語情報処理(SLP) 2002(65) 65-69 2002年7月12日  
    本稿では,2001年10月に音声言語情報処理研究会内に設立した雑音下音声認識の評価に関するワーキンググループの活動状況の報告を行う.このワーキンググループでは,雑音下音声認識に於ける評価法,共通のコーパスの策定に加えて,欧州で進められているETSI AURORA雑音下音声認識アルゴリズム開発プロジェクトに合わせたアルゴリズム開発を目指している.This paper reports current status of the SLP working group establised in October 2001 on the noisy speech recognition. The working group aims to develop standards, common corpus, and noisy speech recognition system in conjunction with Europian ETSI AURORA evaluation projects.
  • 柘植 覚, 黒岩 眞吾
    情報処理学会研究報告音声言語情報処理(SLP) 2002(65) 77-84 2002年7月12日  
    携帯電話の発展にともない急激に携帯端末によるワイアレスモバイル環境の普及が進んでいる。一般に携帯端末は非常に小型であるため、携帯端末に付属する入力デバイスによる操作は困難である。この問題を解決する一方法として、音声による携帯端末操作が考えられる。しかし、携帯端末内のメモリやCPUなどのハードウェアは、中・大語彙の音声認識処理の全てを行うまでには至っていない。そこで、音響分析、特徴パラメータの圧縮を携帯端末内で行いサーバに伝送し、サーバで特徴パラメータの復元、音声認識を行う分散音声認識 (DSR: Distributed SpeechRecognition)が提案された。分散音声認識では、携帯端末とサーバ間で伝送するデータ形式等を共通化する必要があり、現在、欧州電気通信標準化機構 (ETSI: the European Telecommunications StandardsInstitute)において、標準化が進められている。本稿では、ETSI標準分散音声認識フロントエンドを用い日本語連続音声認識実験を行った結果を報告する。同フロントエンドは、特徴パラメータの圧縮にベクトル量子化を用いるため、入力系の周波数特性の差異はベクトル量子化歪みを増加させ、認識精度を低下させる原因となる可能性が高い。そこで、本稿では、入力系の周波数特性の差異によるベクトル量子化歪みを減少させる手法を提案する。音声認識実験結果より、提案手法は周波数特性の差異による認識精度の劣化を低減することが可能であった。This paper reports an evaluation of European Telecommunications Standards Institute (ETSI) standard Distributed Speech Recognition (DSR) front-end through continuous word recognition on a Japanese speech corpus and proposes a method, the Bias Removal Method (BRM), that reduces the distortion between feature vector and VQ codebook. Experimental results show that using non-quantized features in acoustic model training procedure can improve the recognition performance of DSR fornt-end features and that the proposed method can improve recognition performances of DSR front-end feature.
  • 柘植 覚, 黒岩 眞吾, 任 福継, 北 研二
    日本音響学会研究発表会講演論文集 2002(1) 171-172 2002年3月18日  
  • 黒岩眞吾, 柘植 覚
    2002信学総大, March 276-277 2002年  
  • Ren Fuji, Kuroiwa Shingo
    Bulletin of Faculty of Engineering 47 21-34 2002年  
  • Proceedings of IEEE International Conference on SYSTEMS, MAN, AND CYBERNETICS 2002 (SMC2002) TA1E5 2002年  
  • Proceedings of IEEE International Conference on SYSTEMS, MAN, AND CYBERNETICS 2002 (SMC2002) TA1E3 2002年  
  • 7th International Conference on Spoken Language Processing (ICSLP2002) 2221-2224 2002年  
  • ZHAO X.
    International Conference on Information-2002, Series of Information & Management Sciences 3 16-21 2002年  
  • International Conference on Information-2002, Series of Information & Management Sciences 3 22-26 2002年  
  • International Conference on Information-2002, Series of Information & Management Sciences 3 107-112 2002年  
  • International Conference on Information-2002, Series of Information & Management Sciences 3 366-371 2002年  
  • International Conference on Information-2002, Series of Information & Management Sciences 3 44-48 2002年  
  • International Conference on Information-2002, Series of Information & Management Sciences 3 372-376 2002年  
  • nternational Conference on Information-2002, Series of Information & Management Sciences 3 172-177 2002年  
  • International Journal of Asian Information-Science-Life 1(1) 21-34 2002年  
  • 柘植 覚, 黒岩 眞吾, 任 福継, 北 研二
    日本音響学会研究発表会講演論文集 2001(2) 177-178 2001年10月1日  
  • 黒岩 眞吾, 柘植 覚, 田仁 宏典, Tai Xiaoying, 獅々堀正幹, 北 研二
    情報処理学会研究報告自然言語処理(NL) 2001(69) 61-66 2001年7月16日  
    ベクトル空間モデル(VSM)は情報検索における代表的な検索モデルである.同モデルでは文書が単語の出現頻度に基づくベクトルで表現されるため,そのベクトル空間は一般にスパースかつ高次元となりメモリや検索時間の増大を招くとともに,文書中に含まれる無意味な単語がノイズ的な影響を及ぼし検索精度を低下させるという問題を生じる.これに対し特異値分解(SVD)を用い次元数を削減した空間で類似度を計算する潜在的意味インデキシング(Latent Semantic Indexing; LSI)が提案され,その効果が報告されている.本稿ではSVDに比べより少ない演算量で近似的に主成分分析を行うことが可能なSimple Principal Component Analysis(SPCA)を次元削減に適用する.MEDLINEコレクションを用いた検索実験を行った結果,SVDと同等以上の検索性能をSPCAにより達成した.The Vector Space Model (VSM) is a popular information retrieval model, which represents a document collection by a term-by-document matrix. Since term-by-document matrices are usually high-dimensional and sparse, they are susceptible to noise and are also difficult to capture the underlying semantic structure. Additionally, computing resources necessary for the storage and processing of such data is enormous. Dimensionality reduction is a way to overcome these problems. Principal Component Analysis (PCA) and Singular Value Decomposition (SVD) are popular techniques for dimensionality reduction based on matrix decomposition. However, such methods consume a large amount of computation resources. In the work described here, we use Simple Principal Component Analysis (SPCA), which is a data-oriented fast method, for dimensionality reduction of the vector space model. Experiments based on the MEDLINE collection showed that SPCA achieved significant improvement compared to the conventional vector space model.
  • 黒岩 眞吾, 柘植 覚, 田仁 宏典, TAI Xiaoying, 獅々堀 正幹, 北 研二
    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 101(189) 61-66 2001年7月9日  
    ベクトル空間モデル(VSM)は情報検索における代表的な検索モデルである.同モデルでは文書が単語の出現頻度に基づくベクトルで表現されるため, そのベクトル空間は一般にスパースかつ高次元となりメモリや検索時間の増大を招くとともに, 文書中に含まれる無意味な単語がノイズ的な影響を及ぼし検索精度を低下させるという問題を生じる.これに対し特異値分解(SVD)を用い次元数を削減した空間で類似度を計算する潜在的意味インデキシング(Latent Semantic Indexing; LSI)が提案され, その効果が報告されている.本稿ではSVDに比べより少ない演算量で近似的に主成分分析を行うことが可能なSimple Principal Component Analysis(SPCA)を次元削減に適用する.MEDLINEコレクションを用いた検索実験を行った結果, SVDと同等以上の検索性能をSPCAにより達成した.
  • 黒岩 眞吾, 内藤 正樹, 中村 誠, 酒寄 信一, 武笠 貴史
    電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理 84(6) 859-867 2001年6月1日  
    本論文では, 国際電話サービスの一つであるホームカントリーダイレクトに入呼する海外からのいたずら電話を音声認識により自動的に排除するシステムについて論ずる.ホームカントリーダイレクトは海外旅行者らが母国の国際局オペレータに直接アクセスし国際電話サービスを母国語のみで利用できるサービス形態である.同サービスではオペレータを呼び出すための料金を必要としないため, 現地の子供らによるいたずら電話が問題となっていた.そこで, 利用者に特定の単語を発声するように日本語のアナウンスで指示し, その単語が正しく復唱されれば正当な利用者と判断し, さもなければいたずらと判断する「いたずら電話自動排除システム」を開発した.同システムを商用サービスに適用したところ, 94.7%のいたずら電話を排除することができた.このとき正当な利用者を誤排除したのは0.8%である.誤排除された正当な利用者も, 何度か電話を掛け直すことで最終的には正しい単語を復唱して接続に至っていることを確認している.同システムは1996年3月よりKDD国際電話センターで運用されており1日約10, 000呼のいたずら電話を排除している.
  • Proc. of Natural Language Processing and Knowledge Engineering Mini Symposium, IEEE SYSTEMS, MAN, AND CYBERNETICS 2001 (NLPKE) 960-965 2001年  
  • Proc. of Natural Language Processing and Knowledge Engineering Mini Symposium, IEEE Systems, Man, And Cybernetics 2001 (NLPKE) 3 1699-1704 2001年  
  • Proc. of Knowledge-Based Intelligent Information Engineering Systems & Allied Technologies (KES) 69 367-371 2001年  
  • Proc. of Knowledge-Based Intelligent Information Engineering Systems & Allied Technologies (KES) 69 362-366 2001年  
  • Proc. of Eurospeech 2001 857-860 2001年  
  • Proc. of 19th International Conference on Computer Processing of Oriental Languages (ICCPOL) 35-40 2001年  
  • Proceedinngs of 26th International Conference on Acoustics, Speech and Signal Processing (ICASSP2001) 1 493-496 2001年  
  • 加藤 恒夫, 黒岩 眞吾, 清水 徹, 樋口 宜男
    電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理 83(11) 2128-2136 2000年11月25日  
    Tree-basedクラスタリングは, 音素コンテクストを分割条件としてコンテクスト依存モデルの集合に対してクラスタリングを行い, HMM状態の共有化を図る有効な手法である.従来の報告では, 計算量の増大を抑えるために対象が単一分布HMMに限られていた.しかし, 単一分布HMMでは音響的特徴を表現するのに不十分であるため, 必ずしも適切なトポロジー(HMM状態の共有関係)が得られていないと考えられる.また所望の混合数の状態共有モデルを獲得するためには, tree-basedクラスタリングの後, 混合数を倍増する操作と連結学習を繰り返す必要があり, 学習に長時間を要するという問題点があった.そこで本論文では, 単一分布HMMを対象としたtree-basedクラスタリングアルゴリズムを混合分布HMMを対象にクラスタリングが行えるように拡張する手法を提案する.本手法により単一分布HMMを扱う従来手法に比べて学習時間が1/3程度に短縮され, 音節タイプライタによる認識実験及び連続単語認識実験において認識率が1〜2ポイント改善された.
  • 内部 利明, 黒岩 眞吾, 樋口 宜男
    電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理 83(11) 2291-2299 2000年11月25日  
    話者照合を行う場合, 本人か否かを判断するためのしきい値を事前に設定する必要があるが, 話者により照合時のゆう度にばらつきが生じるため, 最適なしきい値を事前設定するのは困難であった.このゆう度がばらつく原因として, 話者モデルを学習する際に話者に適応する度合(話者適応度)が各話者により異なることが一因と考えられる.そこで隠れマルコフモデル(Hidden Markov Model;HMM)による話者照合において, 話者モデルを不特定話者モデルからの適応学習する際に, 適応によって得られるゆう度の増分を話者適応度として用い, しきい値を話者適応度の関数として表すことで話者ごとに事前にしきい値を設定する方法を提案する.評価実験の結果, この話者適応度としきい値の関係が学習データ数によらずに安定していることを確認した.更に提案手法により照合誤り率を30%削減することができた.
  • 黒岩 眞吾, 加藤 恒夫, 内藤 正樹, 清水 徹, 樋口 宜男
    電子情報通信学会ソサイエティ大会講演論文集 2000 282-282 2000年9月7日  
  • 加藤 恒夫, 黒岩 眞吾, 清水 徹, 樋口 宜男
    電子情報通信学会技術研究報告. SP, 音声 100(136) 1-8 2000年6月15日  
    話者クラスタリングは音響的に近い話者集合を作成する方法であり, 話者集合毎に音響モデルを学習することで特定の話者集合にチューニングされたモデルが得られる.従来の報告では少ない話者数(数十名から数百名)の音声を学習データとして用いているが, 多数話者の音声を学習データに用いれば, 1話者クラスタあたりのデータ量が増加しモデルパラメータの推定精度が向上すること, 任意の話者に近い話者集合の音響モデルを認識に利用できることにより認識性能の改善が期待できる.本稿では, 1, 000名規模の電話音声データベースを用いで話者クラスタリングを行い, 学習データの話者数の増加に伴い認識率が上昇することを確認した.また, 話者集合の作成が理想的に行われた場合の認識率を求めることを目的として, 従来の尤度に基づく方法に替えて, 認識対象の話者に対して高い認識率を与える話者のデータからモデルを学習したところ, 不特定話者モデルと特定話者モデルの性能差の約60%を改善可能であることがわかった.
  • 清水 徹, 黒岩 眞吾, 河井 恒, 内部 利明, 加藤 恒夫, 樋口 宜男
    電子情報通信学会総合大会講演論文集 2000(1) 190-190 2000年3月7日  
  • 黒岩 眞吾, 加藤 恒夫, 内部 利明, 河井 恒, 清水 徹, 樋口 宜男
    電子情報通信学会総合大会講演論文集 2000(1) 190-190 2000年3月7日  
  • 内部 利明, 黒岩 眞吾, 樋口 宜男
    電子情報通信学会総合大会講演論文集 2000(1) 195-195 2000年3月7日  
  • 河井 恒, 黒岩 眞吾, 清水 徹, 樋口 宜男, 鈴木 信雄, 大野 晃生
    電子情報通信学会総合大会講演論文集 2000(1) 197-197 2000年3月7日  

講演・口頭発表等

 30

Works(作品等)

 5

共同研究・競争的資金等の研究課題

 17