研究者業績

堀内 靖雄

ホリウチ ヤスオ  (Yasuo Horiuchi)

基本情報

所属
千葉大学 大学院情報学研究院 准教授
学位
博士(工学)(1995年3月 東京工業大学)

J-GLOBAL ID
200901021029331583
researchmap会員ID
1000191929

主要な論文

 22

MISC

 559
  • 電子情報通信学会技術研究報告. SP, 音声 97(338) 17-22 1997年  
  • 土屋俊, 鈴木裕之, 小磯花絵, 堀内靖雄
    音声・言語・概念の統合的処理による対話の理解と生成に関する研究 平成5-7年度 487-494 1997年  
  • 藤原敦史, 渡辺実, 岡本修一, 堀内靖雄, 市川あきら
    ヒューマンインタフェースシンポジウム論文集 13th 643-648 1997年  
  • 市川き, 堀内靖雄, 小磯花絵, 井宮淳
    音声・言語・概念の統合的処理による対話の理解と生成に関する研究 平成5-7年度 495-504 1997年  
  • 佐々木 聡, 神田 祐和, 堀内 靖雄, 市川 熹
    情報処理学会研究報告音声言語情報処理(SLP) 1996(104) 1-6 1996年10月25日  
    The prosody seems to play important roles for the understanding of spontaneous spoken dialogue. It was reported that the pattern of prosody on the end of utterance fragment is available for dialogue control. But so far the pattern was infered subjectively. In this paper we represent the pattern of prosody as codes sequence to infer the pattern objectively. First we transform the pattern of prosody into approximate lines. Then we code them by Vector quantization of inclination of approximate line. Using this codes sequence of prosody we can infer the dialogue control type with about 70% accuracy. And we reached the conclusion that it is sufficient to use code book size 9 or 11 in Vector quantization. In the latter part of this paper we examine about automation of all process that are auto-labeling approximation and classification.The prosody seems to play important roles for the understanding of spontaneous spoken dialogue. It was reported that the pattern of prosody on the end of utterance fragment is available for dialogue control. But so far, the pattern was infered subjectively. In this paper, we represent the pattern of prosody as codes sequence to infer the pattern objectively. First we transform the pattern of prosody into approximate lines. Then we code them by Vector quantization of inclination of approximate line. Using this codes sequence of prosody, we can infer the dialogue control type with about 70% accuracy. And we reached the conclusion that it is sufficient to use code book size 9 or 11 in Vector quantization. In the latter part of this paper, we examine about automation of all process that are auto-labeling, approximation and classification.
  • 佐々木 聡, 堀内 靖雄, 市川 熹
    日本音響学会研究発表会講演論文集 1996(2) 9-10 1996年9月1日  
  • 劉 金旗, 堀内 靖雄, 井宮 淳, 市川 熹
    日本音響学会研究発表会講演論文集 1996(2) 53-54 1996年9月1日  
  • 山本 剛, 清水 詠行, 堀内 靖雄, 市川 熹
    日本音響学会研究発表会講演論文集 1996(2) 175-176 1996年9月1日  
  • 神田祐和, 堀内靖雄, 小磯花絵, 市川あきら
    人工知能学会言語・音声理解と対話処理研究会資料 14th 55-62 1996年6月  
  • 小磯花絵, 堀内靖雄, 土屋俊, 市川あきら
    人工知能学会全国大会論文集 10th 407-410 1996年6月  
  • 小磯花絵, 堀内靖雄, 土屋俊, 市川あきら
    人工知能学会言語・音声理解と対話処理研究会資料 14th 47-54 1996年6月  
  • 若狭哲史, 山本剛, 堀内靖雄, 市川あきら
    人工知能学会全国大会論文集 10th 445-448 1996年6月  
  • 堀内靖雄, 三井卓, 井宮淳, 市川あきら
    情報処理学会研究報告 96(53(MUS-15)) 21-26 1996年5月25日  
    本論文では人間二人の演奏を収録、分析することにより、人間がリアルタイムで協調して演奏を行なう動作について考察する。演奏者はお互いに相手の音しか聞こえない条件でアンサンブル演奏を行ない、その演奏が収録された。リハーサル前後の演奏(初合わせの演奏と十分なリハーサル後の演奏)における時間的なタイミングのずれやテンポの変化について分析を行なった。結果として、リハーサルの前に比べて、リハーサル後の演奏の方がずれが減少した。また、収録したテープを演奏者に聞かせ、ずれを指摘させることにより、100[ms]程度以内のずれならば、ずれとして指摘されず、またフレーズの頭のずれに対しては敏感であるということが観察された。Performances by two players were recorded under the condition where they can't see their partner each other, Analysing the performances, the total of time lag between two players performance was reduced after some rehearsal. Then players were asked to point out the part of the score where they had time lag. The results are (1) the time lag within 100[ms] were not perceived as time lag and (2) they were sensitive to the head of a phrase so that they could point out the time lag within 100[ms].
  • 片寄 晴弘, 後藤 真孝, 堀内 靖雄, 松島 俊明, 村尾 忠廣, 志村 哲, 莱 孝之, 平田 圭二
    情報処理学会研究報告. MUS,[音楽情報科学] 15 91-93 1996年5月25日  
  • 堀内 靖雄
    情報処理学会研究報告. MUS,[音楽情報科学] 15 96-96 1996年5月25日  
  • 小磯 花絵, 堀内 靖雄, 土屋 俊, 市川 熹
    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 95(600) 25-30 1996年3月21日  
    本稿では, 発話の継続/終了に関与する情報として, 発話断片末の語彙, ピッチパターン, パワーパターンに着目して, その相関を調ぺた. この分析を利用し, 発話断片末の語彙, ピッチパターン, パワーパターンの出現確率を線型結合することによって, 発話の継続/終了を予測するモデルを提案した. 出現確率の分析に用いた対話データと同一のデータを対象に評価を行ったところ, 発話の継続では96.2%を, 発話の終了では96%の推定精度が得られた.
  • 市川 熹, 佐藤 伸二, 清水 詠行, 堀内 靖雄, 井宮 淳
    日本音響学会研究発表会講演論文集 1996(1) 169-170 1996年3月1日  
  • 堀内 靖雄, 小磯 花絵, 土屋 俊, 市川 熹
    情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告 65(21(HI-65 SLP-10)) 45-50 1996年2月29日  
    千葉大学地図課題対話コーパス中の各発話の最後の部分の統語的・韻律的特徴を次発話者の予測の観点から分析し、以下の結果を得た。(1)発話未にくる、いくつかの品詞は後続発話の前の無音区間とは無関係に話者交替と高い相関がある、(2)ある特有の表現は、発話末を予測させるシグナルを持つ、(3)ある種の韻律的特徴をもつ助詞は話者交替に相関がある、(4)山型ピッチパターンは話者交替を伝える、(5)文脈情報に関与する、ある種の現象は今後の課題である、(6)ラッチング発話を分析することにより、聞き手は聞きながら、話し手の発話進行を予測する。
  • 堀内 靖雄, 小磯 花絵, 土屋 俊, 市川 熹
    情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告 65(21) 45-50 1996年2月29日  
    千葉大学地図課題対話コーパス中の各発話の最後の部分の統語的・韻律的特徴を次発話者の予測の観点から分析し、以下の結果を得た。(1)発話未にくる、いくつかの品詞は後続発話の前の無音区間とは無関係に話者交替と高い相関がある、(2)ある特有の表現は、発話末を予測させるシグナルを持つ、(3)ある種の韻律的特徴をもつ助詞は話者交替に相関がある、(4)山型ピッチパターンは話者交替を伝える、(5)文脈情報に関与する、ある種の現象は今後の課題である、(6)ラッチング発話を分析することにより、聞き手は聞きながら、話し手の発話進行を予測する。
  • 小磯花絵, 堀内靖雄, 佐々木聡, 吉野文, 仲真紀子, 石崎雅人, 岡田美智男, 鈴木浩之, 中野有紀子
    人工知能学会言語・音声理解と対話処理研究会資料 13th 23-30 1996年2月  
  • Akira Ichikawa, Atsushi Imiya, Nagayuki Shimizu, Yasuo Horiuchi
    Journal of the Acoustical Society of America 100(4) 2823 1996年  
    New methods are proposed by which the sentence structure of utterances can be estimated from the prosody under real‐time conditions. The conventional Hough transform algorithm is modified so that it will be able to extract approximated straight lines of pitch patterns in real time. The sensitivity of the approximation can be established at will. So, parallel transform processes with different sensitivities can give multilevel components of an utterance structure and can make a tree in real time. The tree is not exactly a grammatical one, but rather a psychological one or one of the speaker’s intentions. Using this structure, a sentence tree matching algorithm is developed to recognize the sentences. The trees are transformed to regular trees by adding dummy nodes to express trees as lists, and the editing distance of the tree is computed recursively by a list‐matching technique. Each of the extracted lines of fine sensitivity are classified into codes by vector quantization. Speaker’s intention states or dialogue control information in the conversational speech will be related to certain sequences of the codes. One hundred and twenty‐eight spontaneous conversations (total length is about 21 h) were collected from 64 subjects. The performance of the proposed methods was checked by the CORPUS. © 1996, Acoustical Society of America. All rights reserved.
  • 高橋明, 堀内靖雄, 井宮淳, 市川あきら
    ヒューマンインタフェースシンポジウム論文集 12th 483-488 1996年  
  • 小磯花絵, 堀内靖雄, 土屋俊, 市川あきら
    人工知能学会合同研究会AIシンポジウム資料 (9501) 9-16 1995年12月  
  • 堀内 靖雄, 藤井 敦, 田中 穂積, Yasuo Horiuchi, Atsushi Fujii, Hozumi Tanaka, 東京工業大学理工学研究科情報工学専攻, 現, 千葉大学工学部情報工学科, 東京工業大学情報理工学研究科計算工学専攻, 東京工業大学情報理工学研究科計算工学専攻, Department of Computer, Science Tokyo, Institute of Technology, Present address) Department of Information, Computer Sciences Chiba University, Department of Computer, Science Tokyo, Institute of Technology, Department of Computer, Science Tokyo, Institute of Technology
    コンピュータソフトウェア = Computer software 12(5) 465-473 1995年9月18日  
    本論文では「複数の人間と協調する演奏システム」について述べる.計算機が複数の人間と協調して自然なアンサンブル演奏を行なうためには,すべての演奏者の演奏を考慮してシステム自身のテンポを制御する必要がある.しかしメンバー全員の演奏をすべて等しく考慮するよりは,システムはアンサンブルで重要な演奏者ほど,良く合わせる方が良い.そこで本論文ではまず,アンサンブルにおける各演奏者の重要さを表わす尺度として「独立度」の考えを提案し,その意味付けと設定方法について述べる.次に独立度に応じてシステムの演奏を制御する手法として「アンサンブル時間」の考えを提案する.実際の演奏において,システムはアンサンブルをリードしている演奏者(独立度の高い演奏者)ほど良くテンポを合わせ,またシステムがアンサンブルの中心となるような(システムの独立度が高い)状況では自主的で表情豊かな演奏を行なうことができる.実験的なシステムにより,独立度の変化に応じて人間の演奏者に対する追従法の変化が確認された.
  • 堀内 靖雄, 奥井 学, 鈴木 泰山, 田中 穂積
    全国大会講演論文集 50 367-368 1995年3月15日  
    伴奏システムとはコンピュータが人間の独奏者の演奏にテンポなどを合わせて伴奏を行なうシステムであり、すでに多くの研究が行なわれている。しかし従来の伴奏システムのほとんどは基本的に初見視奏であり、同じ独奏者と何度演奏を繰り返したとしても過去の経験を生かして、その独奏者に適応した伴奏を行なうことができなかった。本論文では伴奏システムを独奏者に適応させるための手法として、二つのフェーズによる漸進的リハーサルについて述べる。
  • 堀内 靖雄, 田中 穂積, Yasuo Horiuchi, Hozumi Tanaka, Dept. of Computer Science Faculty of Eng. Tokyo Institute of Technology, Dept. of Computer Science Faculty of Eng. Tokyo Institute of Technology
    人工知能学会誌 10(1) 72-79 1995年  
    In this paper, we introduce a new accompaniment system which takes independence from the soloist into consideration. In order to make a natural-sounding ensemble, we allow our system to change its independence dynamically from the soloist according to the musical situation. We introduce three new techniques into our accompaniment system. "The performance plan" allows the system to perform with expression as a human player would. "The independence rate" corresponds to how independently the system should perform from the soloist. "The time of the ensemble" provides information to enable the system to correct its tempo according to the independence rate. In order to evaluate the system, we carried out a listening experiment where the subjects listened to three versions of the same musical piece. The first was accompanied by a real human being, while the other two were computer-accompanied, where the first system simulated past researches which lacked the techniques mentioned above, while the second incorporated them. The results of the experiment show that our system which incorporated the three techniques sounds better than the system based upon past researches, and that it even sounds as good as a human accompanist.
  • コンピュータソフトウェア 12(5) 465-473 1995年  
  • 堀内 靖雄, 藤井 敦, 田中 穂積
    コンピュータ ソフトウェア 12(5) 5_465-5_473 1995年  
    <p>本論文では「複数の人間と協調する演奏システム」について述べる.計算機が複数の人間と協調して自然なアンサンブル演奏を行なうためには,すべての演奏者の演奏を考慮してシステム自身のテンポを制御する必要がある.しかしメンバー全員の演奏をすべて等しく考慮するよりは,システムはアンサンブルで重要な演奏者ほど,良く合わせる方が良い.そこで本論文ではまず,アンサンブルにおける各演奏者の重要さを表わす尺度として「独立度」の考えを提案し,その意味付けと設定方法について述べる.次に独立度に応じてシステムの演奏を制御する手法として「アンサンブル時間」の考えを提案する.実際の演奏において,システムはアンサンブルをリードしている演奏者(独立度の高い演奏者)ほど良くテンポを合わせ,またシステムがアンサンブルの中心となるような(システムの独立度が高い)状況では自主的で表情豊かな演奏を行なうことができる.実験的なシステムにより,独立度の変化に応じて人間の演奏者に対する追従法の変化が確認された.</p>
  • 堀内 靖雄, 田中 穂積, Yasuo Horiuchi, Hozumi Tanaka
    人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 10(1) 72-79 1995年1月1日  
    In this paper, we introduce a new accompaniment system which takes independence from the soloist into consideration. In order to make a natural-sounding ensemble, we allow our system to change its independence dynamically from the soloist according to the musical situation. We introduce three new techniques into our accompaniment system. "The performance plan" allows the system to perform with expression as a human player would. "The independence rate" corresponds to how independently the system should perform from the soloist. "The time of the ensemble" provides information to enable the system to correct its tempo according to the independence rate. In order to evaluate the system, we carried out a listening experiment where the subjects listened to three versions of the same musical piece. The first was accompanied by a real human being, while the other two were computer-accompanied, where the first system simulated past researches which lacked the techniques mentioned above, while the second incorporated them. The results of the experiment show that our system which incorporated the three techniques sounds better than the system based upon past researches, and that it even sounds as good as a human accompanist.
  • 堀内靖雄, 奥井学, 鈴木泰山, 田中穂積
    情報処理学会研究報告 94(103(MUS-8)) 51-56 1994年11月19日  
    この論文で我々は伴奏システムのためのリハーサルについて述べる。伴奏システムとは人間の独奏者の演奏にテンポなどを合わせて、その伴奏を行なうシステムであるが、同じ曲でも独奏者ごとに異なる演奏をするので、システムを独奏者ごとに適応させる必要がある。Vercoeは本番の演奏前に何回かリハーサルを行なう方法を提案しているが、その方法では独奏者の演奏の癖を認識するまで数多くのリハーサルを必要とするばかりでなく、人間の独奏者が毎回同じ演奏を繰り返すかどうかという点に関しては疑問が残る。また、独奏者と伴奏システムとの意志伝達の手段が演奏しかないため、独奏者の意図を伴奏システムに伝えることが困難であった。このような問題点を解決するため、我々は二つのフェーズからなる漸進的なリハーサルを提案する。その一つのフェーズは「演奏フェーズ」で、実際に独奏者と演奏を行なって、その癖をシステムが認識するフェーズである。もう一つは「コミュニケーション・フェーズ」で、システムが人間の独奏者とGUIなどを用いて対話を行なうことにより、より直接的に独奏者の意図を認識するフェーズである。これら二つのフェーズのリハーサルを何回か繰り返すことにより、本番の演奏に向け、伴奏システムを漸進的に独奏者に適応させることを目的とする。The general problem for an accompaniment system is that different soloists perform a same piece differently, so the system has to adapt to different soloists. In order to realize such an adaptation, we introduce two phases of rehearsal: (1) "performance phase" where the system performs with the soloist to obtain the soloist's way of performance, (2) "communication phase" where the system communicates with the soloist through GUI etc. to understand the soloist's intention of performance more directly. These two phases of rehearsal are repeated several times to improve the performance on the concert stage.
  • 堀内 靖雄, 橋本 周司
    情報処理 35(9) 815-821 1994年9月15日  
  • 堀内靖雄
    インタラクティブシステムとソフトウェア 115-123 1994年  
  • 堀内靖雄
    インタラクティブシステムとソフトウェア 115-123 1994年  
  • 情報処理 35(9) 815-821 1994年  
  • 柏野 邦夫, 堀内 靖雄
    情報処理学会研究報告. [音楽情報科学] 93(93) 1-8 1993年10月23日  
    コンピュータ音楽国際会議は,コンピュータ音楽と音楽情報処理に関する国際会議であり,1974年以来毎年開催されている.本年は,9月10日から9月15日まで,早稲田大学国際会議場などを会場として開催された.会議19年の歴史の中で初めての日本での開催であったが,内外から400名余りの参加者を得て,盛況のうちに幕を閉じた.この会議は,論文セッションと音楽セッションの2つを大きな柱としている.本稿では,このうち論文セッションについて,参加者の2人が報告を行う.
  • 藤井 敦, 堀内 靖雄, 田中 穂積
    人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI 7 567-570 1993年7月20日  
  • 堀内 靖雄, スパワリー クリッサダー, 田中 穂積
    全国大会講演論文集 44 405-406 1992年2月24日  
    自動伴奏システムとは独奏者の演奏をリアルタイムで追跡し、その演奏に追従して伴奏パートを演奏するシステムである。従来の自動伴奏システムの研究では、独奏者の演奏を追跡することに主眼がおかれていたため、実際に出力される伴奏パートの演奏の質はあまり考慮されていなかった。また伴奏は常に独奏者の演奏に追従して行なわれるため独奏者駆動型の伴奏となり、不自然な演奏になることが多かった。そこで本研究では、これらの問題点を改善し、アンサンブルの質の向上を目指すために、伴奏者の自主性を自動伴奏システムに独奏者と伴奏者のテンポ感を導入し、両者のテンポ感の相互作用に基づいて伴奏パートの演奏テンポを変化させ、自然な伴奏を行なえるようにした。次に独奏者と伴奏者との依存関係を用いて伴奏を制御することにより、独奏者の演奏に影響され過ぎて不自然な演奏になることを避け、システムが自主的な演奏を行なえるようにした。
  • 堀内 靖雄, 伊藤 克亘, 田中 穂積
    全国大会講演論文集 40 325-326 1990年3月14日  
    自然言語を構文解析する際に、すべての単語が辞書に登録されていると一般には仮定できない。構文解析システムは、入力文が未定義語を含む場合にも失敗しないで、ある文字列が未定義語と仮定して構文的に妥当であるならば、そういった可能性も出力すべきである。日本語は分かち書きされていないので、未定義語の抽出時に多くの可能性が生じるが、その中で構文的に受容可能な未定義語はすべて抽出できることが望ましく、それらの候補の絞り込みは意味解析などのより上位の処理に任せればよいと思われる。[大場89]は多段階に構文解析することにより受容可能なすべての未定義語を抽出しているが、一部の文字列を何回も解析するため効率が悪い。本研究では拡張LR構文解析アルゴリズムを用いることにより、入力文を左から右へ読み進みながら決定的に解析し、一度の構文解析で受容可能な未定義語をすべて抽出する方法を提案する。しかし、どんな文字列でも未定義語の可能性があるとしてしまうと、指数関数的に処理量が増えてしまう。本研究では、形態素解析と構文解析を同時に行ない、構文解析時の予測によって受容不可能な候補を刈り込み、解析の候補を絞り込んでいる。また複数のプロセスで同じ処理をしないようにすることによって処理量の増大を抑制している。本研究では処理量を減らすために、未定義語の品詞は名詞であると仮定する。また日本語の入力形式には、漢字、平仮名、ローマ字等様々なものがある。本システムでは、将来音声認識システムと結合することも考慮に入れ、ローマ字列を入力とする。ただし構文解析前に入力ローマ字列は、「かっぱ」[ka,Q,pa]のように仮名(音節)に対応したシンボル列に変換される。

共同研究・競争的資金等の研究課題

 28