研究者業績

堀内 靖雄

ホリウチ ヤスオ  (Yasuo Horiuchi)

基本情報

所属
千葉大学 大学院情報学研究院 准教授
学位
博士(工学)(1995年3月 東京工業大学)

J-GLOBAL ID
200901021029331583
researchmap会員ID
1000191929

主要な論文

 22

MISC

 559
  • 平山 望武, 堀内 靖雄, 市川 熹
    ヒューマンインタフェース学会研究報告集 : human interface 1(5) 17-22 1999年12月17日  
  • 長友 幸生, 堀内 靖雄, 市川 熹
    ヒューマンインタフェース学会研究報告集 : human interface 1(5) 59-64 1999年12月17日  
  • 堀内靖雄
    人工知能学会言語・音声理解と対話処理研究会資料 27th 23-28 1999年10月14日  
  • 堀内靖雄
    情報処理学会研究報告 99(68(MUS-31)) 73-78 1999年8月7日  
    本稿では人間の演奏制御のふるまいについて述べる。収録された人間と計算機(テンポ変化をあらかじめ指定できる)による演奏を分析し、人間の未来の演奏(テンポ変化)が過去のどのような要因と関係があるのかについて調べた。結果として、()両者の時間的ずれが30ミリ秒以上の場合、人間の次のテンポは時間的ずれに応じて変化し、()両者の時間的ずれが30ミリ秒以内の場合には、両者のずれの変化量(時間長のずれ)に応じて変化する、という仮説が導かれた。In this paper, we will introduce a hypothetical model of human performance. Several performances, where performers play together with a computer which can play with an accurate tempo specified beforehand, were recorded. These recorded performances were analyzed in order to examine which factors affect next human's behavior (tempo changing). As a result, a hypothesis about human's performance were suggested that next beat length played by human performer correlates to (1) the time lag between the computer and the performer when the lag is larger than 30 milliseconds and to (2) the difference of beat length between them when the lag is less than 30 milliseconds.
  • 宮城 愛美, 藤森 祐司, 堀内 靖雄, 市川 熹
    ヒューマンインタフェース学会論文誌 1(3) 35-40 1999年8月1日  
  • 堀内靖雄, 財津茜, 市川あきら
    情報処理学会研究報告 99(51(MUS-30)) 59-64 1999年5月29日  
    本稿ではテンポ安定時における人間の演奏制御のふるまいについて述べる。収録された人間と計算機(テンポ変化をあらかじめ指定できる)による演奏を分析し、人間の未来の演奏が過去のどのパラメータと相関があるのかを調べた。その結果、テンポが安定しているときには、ある時点において、その直前の人間と計算機のずれの変化量(一拍の時間長のずれに等しい)と人間の次の時間長との間に高い相関が見られた。このことから、テンポ安定時における人間の演奏制御のふるまいが明らかになり、人間の演奏を予測できる可能性が示唆された。In this paper, we will introduce a model of human performance in stable tempi. Seveeral performances, where performers play together with a computer which can play with an accurate tempo specified beforehand, were recorded. We analyzed these recorded performances to examine which prameters are orrelated to next human's behavior (tempo changing). The result shows there is a close correlation between the difference of beat length between a computer and a performer and the next beat length played by the performer.
  • GUO W, 堀内靖雄, 市川あきら
    電子情報通信学会技術研究報告 98(672(MBE98 141-160)) 101-106 1999年3月19日  
    現代社会の発展に伴い、人類の寿命も延び、高齢者の割合は増えている。高齢者の体の機能は低下し、特に、心臓などの機能が弱くなる、日本における主要な死因の中で、心疾患は第二位を占めていると言われている。安静心電図の記録中の1〜3分間には何の異常もないにもかかわらず、歩行中や就寝中などに異常が出る場合は少なくない。それゆえ、心電図を常時監視し、異常状況を検出する携帯式の心電図監視方式の実現が必要となっている。本研究では、心電に音声認識手法連続DPマッチングを用いて常時監視する手法を提案した。
  • 郭 威, 堀内 靖雄, 市川 憙
    電子情報通信学会技術研究報告. MBE, MEとバイオサイバネティックス 98(672) 101-106 1999年3月19日  
    現代社会の発展に伴い、人類の寿命も延び、高齢者の割合は増えている。高齢者の体の機能は低下し、特に、心臓などの機能が弱くなる、日本における主要な死因の中で、心疾患は第二位を占めていると言われている。安静心電図の記録中の1〜3分間には何の異常もないにもかかわらず、歩行中や就寝中などに異常が出る場合は少なくない。それゆえ、心電図を常時監視し、異常状況を検出する携帯式の心電図監視方式の実現が必要となっている。本研究では、心電に音声認識手法連続DPマッチングを用いて常時監視する手法を提案した。
  • 清水智之, 堀内靖雄, 市川あきら
    日本音響学会研究発表会講演論文集 1999 139-140 1999年3月10日  
  • 三井卓, 堀内靖雄, 市川あきら
    情報処理学会シンポジウム論文集 99(4) 61-62 1999年3月4日  
  • 高橋岳樹, 堀内靖雄, 市川あきら
    情報処理学会シンポジウム論文集 99(4) 59-60 1999年3月4日  
  • 山下洋一, 小磯花絵, 堀内靖雄
    人工知能学会誌 14(2) 282-289 1999年3月  
    This report describes tagging of discourse seglnents for spoken dialogues. We carried out tagging experiments for dialogues of two tasks, meeting space reservation and route direction, using two versions of written instructions. The agreement of tags between the coders is quantitatively evaluated with reliability in terms of the kappa coefficient (K). The first version of written instructions uses a tagging scheme of discourse segments based on Grosz and Sidner's discourse structure model. The discourse segment is marked with the beginning and the ending points, and the structllre of discourse segments can be nesting. The coders reached K=0.63 on the existence of discourse segment tags, and K=0.45 on the tags with the nesting level. Major disagreements of the discourse segment tag were ending points of the segment and nesting structure. In the second version, the tagging scheme was renewed based on characteristics of dialogue, which are exchange structure and ambiguous ending of topic. The written instruction requires coders to mark boundaries of the discourse segments with topic break index (TBI). The coders reached K=0.65 ignoring the TBI's, K=0.56 on the tags with TBI, and K=0.63 on the boundaries with TBI=2.
  • 土屋 俊, 堀内 靖雄, 石崎 雅人, 前川 喜久雄, Syun Tutiya, Yasuo Horiuchi, Masato Ishizaki, Kikuo Maekawa
    人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 14(2) 231-242 1999年3月1日  
  • 堀内 靖雄, 中野 有紀子, 小磯 花絵, 石崎 雅人, 鈴木 浩之, 岡田 美智男, 仲 真紀子, 土屋 俊, 市川 熹, Yasuo Horiuchi, Yukiko Nakano, Hanae Koiso, Masato Ishizaki, hiroyuki Suzuki, Michio Okada, Makiko Naka, Syun Tutiya, Akira Ichikawa
    人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 14(2) 261-272 1999年3月1日  
    The Japanese Map Task Corpus was created between 1994 and 1998 and contains a collection of 23 hour digital recordings, digitized maps and orthographic transcriptions of 128 dialogues by 64 native Japanese speakers. Map task dialogues are dialogues participated in by two speakers, the instruction giver who has a map with a route and the instruction follower who has a map without a route. The giver verbally instructs the follower to draw a route on his map. The two maps are slightly different so that there may emerge a natural interaction in spite of the fact that the flow of information internal to the task is basically one way. The principle and design of the recordings are described with special reference to the augmentations and improvements to the original HCRC Map Task corpus. Annotations to the orthographic transcriptions are viewed as "tags" that provide the start and end times of utterances, the duration of pauses, non-verbal events and synchronization of overlapping utterances, in a format which provides a view to giving a basis for further tagging in terms of linguistic and discourse phenomena in a interchangeable and sharable manner. Discourse and linguistic phenomena peculiar to spontaneous spoken dialogues, such as overlapping, are analyzed and the method of recording such phenomena in the transcription is discussed and proposed, with an implication for the requirement that one dialogue be represented in one digitized sound file for the preservation and reference of the information on timing. The tags emp1oyed in the corpus also provide an easy way of characterizing it in terms of the number and the duration of utteraI1ces and pauses. The statistical figures thus ob-tained are relatively independent of design factors like kinds of maps, but familiarity does significantly correlate with the duration and number of utterances.
  • 山下 洋一, 小磯 花絵, 堀内 靖雄, Yoichi Yamashita, Hanae Koiso, Yasuo Horiuchi
    人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 14(2) 282-289 1999年3月1日  
    This report describes tagging of discourse seglnents for spoken dialogues. We carried out tagging experiments for dialogues of two tasks, meeting space reservation and route direction, using two versions of written instructions. The agreement of tags between the coders is quantitatively evaluated with reliability in terms of the kappa coefficient (K). The first version of written instructions uses a tagging scheme of discourse segments based on Grosz and Sidner's discourse structure model. The discourse segment is marked with the beginning and the ending points, and the structllre of discourse segments can be nesting. The coders reached K=0.63 on the existence of discourse segment tags, and K=0.45 on the tags with the nesting level. Major disagreements of the discourse segment tag were ending points of the segment and nesting structure. In the second version, the tagging scheme was renewed based on characteristics of dialogue, which are exchange structure and ambiguous ending of topic. The written instruction requires coders to mark boundaries of the discourse segments with topic break index (TBI). The coders reached K=0.65 ignoring the TBI's, K=0.56 on the tags with TBI, and K=0.63 on the boundaries with TBI=2.
  • 堀内 靖雄, 中野 有紀子, 小磯 花絵, 石崎 雅人, 鈴木 浩之, 岡田 美智男, 仲 真紀子, 土屋 俊, 市川 熹, Yasuo Horiuchi, Yukiko Nakano, Hanae Koiso, Masato Ishizaki, hiroyuki Suzuki, Michio Okada, Makiko Naka, Syun Tutiya, Akira Ichikawa
    人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 14(2) 261-272 1999年3月1日  
    The Japanese Map Task Corpus was created between 1994 and 1998 and contains a collection of 23 hour digital recordings, digitized maps and orthographic transcriptions of 128 dialogues by 64 native Japanese speakers. Map task dialogues are dialogues participated in by two speakers, the instruction giver who has a map with a route and the instruction follower who has a map without a route. The giver verbally instructs the follower to draw a route on his map. The two maps are slightly different so that there may emerge a natural interaction in spite of the fact that the flow of information internal to the task is basically one way. The principle and design of the recordings are described with special reference to the augmentations and improvements to the original HCRC Map Task corpus. Annotations to the orthographic transcriptions are viewed as "tags" that provide the start and end times of utterances, the duration of pauses, non-verbal events and synchronization of overlapping utterances, in a format which provides a view to giving a basis for further tagging in terms of linguistic and discourse phenomena in a interchangeable and sharable manner. Discourse and linguistic phenomena peculiar to spontaneous spoken dialogues, such as overlapping, are analyzed and the method of recording such phenomena in the transcription is discussed and proposed, with an implication for the requirement that one dialogue be represented in one digitized sound file for the preservation and reference of the information on timing. The tags emp1oyed in the corpus also provide an easy way of characterizing it in terms of the number and the duration of utteraI1ces and pauses. The statistical figures thus ob-tained are relatively independent of design factors like kinds of maps, but familiarity does significantly correlate with the duration and number of utterances.
  • 土屋 俊, 堀内 靖雄, 石崎 雅人, 前川 喜久雄, Syun Tutiya, Yasuo Horiuchi, Masato Ishizaki, Kikuo Maekawa
    人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 14(2) 231-242 1999年3月1日  
  • 清水 智之, 堀内 靖雄, 市川 熹
    日本音響学会研究発表会講演論文集 1999(1) 139-140 1999年3月1日  
  • 人工知能学会誌 14(2) 231-242 1999年  
  • 人工知能学会誌 14(2) 282-289 1999年  
  • 人工知能学会誌 14(2) 261-272 1999年  
  • ヒューマンインタフェース学会論文誌 1(3) 35-40 1999年  
  • 電子情報通信学会技術研究報告. MBE, MEとバイオサイバネティックス 98(672) 101-106 1999年  
  • 植野 研, 古川 康一, 永野 牧子, 吉田 留実子, 吉田 史子, 浅海 孝子, 齋藤 功, 尾崎 知伸, 堀内 靖雄
    情報処理学会研究報告. [音楽情報科学] 98(117) 37-37 1998年12月11日  
  • 山田 拓史, 椎塚 久雄, 堀内 靖雄
    情報処理学会研究報告. [音楽情報科学] 98(117) 37-37 1998年12月11日  
  • 三輪 多恵子, 田所 嘉昭, 斎藤 努, 堀内 靖雄
    情報処理学会研究報告. [音楽情報科学] 98(117) 38-38 1998年12月11日  
  • 藤原敦史, 堀内靖雄, 市川あきら
    Hum Interface News Rep 13(4) 481-484 1998年12月  
  • 宮城 愛美, 藤森 祐司, 芦沢 修, 堀内 靖雄, 市川 熹
    Human interface : proceedings of the Symposium on Human Interface : ヒューマンインタフェイスシンポジウム論文集 14 583-588 1998年9月28日  
  • 堀内靖雄, 三井卓, 財津茜, 市川あきら
    情報処理学会研究報告 98(74(MUS-26)) 103-108 1998年8月7日  
    本論文では人間二人の演奏およびテンポ一定で演奏を行なう計算機と人間による演奏を収録し、人間の演奏制御がどのように行なわれているのかということを調査する。相手に合わせるように教示された演奏者(伴奏者)は、ずれに敏感に反応し、テンポを修正して合わせようとすることが示された。また、テンポを早くしたいという欲求があるとき、その分をバイアスしてテンポ変化を行なうということが示唆された。相手をリードするように教示された独奏者は、伴奏者ほど敏感にテンポ変化をせず、テンポをキープしようとする意図がみられた。さらにずれが小さい場合には、ずれとはあまり相関のないテンポ変化を行なうことが観察された。We recorded several performances where two performers play together or one performer plays with a computer which can play with a fixed tempo. We analyzed the timing information of these performances. The result shows a performer who is instructed to be an accompanist changes her tempo according to the time lag between her and another performer (soloist). A performer who is instructed to be a soloist does not change her tempo according to the lag so much in order to keep their tempo. When the lag is very short, they change their tempo regardless of their time lag.
  • 堀内靖雄
    BIT (Tokyo) 252-269 1998年8月  
  • 堀内 靖雄, 岡本 修一, 市川 熹, FUJIWARA Atsushi
    人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI 12 649-652 1998年6月16日  
  • 市川あきら, 芦沢修, 堀内靖雄
    電子情報通信学会技術研究報告 98(33(SP98 8-13)) 35-41 1998年4月24日  
    本稿では盲聾者のコミュニケーション手段である指点字の抑揚情報を定量的に示すことを目的とした研究の結果を報告する。まず指点字の時間的構造及び打点にかかる圧力を抽出するための測定機器を開発した。次にこの測定機器を用いて指点字情報の分析を行った。その結果、指点字はその時間的構造と打点にかかる圧力に抑揚情報を持っていることが確認された。文節の終わりの部分の区間長が長くなることにより指点字の文章の文節境界が示されている。さらに、特に「強調」にのみ対象を絞った収録を行いそのデータを時間構造に注目して分析した結果「強調」部分の直前、終わりの区間長を特に長くすることによって強調を表現していることが示唆された。打点にかかる圧力の有する情報についての詳細は今後の課題である。
  • 堀内靖雄, 高橋美栄, 市川あきら
    電子情報通信学会技術研究報告 98(32(SP98 1-7)) 9-16 1998年4月23日  
    本稿では、自然対話における基本周波数とポーズに着目し、抑揚が有する情報を分析した結果を報告する。本手法では、小松らの提案する韻律情報による構文推定法[1]を自然対話に対しても適用できるように改良を行ったものである。特に、結合度の定義式の検討を中心に行い、相互に相関の小さい4つのパラメータd, l, g, pを用い、それぞれのパラメータにかかる係数wd, wl, wg, wpは、主成分分析を用いて客観的に決定した。さらに、これらの係数は個人差の少ない一般性のある係数であることが確かめられた。係数としては、データの反映度を表す寄与率との関係から第1主成分係数と第2主成分係数を用いた。その結果、第1主成分係数を用いた場合には話者の内容を分かりやすく伝えようという意図が見られ、第2主成分係数を用いた場合には意味的なまとまりが見られた。
  • 電子情報通信学会技術研究報告. SP, 音声 98(32) 9-16 1998年  
  • 電子情報通信学会技術研究報告. SP, 音声 98(33) 35-41 1998年  
  • Hanae Koiso, Yasuo Horiuchi, Syun Tutiya, Akira Ichikawa, Yasuharu Den
    Language and Speech 41(3-4) 295-321 1998年  
    In this study, we investigate syntactic and prosodic features of the speaker's speech at points where turn-taking and backchannels occur, on the basis of our analysis of Japanese spontaneous dialogs. Specifically, we focus on features such as part of speech, duration, F0 contour pattern, relative height of the peak F0, energy trajectory pattern, and relative height of the peak energy at the final part of speech segments. We examine, first, the relationship between turn-taking/backchannels and each feature of speech segments independently, showing that the features examined in this study are all related to turn-taking or backchannels and that the way they correlate is fairly consistent with previous studies. Next, we explore the inter-relationship among the features with respect to turn-taking and backchannels. We show that in both turn-taking and backchannels, (1) some instances of syntactic features make extremely strong contributions, and (2) in general, syntax has a stronger contribution than any individual prosodic feature, although the whole prosody contributes as strongly as, or even more strongly than, syntax. We also discuss some implications of our results, comparing them with previous models that have mentioned roles of syntax and prosody in turn-taking and backchannels.
  • 市川よし, 堀内靖雄, 絹川博之
    心の発達:認知的成長の機構 平成9年度研究成果報告書 106-110 1998年  
  • 渡辺実, 堀内靖雄, 市川あきら
    電子情報通信学会技術研究報告 97(338(SP97 51-56)) 17-22 1997年10月23日  
    数式の構造は欧米語に近く、日本語とは非常に異なるため、その日本語の音声表現は決まったものがない。視覚障碍者がインターネット等を通して電子化された情報を得る場合を想定し、HTMLやLATEXで記述されている表形式や数式を音声で表現するための基礎検討を進めている。
  • 渡辺実, 堀内靖雄, 市川あきら
    人工知能学会言語・音声理解と対話処理研究会資料 19th(19) 17-22 1997年10月  
  • 岡本修一, 藤原敦史, 堀内靖雄, 市川あきら
    電子情報通信学会技術研究報告 97(295(IN97 69-97)) 27-32 1997年9月29日  
    現在のところ、視覚障碍者のWWW利用を支援する環境は整っていない。本稿では、試作した視覚障碍者専用のWWWブラウザの仕様を紹介する。本システムは、晴眼者もアクセスできる。本システムは、テンキーだけでWebぺージのナビゲーション操作を行うことが可能である。また、WEbページのフォーム、本プログラムのメニューやダイアログボックスコントロールもテンキー操作で行なえるようにした。キーボードとマウスどちらでも入力でき、出力は合成音声と画面表示である。弱視者や晴眼者のために2種類の表示を用意している。近い将来、実際に長期間利用してもらい評価実験を行なう予定である。
  • 岡本 修一, 藤原 敦史, 堀内 靖雄, 市川 熹
    電子情報通信学会技術研究報告. IN, 情報ネットワーク 97(295) 27-32 1997年9月29日  
    現在のところ、視覚障碍者のWWW利用を支援する環境は整っていない。本稿では、試作した視覚障碍者専用のWWWブラウザの仕様を紹介する。本システムは、晴眼者もアクセスできる。本システムは、テンキーだけでWebぺージのナビゲーション操作を行うことが可能である。また、WEbページのフォーム、本プログラムのメニューやダイアログボックスコントロールもテンキー操作で行なえるようにした。キーボードとマウスどちらでも入力でき、出力は合成音声と画面表示である。弱視者や晴眼者のために2種類の表示を用意している。近い将来、実際に長期間利用してもらい評価実験を行なう予定である。
  • 岡本 修一, 藤原 敦史, 堀内 靖雄, 市川 熹
    電子情報通信学会技術研究報告. SSE, 交換システム 97(293) 27-32 1997年9月29日  
    現在のところ、視覚障碍者のWWW利用を支援する環境は整っていない。本稿では、試作した視覚障碍者専用のWWWブラウザの仕様を紹介する。本システムは、晴眼者もアクセスできる。本システムは、テンキーだけでWebぺージのナビゲーション操作を行うことが可能である。また、WEbページのフォーム、本プログラムのメニューやダイアログボックスコントロールもテンキー操作で行なえるようにした。キーボードとマウスどちらでも入力でき、出力は合成音声と画面表示である。弱視者や晴眼者のために2種類の表示を用意している。近い将来、実際に長期間利用してもらい評価実験を行なう予定である。
  • 清水 智之, 堀内 靖雄, 市川 熹
    人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI 11 380-383 1997年6月24日  
  • 中野有紀子, 仲真紀子, 堀内靖雄, 吉野文, 土屋俊, 石崎雅人, 岡田美智男, 小磯花絵, 鈴木浩之
    人工知能学会言語・音声理解と対話処理研究会資料 18th 19-24 1997年6月  
  • 中野 有紀子, 仲 真紀子, 堀内 靖雄
    言語・音声理解と対話処理研究会 (18) 19-24 1997年6月  
  • 堀内 靖雄, 吉野 文, 仲 真紀子, 土屋 俊, 市川 熹
    千葉大学工学部研究報告 48(2) 33-60 1997年3月  
  • 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 96(593) 75-80 1997年  
  • 電子情報通信学会技術研究報告. IN, 情報ネットワーク 97(295) 27-32 1997年  

共同研究・競争的資金等の研究課題

 28