Takashi Fukuda photo

Professional Interests


Contact Information

Takashi Fukuda
Speech and Language Processing
Tokyo Research Laboratory, Japan
      +81dash3dash5144dash2867


Tab navigation

Awards:

  • IPSJ Yamashita SIG Research Award, Information Processing Society of Japan, 2013
  • IEICE ISS Young Researcher's Award in Speech Field, The Institute of Electronics, Information and Communication Engineers(IEICE), 2012
  • The 28th Awaya Kiyoshi Academic Encouraging Award, The Acoustical Society of Japan(ASJ), 2010.

 

Journal Papers:

  • Takashi Fukuda, Osamu Ichikawa, and Masafumi Nishimura, "Long-term Spectro-temporal and Static Harmonic Features for Voice Activity Detection," IEEE Journal of Selected Topics in Signal Processing,Vol.4, No.5, pp.834-844, 2010.
  • Osamu Ichikawa, Takashi Fukuda, and Masafumi Nishimura, "Dynamic Features in the Linear-Logarithmic Hybrid Domain for Automatic Speech Recognition in a Reverberant Environment," IEEE Journal of Selected Topics in Signal Processing,Vol.4, No.5, pp.816-823, 2010.
  • Osamu Ichikawa, Takashi Fukuda, and Masafumi Nishimura, "DOA Estimation with Local-Peak-Weighted CSP," EURASIP Journal on Advances in Signal Processing,Volume 2010, Article ID 358729, 9 pages, 2010.
  • Osamu Ichikawa, Takashi Fukuda, and Masafumi Nishimura, "Local Peak Enhancement for In-Car Speech Recognition in Noisy Environment," The Institute of Electronics, Information and Communication Engineers (IEICE) Transactions on Information and Systems, Vol. E91-D, No.3, pp.635-639, March 2008.
  • Mohammad Nurul Huda, Muhammad Ghulam, Takashi Fukuda,Kouichi Katsurada, and Tsuneo Nitta, "Canonicalization of Feature Parameters for Robust Speech Recognition Based on Distinctive Phonetic Feature (DPF) Vectors," The Institute of Electronics, Information and Communication Engineers (IEICE) Transactions on Information and Systems,Vol. E91-D, No.3, pp.488-498, March 2008.
  • Muhammad GHULAM, Takashi Fukuda, Kohichi Katsurada, Junsei Horikawa, and Tsuneo Nitta, "PS-ZCPA based features extraction with auditory masking, modulation enhancement and noise reduction for robust ASR," The Institute of Electronics, Information and Communication Engineers (IEICE) Transactions on Information and Systems, Vol.E89-D, No.3, pp.1015-1023, March 2005.
  • Takashi Fukuda and Tsuneo Nitta, "Orthogonalized Distinctive Phonetic Feature Extraction for Noise-robust Automatic Speech Recognition," The Institute of Electronics, Information and Communication Engineers (IEICE) Transactions on Information and Systems, Vol.E87-D, No.5, pp.1110-1118, May 2004.
  • Muhammad Ghulam, Takaharu Sato, Takashi Fukuda, and Tsuneo Nitta, "Confidence Scoring for Accurate HMM-based Speech Recognition by Using Monophone-Level Normalization Based on Subspace Method," The Institute of Electronics, Information and Communication Engineers (IEICE) Transactions on Information and Systems, Vol.E86-D, No.3, pp.430-437, March 2003.
  • Takashi Fukuda and Tsuneo Nitta, "Improvement in both Tasks of LVCSR and ISWR by using Peripheral Feature Extraction and CMN Control," Journal of Information Processing Society of Japan (IPSJ), Vol.43,No.7,pp.2022-2029,July 2002.

 

International Conference Papers:

  • Takashi Fukuda, Osamu Ichikawa, Masafumi Nishimura, Steven J. Rennie, and Vaibhava Goel, "Regularized Feature-space Discriminative Adaptation for Robust ASR," Proc. of 15th Annual Conference on the International Speech Communication Association (Interspeech 2014), pp.2185-2188, September 2014, Singapore.
  • Osamu Ichikawa, Steven J. Rennie, Takashi Fukuda, and Masafumi Nishimura, "Channel-mapping for speech corpus recycling," Proc. of 2013 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2013), pp.7160-7164, May 2013, Vancouver, Canada.
  • Takashi Fukuda, Ryuki Tachibana, Upendra Chaudhari, Bhuvana Ramabhadran, and Puming Zhan, "Constructing Ensembles of Dissimilar Acoustic Models using Hidden Attributes of Training Data," Proc. of 2012 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2012), pp.4141-4144, March 2012, Kyoto, Japan.
  • Osamu Ichikawa, Steven Rennie, Takashi Fukuda, and Masafumi Nishimura, "Model-based Noise Reduction Reveraging Frequency-wise Confidence Metric for In-car Speech Recognition," Proc. of 2012 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2012), pp.4921-4924, March 2012, Kyoto, Japan.
  • Ryuki Tachibana, Takashi Fukuda, Upendra Chaudhari, Bhuvana Ramabhadran, and Puming Zhan, "Frame-level AnyBoost for LVCSR with the MMI Criterion," Proc. of IEEE Workshop on Automatic Speech Recognition and Unterstanding (ASRU 2011), pp.12-17, December 2011, Hawaii, USA.
  • Takashi Fukuda, Osamu Ichikawa, and Masafumi Nishimura, "Combining Feature Space Discriminative Training with Long-term Spectro-temporal Features for Noise-robust Speech Recognition," Proc. of 12th Annual Conference on the International Speech Communication Association (Interspeech 2011), pp.229-232, August 2011, Florence, Italy.
  • Takashi Fukuda, Osamu Ichikawa, and Masafumi Nishimura, "Breath-detection-based Telephony Speech Phrasing," Proc. of 12th Annual Conference on the International Speech Communication Association (Interspeech 2011), pp.2625-2628, August 2011, Florence, Italy.
  • Takashi Fukuda, Osamu Ichikawa, and Masafumi Nishimura, "Improved Voice Activity Detection Using Static Harmonic Features," Proc. of 2010 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2010), pp.4482-4485, March 2010, Dallas, Texas, USA.
  • Osamu Ichikawa, Takashi Fukuda, and Masafumi Nishimura, "Dynamic Features in the Linear Domain for Robust Automatic Speech Recognition in a Reverberant Environment," Proc. of 11th European Conference on Speech Communication and Technology (Eurospeech 2009 / Interspeech 2009), pp.44-47, September 2009, Brighton, U.K.
  • Takashi Fukuda, Osamu Ichikawa, and Masafumi Nishimura, "Short- and Long-term Dynamic Features for Robust Speech Recognition," Proc of 10th International Conference on Spoken Language Processing (ICSLP 2008 / Interspeech 2008), pp.2262-2265, September 2008, Brisbane, Australia.
  • Takashi Fukuda, Osamu Ichikawa, and Masafumi Nishimura, "Phone-duration-dependent Long-term Dynamic Features for Stochastic Model-based Voice Activity Detection," Proc of 10th International Conference on Spoken Language Processing (ICSLP 2008 / Interspeech 2008), pp.1293-1296, September 2008, Brisbane, Australia.
  • Osamu Ichikawa, Takashi Fukuda, and Masafumi Nishimura, "Local Peak Enhancement Combined with Noise Reduction Algorithms for Robust Automatic Speech Recognition in Automobiles," Proc. of 2008 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2008), pp.4865-4868, April 2008, Las Vegas, Nevada, USA.
  • Takashi Fukuda and Tsuneo Nitta, "Designing Multiple Distinctive Phonetic Feature Extractors for Canonicalization by Using Clustering Technique," Proc. of 9th European Conference on Speech Communication and Technology (Eurospeech 2005 / Interspeech 2005), pp.3141-3144,September 2005, Lisbon, Portugal.
  • Muhammad Ghulam, Takashi Fukuda, Junsei Horikawa, and Tsuneo Nitta, "Pitch-Synchronous ZCPA (PS-ZCPA)-Based Feature Extraction with Auditory Masking," Proc. 2005 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2005), Vol. I, pp.517-520, March 2005, Philadelphia, Pennsylvania, USA.
  • Takashi Fukuda and Tsuneo Nitta, "Canonicalization of Feature Parameters for Automatic Speech Recognition," Proc. of 8th International Conference on Spoken Language Processing (ICSLP 2004 / Interspeech 2004), Vol.IV, pp.2537-2540, October 2004, Korea.
  • Muhammad Ghulam, Takashi Fukuda, Junsei Horikawa, and T. Nitta, "A Noise-Robust Feature Extraction Method Based on Pitch-Synchronous ZCPA for ASR," Proc. 8th International Conference on Spoken Language Processing (ICSLP 2004 / Interspeech 2004), Vol.I, pp.133-136, October 2004, Jeju, Korea.
  • Takashi Fukuda and Tsuneo Nitta, "Noise-robust Automatic Speech Recognition Using Orthogonalized Distinctive Phonetic Feature Vectors," Proc. of 8th European Conference on Speech Communication and Technology (Eurospeech 2003 / Interspeech 2003), Vol.III, pp.2189-2192, September 2003, Geneva, Switzerland.
  • Takashi Fukuda and Tsuneo Nitta, "Noise-robust ASR by Using Distinctive Phonetic Features Approximated with Logarithmic Normal Distribution of HMM," Proc. of 8th European Conference on Speech Communication and Technology (Eurospeech 2003 / Interspeech 2003), Vol.III, pp.2185-2188,September 2003, Geneva, Switzerland.
  • Muhammad Ghulam, Takashi Fukuda, and Tsuneo Nitta, "Voice Quality Normalization in an Utterance for Robust ASR," Proc. 8th European Conference on Speech Communication and Technology (Eurospeech 2003 / Interspeech 2003), Vol.III, pp.2173-2176, September 2003, Geneva, Switzerland.
  • Tsuneo Nitta, Shingo Iseji, Takashi Fukuda, Hirobumi Yamada, and Katsurada Katsurada, "Key-word Spotting Using Phonetic Distinctive Features Extracted from Output of an LVCSR Engine," Proc. ISCA & IEEE Workshop on Spontaneous Speech Processing and Recognition (SSPR 2003), pp.99-102, April 2003, Tokyo, Japan.
  • Takashi Fukuda, Wataru Yamamoto and Tsuneo Nitta, "Distinctive Phonetic Feature Extraction for Robust Speech Recognition," Proc. of 2003 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2003), Vol.Ⅱ, pp.25-28,April 2003, Hong Kong, China.
  • Muhammad Ghulam, Takaharu Sato, Takashi Fukuda, and Tsuneo Nitta, "Improving Performance of an HMM-based ASR System By Using Monophone-Level Normalized Confidence Measure," Proc. 7th International Conference on Spoken Language Processing (ICSLP 2002 / Interspeech 2002), Vol.IV, pp.2453-2456, September 2002, Denver, Colorado, USA.
  • Takaharu Sato, Muhammad Ghulam, Takashi Fukuda, and Tsuneo Nitta, "Confidence Scoring for Accurate HMM-based Word Recognition By Using SM-based Monophone Score Normalization," Proc. 2002 IEEE International Conference on Acoustic, Speech, and Signal Processing (ICASSP 2002), Vol.I, pp.217-220, May 2002, Orlando, Florida, USA.
  • Takashi Fukuda, Masashi Takigawa and Tsuneo Nitta, "Peripheral Features for HMM-based Speech Recognition," Proc. of 2001 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2001), Vol.I, pp.129-132, May 2001, Salt Lake City, Utah, USA.
  • Tsuneo Nitta, Masashi Takigawa, and Takashi Fukuda, "A Novel Feature Extraction Using Multiple Acoustic Feature Planes for HMM-based Speech Recognition," Proc. 6th International Conference on Spoken Language Processing (ICSLP 2000 / Interspeech 2000), Vol.I, pp.385-388, October 2000, Beijing, China.

 

Domestic Conference Papers, First Author (In Japanese):

  • 福田 隆,立花 隆輝,西村 雅史, Upendra Chaudhari, Bhuvana Ramabhadran, Puming Zhan,“音声データの隠れ属性を利用した異種音響モデル群の構築,” 情報処理学会研究報告(音声言語情報処理),Vol.2012-SLP-93 (3),pp.1-6, October 2012. (音声言語情報処理研究会 SIG-SLP 山下記念研究賞)
  • 福田 隆,市川 治,西村雅史,“息継ぎ音を利用した電話音声の発話分割,” 電子情報通信学会技術研究報告(音声),SP2011-153, pp.243-248, February 2012. (電子情報通信学会/日本音響学会 音声研究会研究奨励賞)
  • 福田 隆,市川 治,西村雅史,“特徴空間における長時間スペクトル変動成分の識別学習,” 情報処理学会研究報告(音声言語情報処理),Vol.2012-SLP-90 (21),pp.1-6, February 2012.
  • 福田 隆,"音声特徴抽出の基礎と最近の研究動向,” 電子情報通信学会技術研究報告(音声),SP2011-30,pp.1-6,June 2011.(招待講演)
  • 福田 隆,市川 治,西村雅史,“音声認識のための長時間変動量と線形判別分析の比較検討,” 日本音響学会2010年秋季研究発表会講演論文集,1-9-2,pp.3-6,September 2010.
  • 福田 隆,市川 治,西村雅史,“頑健な音声認識のための線形-対数ハイブリッド領域における長時間動的特徴量,” 日本音響学会2010年春季研究発表会講演論文集,1-6-2,pp.5-8,March 2010.(日本音響学会 粟屋潔学術奨励賞)
  • 福田 隆,市川 治,西村雅史,“長時間スペクトル変動と調波構造に基づく発話区間検出法の音声認識による評価,” 情報処理学会研究報告(音声言語情報処理),2009-SLP-78 (1),pp.1-6,October 2009.
  • 福田 隆,市川 治,西村雅史,“長時間スペクトル変動情報と調波構造特徴量を併用した発話区間検出法の評価と考察,” 日本音響学会2009年秋季研究発表会講演論文集,1-1-13,pp.39-42,September 2009.
  • 福田 隆,市川 治,西村雅史,“短・長スペクトル変動を考慮した雑音に頑健な音声認識,” 日本音響学会2009年春季研究発表会講演論文集,1-5-3,pp.7-10,March 2009.
  • 福田 隆,市川 治,西村雅史,“長時間スペクトル変動情報と調波構造特徴量を併用した発話区間検出法,” 情報処理学会研究報告(音声言語情報処理),2008-SLP-73 (1),pp.1-6,October 2008.
  • 福田 隆,市川 治,西村雅史,“耐雑音性の高い発話区間検出のための調波構造に基づく音声特徴量,” 日本音響学会2008年秋季研究発表会講演論文集,1-1-11,pp.25-26,September 2008.
  • 福田 隆,市川 治,西村雅史,“長時間スペクトル変動を考慮した低S/N環境下における発話区間検出法,” 日本音響学会2008年春季研究発表会講演論文集,1-10-6,pp. 19-20,March 2008.
  • 福田 隆,市川 治,西村雅史,“長時間スペクトル変動を考慮した音声特徴量の検討,” 日本音響学会2007年春季研究発表会講演論文集,1-P-1,pp.125-126, March 2007.
  • 福田 隆,市川 治,西村雅史,“発話末尾残響区間推定に基づく低コストなフィルタ係数決定法,” 日本音響学会2006年秋季研究発表会講演論文集,2-P-1,pp.95-96, September 2006.
  • 福田 隆,新田恒雄,“声質差と背景雑音に起因する音声パターン変動の正準化方式,” 日本音響学会2005年春季研究発表会講演論文集,Vol. I,1-5-12,pp.23-24,March 2005.
  • 福田 隆,新田恒雄,“背景雑音を対象とした特徴パラメータ正準化法,” 電子情報通信学会技術研究報告(音声),SP2004-118, pp.133-138, December 2004.
  • 福田 隆,新田恒雄,“音声認識のための特徴パラメータ正準化法” 日本音響学会2004年秋季研究発表会講演論文集,Vol. I,2-1-14,pp.63-64,September 2004.
  • 福田 隆,新田恒雄,“音声認識のための特徴パラメータ正準化法の検討” 電子情報通信学会技術研究報告(音声),SP2004-13,pp.19-24,May 2004.
  • 福田 隆,新田恒雄,“直交化音素弁別特徴のAURORA-2Jによる評価,” 日本音響学会2004年春季研究発表会講演論文集,Vol. I,2-8-16,pp.91-92,March 2004.
  • 福田 隆,新田恒雄,“音声認識のための音素弁別特徴抽出器の改良,” 日本音響学会2004年春季研究発表会講演論文集,Vol. I,1-8-5,pp.9-10,March 2004.
  • 福田 隆,新田恒雄,“頑健な音声認識のための音素弁別特徴ベクトル直交化方式の検討,” 電子情報通信学会技術研究報告(音声),SP2003-133,pp.121-126,December 2003.
  • 福田 隆,新田恒雄,“頑健な音声認識のためのバランスを考慮した日本語音素弁別特徴セットの検討,” 日本音響学会 2003年秋季研究発表会講演論文集,1-6-5, pp.9-10,September 2003.
  • 福田 隆,新田恒雄,“直交化音素弁別特徴ベクトルを利用した雑音に頑健な音声認識,” 情報処理学会研究報告(音声言語情報処理),2003-SLP-47 (15),pp.77-82,July 2003.
  • 福田 隆,新田恒雄,“音素弁別特徴ベクトルの対数正規分布近似を利用した雑音環境下音声認識,” 電子情報通信学会技術研究報告(音声),SP2003-23,pp.19-24,May 2003.
  • 福田 隆,山本 航,新田恒雄,“音素弁別特徴ベクトルの対数正規分布を利用した頑健な音声認識の検討,” 日本音響学会2003年春季研究発表会講演論文集,Vol. I,3-Q-2,pp.155-156,March 2003.
  • 福田 隆,山本 航,新田恒雄,“音素弁別特徴ベクトルを用いた頑健な音声認識に関する検討,” 電子情報通信学会技術研究報告(音声),SP2002-121,pp.1-6,December 2002.
  • 福田 隆,山本 航,新田恒雄,“弁別的特徴ベクトルを用いた音声認識に関する検討,” 日本音響学会2002年秋季研究発表会講演論文集,Vol. I,1-9-1,pp.1-2,September 2002.
  • 福田 隆,新田恒雄,“音声認識の前処理としてのCMNと修正CMNの性能比較,” 電子情報通信学会技術研究報告(音声),SP2002-43,pp.7-12,June 2002.
  • 福田 隆,新田恒雄,“音韻的偏りに対する推定信頼度を用いたCMN制御,” 日本音響学会2002年春季研究発表会講演論文集,Vol. I,1-5-1,pp.1-2,March 2002-3.
  • 福田 隆,石川恵美子,新田恒雄,“交差する複数話者音声分離に関する検討,” 日本音響学会2002年春季研究発表会講演論文集,Vol. I,2-2-8,pp.71-72,March 2002.
  • 福田 隆,新田恒雄,“単語・文音声双方に高い認識性能を持つ周辺特徴抽出方式,” 電子情報通信学会技術研究報告(音声),SP2001-85,pp.7-12,December 2001-12.
  • 福田 隆,新田恒雄,“単語および文音声認識における周辺特徴の適用比較,” 日本音響学会2001年秋季研究発表会講演論文集,Vol. I,1-1-1,pp.1-2,October 2001.
  • 福田 隆,新田恒雄,“周辺特徴と音声認識における役割,” 日本音響学会2001年春季研究発表会講演論文集,Vol. I,3-3-18,pp.129-130,March 2001.
  • 福田 隆,瀧川正史,新田恒雄,“音声認識のための周辺特徴の検討,” 電子情報通信学会技術研究報告(音声),SP2000-76,pp.7-12,December 2000.

 

Domestic Conference Papers, Co-author (In Japanese):

  • 市川 治,福田 隆,立花隆輝,“大規模音声データを異なる音響環境向けの音響モデル学習データに変換するオーディオマッピング技術,” 日本音響学会講2014年秋季研究発表会講演論文集,1-8-4, pp.11-14, September 2014.
  • 市川 治,福田 隆,西村雅史,“メルバンドごとの信頼性指標を組み込んだ因子モデルに基づくモデルベース雑音補正,” 日本音響学会講2012年春季研究発表会講演論文集,1-7-14, pp.33-36, March 2012.
  • 市川 治,福田 隆,西村雅史,“音声認識における母音区間の位相の安定性の利用,” 日本音響学会講2010年秋季研究発表会講演論文集,1-Q-7,pp.127-130, September 2010.
  • 市川 治,福田 隆,西村雅史,“残響にロバストな音声認識のための動的特徴量と調波構造重み付けメルフィルタバンク,” 日本音響学会講2010年春季研究発表会講演論文集,1-6-1,pp.1-4, March 2010.
  • 市川 治,福田 隆,西村雅史,“残響にロバストな音声認識のための動的特徴量,” 日本音響学会講2009年秋季研究発表会講演論文集,1-1-9, pp.27-30,September 2009.
    市川 治,福田 隆,西村雅史,“Local Peak Weighted CSP による方向推定の改善,” 日本音響学会講2008年秋季研究発表会講演論文集,3-P-26, pp.821-822,September 2008.
  • 市川 治,福田 隆,西村雅史,“調波構造のローカルピーク強調によるF0抽出不要な音声強調法,” 日本音響学会講2007年秋季研究発表会講演論文集,1-P-24,pp.185-186, September 2007.
  • 毛呂良寛,池谷春生,福田 隆,山田博文,桂田浩一,新田恒雄,“キーワード検出に基づく対話音声認識用言語モデルの比較” 日本音響学会講2005年春季研究発表会講演論文集,Vol. I,2-5-7,pp.67-68,March 2005.
  • 池谷春生,福田 隆,山田博文,桂田浩一,新田恒雄,“意味属性を利用したクラスN-gram言語モデルの評価,” 電子情報通信学会技術研究報告(音声),SP2004-101,pp.31-36,December 2004.
  • Muhammad Ghulam, Takashi Fukuda, Junsei Horikawa, Tsuneo Nitta, “Embedding Auditory Masking into the Pitch-Synchronous ZCPA (PS-ZCPA)-based Feature Extractor,” 電子情報通信学会技術研究報告(音声),SP2004-80,pp.53-58,November 2004.
  • 池谷春生,福田 隆,山田博文,桂田浩一,新田恒雄,“意味属性を利用したクラスN-gram言語モデルの検討,” 日本音響学会講2004年秋季研究発表会講演論文集,Vol. I,2-1-6,pp.47-48,September 2004.
  • 伊勢路真吾,福田 隆,山田博文,桂田浩一,新田恒雄,“日本語短・長音節単位の認識結果を用いた対話音声中のキーワード検出,” 日本音響学会2004年春季研究発表会講演論文集,3-Q-34,pp.211-212,March 2004.
  • 伊勢路真吾,福田 隆,山田博文,桂田浩一,新田恒雄,“音素弁別特徴間距離に基づくキーワード検出におけるモーラ単位サブワード言語モデルの検討,” 電子情報通信学会技術研究報告(音声),SP2003-140,pp.163-168,December 2003-12.
  • 伊勢路真吾,福田 隆,山田博文,桂田浩一,新田恒雄,“N-best出力と音素弁別特徴を利用した対話音声認識の検討,” 日本音響学会2003年秋季研究発表会講演論文集,Vol. I,1-6-27,pp.53-54,September 2003.   
  • 伊勢路真吾,福田 隆,山田博文,桂田浩一,新田恒雄,“音素弁別特徴を用いた頑健な対話音声認識 - モーラ単位サブワードモデルの検討,” 電子情報通信学会技術研究報告(音声),SP2003-24,pp.25-30,May 2003-5.
  • 伊勢路真吾,福田 隆,山田博文,桂田浩一,新田恒雄,“音素弁別特徴ベクトルを利用した自由発話音声認識における距離補正の役割,” 日本音響学会2003年春季研究発表会講演論文集,Vol. I,2-4-12,pp.81-82,March 2003.
  • Muhammad Ghulam,Takashi Fukuda,Tsuneo Nitta,“Normalizing acoustic qualities of mono-phones in an utterance,” 電子情報通信学会技術研究報告(音声),SP2002-122,pp.7-12,December 2002-12.
  • 伊勢路真吾,福田 隆,桂田浩一,新田恒雄,“0-gram汎用LVCSRと音素弁別特徴ベクトルを利用した対話音声認識の検討,” 電子情報通信学会技術研究報告(音声),SP2002-156,pp.49-54,December 2002-12.
  • Muhammad Ghulam, Takashi Fukuda, Tsuneo Nitta, “An HMM-SM Based Speaker-Independent Connected Digit Recognition System by Using Normalized Confidence Measure,” 日本音響学会2002年秋季研究発表会講演論文集,Vol. I, 1-9-31, pp.61-62, September 2002-9.
  • 伊勢路真吾,福田 隆,桂田浩一,新田恒雄,“0-gram汎用LVCSRと音素弁別特徴ベクトルを利用した対話音声認識の検討,” 日本音響学会2002年秋季研究発表会講演論文集,Vol. I,2-9-11,pp.83-84,September 2002-9.
  • Muhammad Ghulam, Takaharu Sato, Takashi Fukuda, Tsuneo Nitta, “Confidence Scoring for Accurate HMM-based Speech Recognition by Using Monophone-Level Normalization based on Subspace Method,” 電子情報通信学会技術研究報告(音声),SP2002-41, pp.31-36, June 2002-6.
  • 新田恒雄,浅見弘道,伊勢路真吾,福田 隆,桂田浩一,“汎用LVCSRを用いた対話音声の認識,” 情報処理学会研究報告(音声言語情報処理),2002-SLP-41,pp.69-74,2002-5.
  • 浅見弘道,福田 隆,桂田浩一,新田恒雄,“汎用LVCSRを用いた対話音声の認識について,” 日本音響学会2002年春季研究発表会講演論文集,Vol. I,1-5-25,pp.49-50,March 2002.
  • 佐藤隆治,Muhammad Ghulam,福田 隆,新田恒雄,“尤度正規化手法を用いたHMM-SMハイブリッド音声認識の検討,” 日本音響学会2002年春季研究発表会講演論文集,Vol. I,2-5-7,pp.87-88,March 2002-3.
  • 新田恒雄,福田 隆,“音声認識のための局所特徴とケプストラム領域表現について,” 日本音響学会2001年春季研究発表会講演論文集,Vol. I,3-3-19,pp.131-132,March 2001-3.
  • 瀧川正史,福田 隆,新田恒雄,“音声認識用周辺特徴パラメータの検討,” 日本音響学会2000年秋季研究発表会講演論文集,Vol. I,2-5-5,pp.59-60,October 2000.

 

IBM Internal Papers (In Japanese):

  • 福田 隆,西村 雅史,"息継ぎ音を利用したコールセンター会話音声の発話分割," 2010年度IBMプロフェッショナル論文,December 2010. (年間最優秀論文賞)
  • 福田 隆,西村 雅史,"息継ぎ音を利用したコールセンター会話音声の発話分割," IBM PROVISION,No.68, pp.80-87, February 2011.