医療福祉系音声合成技術「人工喉頭」

音声合成技術って、最近だとエンタメ方面での活用が目立ちますが、医療福祉の分野では昔からけっこう使われています。声を失った人向けの話声合成なんかはイメージしやすいですね。

今回のテーマは「人工喉頭」です。

人工喉頭

人間は声帯に息を通して、声を出してますよね。これだと説明が雑すぎますけど。

実際は

1.肺から空気を押し出す
2-A.締めた声帯に息を当てて声の素(喉頭原音)を作る
2-B.声帯を緩めて息をスルーする
3.喉や口腔、鼻腔を使って音声を加工する

こんな感じで音を作っています。

例えば「か(k a)」なら、肺から息を押し出して、まずは声帯をスルー。口の奥でいったん流れを止めて勢いをつけ、放出することで子音「k」を作る。次は声帯で喉頭原音を作り、口腔を広げて母音「a」を作る。

こんな感じ。

何かしらの理由で喉頭の機能や喉頭そのものがなくなった場合は、声を作れなくなります。ガンなどで喉頭摘出した場合の発声方法には「食道発声」「シャント発声」などがあります。体の状態によってとるべき方法は本当にさまざまなので、こればかりじゃないですけどね。

食道発声は頑張って食道側で原音を作る方法。身一つでできるがそこそこ難しい。シャント発声は比較的簡単だが専用の手術が必要。

もっとも簡単(練習量が少なくてもできるという意味)なのが、人工喉頭を使う方法です。

人工喉頭

(電気式)人工喉頭は喉頭原音に近い音を発するハードウェアです。手に収まる小さめの懐中電灯みたいな見た目で、ボタンを押している間だけブイーーンと音が鳴ります。これをノドボトケのあたりに当てて、声帯→喉→口腔の順で音を作るところを、人工喉頭→喉→口腔にするわけですね。

食道発声やシャント発声は喉頭原音の代わりを発声するまでが難しいポイントなので、それを機械で代替することで簡単に声を作れるようにしているんですね。

ただ、イントネーション(音程)をつけるのが難しいというか、できない機種ではできないという問題があったりします。

なので、イントネーションをつけられる人工喉頭があれば、簡単に聞き取りやすい声を作れるわけです。

こちらの人工喉頭は、そのイントネーションをオタマトーンで作るのがコンセプトらしい。かなり分かりやすいインターフェースだと思う。イントネーションをつけなくてもいいならオタマトーンはなくてもOKなはず。

手持ち型ではなく口の中に原音発生器をつけるタイプ。人工喉頭は有声音を作るものなので、無声子音は自前で作らないと聞き取り性能はいまいちです。原音発生器が硬口蓋にあるので、タ行とかナ行とかは発音しにくいのかも。

オタマトーン連携モデルに課題があるとすれば、コードが口から出ているのでわずかに子音を作りにくいこと、オタマトーンの持ち運び性能が従来の人工喉頭ほどでないこと、明らかにオタマトーンを演奏していることあたりかしら?

タイトルとURLをコピーしました