KAITOのレゾナンス

ちょこちょこと調べたものを忘れないようメモ。
参考:ヤマハのフォルマントシンギング音源講座
   ギフトPの有名なブログ

ヤマハの講座から引用
有声フォルマント、無声フォルマントの中で第1、第2フォルマントが特に重要で、この2つのフォルマントによって、どんな言葉で歌っているかをほぼ判別 できます。また、第3、第4フォルマントは、声の性質や特長を作るのに重要な働きをしており、この2つのフォルマントによって、誰が歌っているかをほぼ判別 できます。
第1、2フォルマントのフォルマントレベルを増減することで、主に発音の明瞭さを変更します。数値を上げるほど発音が明瞭になります。あわせて、声質も変わります。
第3、4フォルマントのフォルマントレベルを増減することで、主に声質を変更します。数値を上げるほど、張りのある声になります。

恐らく、ですがKAITOのレゾナンスは上記の第1〜第4フォルマントに対応する、んだろうと。ギフトPのブログで発音いじるにはレゾナンスの1と2を調整するとなっていることを受けてもたぶん間違いないかな、と。
なのでたとえば「シンジの声にしたい」場合、主にいじるのはレゾナンスの3、4になるんだろうと思います(あとはジェンダー)。「誰が歌っているのか」を判別するってことはキャラの違いを表現できると捉えてもいいんだろうなということで。

ただこのレゾナンスの3、4はかなり近い周波数にピークを持ってて、あんまりいじれない感じ(2864Hzくらいと3445Hzくらい)。レゾナンス3のFrequencyを82にした波形とレゾナンス4はほぼ一致しているように見えます。あとやっぱこの2要素だけではないので難しいかなー。Audacityでスペクトル分析みたいのをしてみるんだけれど、4点いじったくらいで別の人の声のスペクトルを再現するのは難しいです。レゾナンス1が結構広範囲に影響を持ってるようでもあるので、そのあたりをどういじったもんか。もうすこしこういう計算得意だともうちょっと近づけられるのかなー。狙ってやったら全然違う変な声になるしなー。
Frequencyの数値は、対数周波数軸で見たときの幅として捉えられそうかなーくらいは思うんですが、それでどんだけ微調整できるのか、という。誰か計算してくれ。
他にも調整できる要素はあるし。
ジェンダーはどっちかっていうと波形そのままで全体的に周波数を上げ下げしているように見えます。ただレゾナンスでも思ったけど、いじり方によってはレゾナンス1,2のところにピークのない平坦な部分が出てくる。これはどういうことなんでしょうか。
フォルマントというもの自体、ちゃんと理解しているわけではないのでなんとも言えないけれど、正直レゾナンスいじってもそんなに「KAITOじゃない」声にはならないと思えるので、もっと根本的な要素(それが何か知らないけれど)で「KAITO」なんだろうなー。
まだ少し諦めきれないのでまたいじってみるつもりではあるけれど。