Wenn jemand eine Oktave höher singt, dann muss doch ein A
immer noch ein A bleiben.
Ja.
Das heißt, dass nach den Formanten immer noch eine Starke
Ausprägung im Bereich zwischen 800 und 1250 Hz sein muss.
Ja.
Würde ich das Sprachsignal einfach mit doppelter Frequenz
hören, würde ich statt dem A doch eher ein E hören, oder? Das
ist das Problem des Pitch-Shifting, oder?
Richtig, denn da wandern die Formanten auf der Frequenzskala ja mit!
Irgendwie ist mir das nicht klar, auf der einen Seite stehen
die Fromanten, die in ihrer Form und Frequenzbereich erhalten
blieben müssen, auf der anderen Seite die Verdoppelung der
Frequenz.
Die Verdoppelung der Frequenzen des Grundtones und aller Obertöne, also z.B. 110, 220, 330, 440,… --> 220, 440, 660, 880,…
Bis jetzt wurden nur alle Frequenzen verdoppelt, es wurde noch keine Aussage gemacht, was mit den Lautstärken der einzelnen Frequenzen passiert. Würde man mit einem einfachen Pitch Shifter oktavieren, dann bekäme die 220Hz Frequenz des oktavierten Tomes die Lautstärke der 110Hz Frequenz des nichtoktavierten Tones.
Die 440 wären so laut wie die 220, die 660 wie die 330, usw.
bei Formantenerhalt werden die Lautstärken aber nicht mitgeshiftet, sondern unterliegen der Einhüllenden, die die Formante vorgibt.
Gruss,
TR
Formanten sind Einhüllende auf der Frequenzskala.
Obiges Beispiel mit den800-1250 Hz beschreibt nur eine Formante.
(Stimmen haben fast immer mehrere Formanten).
Das widerspricht sich doch, oder sehe ich den Wald vor lauter
Bäumen nicht?
Danke für alle Antworten,
Moritz