Leider ist die Software so geschrieben, dass sie Deine Pausen erkennt und auch als Ruhe einfach rausfiltert.
Du kannst aber mit einem *.wav Editor ( ich nutze Cool Edit 2000 ) z.B. für 1.5 Sekunden einen Ton mit einer Frequenz von 10 oder 25 Hz erzeugen. Den hört man in der Hörkapsel kaum, das Telefon "fällt" aber auf diesen Trick herein.
Du hast dann den gewünschten Effekt, dass das Telefon Deinen gewünschten Ton durch diese Pause direkt dann laut abspielt, da der Ton in den 1.5 Sekunden hochgeregelt wird und danach laut abgespielt wird.
Anbei ein Screenshot aus Cool Edit + ein Ton-Beispiel.