Audio aus Video als Text speichern

Hallo,

Ich suche nach einer einfachen Möglichkeit das gesprochene Wort (Audio) aus einem Video als Text ab zu speichern.

Dabei suche ich nicht nach einem Online Service.
Mir ist klar das es ggf nicht 100% perfekt ist aber auch schon ein Anfang ist gut, das ich nicht alles händisch nach-tippen muss (Es geht dabei um mehrere ~1,5 h Videos, die Sprache ist englisch).

Kennt da wer was vernünftiges kostenloses?
Ich nehme an ich müßte zuerst die Tonspur extrahieren - wie würdet ihr das machen?
Und dann Audio zu Text …