ich habe vor, per Sprachsteuerung vom Sofa aus oder frei im Raum aus meinen PC zu bedienen. Dazu benötige ich ein oder vielleicht auch mehrere Mikrofon die man im Raum aufstellt. Da ich keine Ahnung in diesem Bereich habe, benötige ich eure Hilfe. Also welches Mikrofon könnt ihr mir bei einem 20qm² Raum empfehlen??
ich habe selber schon lange so ein Projekt vor, es aber aus Zeitmangel usw. nicht sehr weit gebracht. Vor einigen Jahren konnte ich über ein Spracherkennungsprogramm (ich glaube, es war ViaVoice) zumindest jemanden anrufen, ohne einen Finger zu rühren, fühlte mich schon wie auf Raumschiff Enterprise, hätte aber natürlich gerne mehr damit gemacht…
Ahnliche Fragen wie Deine habe ich damals auch in Foren gestellt. Mein Ansatz war, in jedem Raum mindestens ein Mikro zu haben. Aufnahmequalitätsmäßg bevorzugt werden sollten natürlich die Orte, an denen man sich häufig aufhält. Und da kommt die Richtcharakteristik von Mikros ins Spiel: http://de.wikipedia.org/wiki/Mikrofon#Richtcharakter…
Das Hauptproblem, mit dem man bei Spracherkennung ohne Headset zu kämpfen hat, sind die Nebengeräusche (Autos, WaMa, TV, die telefonierende Freundin usw.). Diese kann man wohl halbwegs mit Hilfe mehrerer Mikros herausrechnen oder besser gar nicht erst aufnehmen. Gar nicht erst aufnehmen geht am besten mit relativ fest definierten Standorten (z.B. Dein Sofa) und Mikrofonen mit nahezu Richtmikrofonmäßiger Eigenschaft, d.h. Richtcharakteristik mind. Superniere bis Keule.
In Kombination mit anderen, drumherum, in leicht andere Richtungen angebrachten Mikros, die hauptsächlich Nebengeräusche aufnehmen, kann man diese rechnerisch anscheinend weitgehend entfernen. Habe irgendwann mal Werbung für so ein (relativ günstiges) Mikrofon-Array gesehen, kann aber jetzt so schnell nichts ähnliches finden.
Habe eben beim googeln eine interessante Abhandlung namens „Robuste Spracherkennung unter
raumakustischen Umgebungsbedingungen“ gefunden: http://www.qucosa.de/fileadmin/data/qucosa/documents…
Das akustische Problem lässt sich evtl. so halbwegs lösen. Ein anderes Problem ist, dass Du Dir die genaue Folge von Stichworten merken musst, um Funktionen am PC zu aktivieren (zumindest war es noch vor ein paar Jahren so). Ist zwar eine akzeptable Behelfsmöglichkeit, aber schon noch ein ganzes Stück entfernt vom Bord-Computer-Feeling der Enterprise.
Womit willst Du die inhaltliche Erkennung umsetzen? Ich beschäftige mich seit Jahren mit Wissensrepräsentation, so richtig gute Sachen zur flexiblen Erkennung der Bedeutung gibt es da leider momentan noch nicht…
Bin absolut kein Mikro-Profi, Tontechniker o.ä., also auf Verbesserung durch andere Mitposter gefasst. Ich hoffe, ich konnte Dir trotzdem einen Überblick verschaffen.
Super und danke für die schnelle Antwort, hast mir schon mal einen guten Einblick gegeben. So ein Grenzflächenmikrofon (mit Halbkugel Charakteristik)klingt schon mal ziemlich gut, da ich vor hatte das Mirkrofon an der Decke in die Mitte zu plazieren. Allerdings das Hauptproblem mit den Nebengeräuschen müsste man ausprobieren.
Aufmerksam und fasziniert auf die Spracherkennung bin ich eigentlich erst gestern darauf geworden, als ich ein Video von CHIP zum Thema Spracherkennung gesehn hab. http://www.chip.de/c1_videos/Windows-Spracherkennung…
Hab mir das Video angesehen. Ich steh total drauf…
Aber der Sprecher hat nicht umsonst ein Headset an. Bei meinen Tests vor einigen Jahren war mein (extrem billiges) Mikro am Monitor befestigt - hat trotzdem ganz gut funktioniert, habe allerdings direkt vorm PC gesessen.
Hier noch ein Video von Dragon Naturally Speaking (Testsieger beim ComputerBild-Test): http://www.computerbild.de/videos/Diktieren-und-Spra…
Ich schätze, Du hast mich wieder auf den Geschmack gebracht. Muss mich mal wieder drum kümmern.
Man könnte auch so nette Sachen machen, wie einen Simultan-Übersetzer basteln - man spricht einen deutschen Satz und der PC übersetzt ihn über ein Makro per Internet (http://translate.google.de/?hl=de&tab=wT#de|en|Dies%…) und wiederholt den Satz praktisch sofort in einer beliebigen Sprache. Wäre eine spaßige Methode, um Sprachen zu trainieren oder sich mit Leuten aus anderen Ländern sofort unterhalten zu können. Das Ganze in einem guten Smartphone (oder Netbook) wäre eine nette Hilfe im Ausland o.ä… (mal abgesehen, von den teilweise krassen Übersetzungsfehlern…).
Würde mich sehr interessieren, wie es bei Dir mit GrenzflächenMikro o.ä. geklappt hat!
Funkmikros samt Funkboxen in mehreren Räumen wären natürlich das Optimum, geht aber natürlich ins Geld…
Ich werde mir wohl demnächst Naturally Speaking besorgen und mal ein bisschen rumprobieren.
Von der Software hab ich auch schon viel Positives gehört. Allerdings ist die Software ziemlich teuer. Ich werd mich jetzt mal informieren und dann das ganze mal ausprobieren und dir auf jedenfall Bescheid sagen, bis dann das Microsoft System „Natal“ (mitlerweile als „Kinetic“ bekannt)auch für Windows zu kaufen sein wird.
Gibts auch ein Video dazu, sehr interessant: http://www.youtube.com/watch?v=p2qlHoxPioM