Anwendungs-Software und Apps 14.489 Themen, 73.614 Beiträge

MP3 zu Text

jueki / 5 Antworten / Baumansicht Nickles

Ich habe einen mich interessierenden Diskussionsbeitrag als mp3 vorliegen, möchte den gern gedruckt haben.
Kennt einer von Euch ein geeignetes Tool, mit dem man eine mp3 in Text übersetzen kann?
Der umgedrehte Weg, da gibt es einige.
NetoDragon und ViaVoice bedürfen erst eines umfangreichen Trainings - und sind mir für den einmaligen Gebrauch zu umfangreich.
Wäre nett, wenn es da Hinweise gäbe.

Jürgen

- Nichts ist schwerer und nichts erfordert mehr Charakter, als sich im offenem Gegensatz zu seiner Zeit zu befinden und laut zu sagen "NEIN!" Kurt Tucholsky
bei Antwort benachrichtigen
rill jueki „MP3 zu Text“
Optionen

Wenn ich mich richtig erinnere, hast du auch VISTA - dort ist eine Spracheingabe implementiert. Anstelle eines Mikrofons muß ja auch das Abspielen einer Audiosprachdatei als Eingabe möglich sein (nach entsprechender Konfiguration der Soundkarte/der Spracheingabe). Allerdings habe ich keinerlei Erfahrungen auf diesem Gebiet - ich schlage das nur als Idee vor.

rill

bei Antwort benachrichtigen
jueki rill „VISTA Spracheingabe“
Optionen

ja, das stimmt, ich kann mich erinnern. Aber war das nicht nur in umgekehrter Richtung möglich? Also vorhandenen Text in Sprache wandeln?
Werde ich erforschen, also mal die VISTA- Festplatte in den Wechselrahmen einschieben und damit booten.
Ich hab das Vista ja eigentlich nur um mitreden zu können, damit arbeiten - das tue ich mir nicht an. Außer ab und an mal wieder etwas vergleichen und regelmäßig updaten mache ich da nichts.
DAS wäre allerdings ein echter Fortschritt gegenüber XP. Der Erste wohl, den ich erkenne.
- wenn ich ihn erkenne.

Jürgen

- Nichts ist schwerer und nichts erfordert mehr Charakter, als sich im offenem Gegensatz zu seiner Zeit zu befinden und laut zu sagen "NEIN!" Kurt Tucholsky
bei Antwort benachrichtigen
jueki Nachtrag zu: „ja, das stimmt, ich kann mich erinnern. Aber war das nicht nur in umgekehrter...“
Optionen
Das ist im Dorf Sambia kommend fast auf Anhieb.
Anscheinend werden wir noch eigentlich üben müssen.
Uhr MESTCRM sächsisch und


Das ist der mit dem Spracherkennungsprogramm von Vista (ohne Training) gesprochene Text.
Gesprochen hatte ich:

Das funktioniert ja fast auf Anhieb -Punkt-Neue Zeile-
Anscheinend werden wir da noch erheblich üben müssen -Punkt-Neue Zeile-
Oder mein PC mag kein Sächsisch -Punkt-


Naja, das wäre auch ein echtes Wunder, würde das auf Anhieb und fehlerfrei klappen. (Ich hab das schon mit ViaVoice und NetoDragon unter XP erprobt)
Allerdings scheint es keine Möglichkeit zu geben, eine mp3 anstelle des Micros zu verwenden.
Ich werde das aber mal per Lautsprecher abspielen und dem PC per Micro zuführen. Da bin ich gespannt!
Wird aber erst morgen. Und ich berichte hier darüber.

Jürgen

Edit:
NetoDragon - großer Quatsch. "Dragon Naturally Speaking" ist richtig.
- Nichts ist schwerer und nichts erfordert mehr Charakter, als sich im offenem Gegensatz zu seiner Zeit zu befinden und laut zu sagen "NEIN!" Kurt Tucholsky
bei Antwort benachrichtigen
BigBossBigge jueki „Das ist im Dorf Sambia kommend fast auf Anhieb. Anscheinend werden wir noch...“
Optionen

Und? Was ist nun dabei rausgekommen (würde mich auch mal interessieren)?

Gruß,
BigBossBigge

So long ... BBB
bei Antwort benachrichtigen
jueki Nachtrag zu: „MP3 zu Text“
Optionen

ja alsooooo...
Ich habe es mit einer älteren Version von Dragon Naturally Speaking erprobt - und auch noch mit der Neusten.
Ich habe die erforderliche Datei entsprechend bearbeitet, damit sie von dem Tool akzeptiert wird:
http://www.nickles.de/static_cache/538352602.html
- und es ist eine Freude zu sehen, wie emsig der PC da schreibt und die Worte aneinander reiht.
Ohne Punkt und Komma und Absatz natürlich.
Aber dann kommt das "Große Erwachen".
Fast nichts stimmt.
Obwohl die Sprecherin des Referates ein gepflegtes und ausdrucksstarkes, gut moduliertes Deutsch sprach.
Ich müßte sicher erst den PC mit der Sprecherin trainieren. So, wie ich es für meine Erkennung gemacht hab - die Erkennung meiner sächsisch- untrainierten Sprache war da erheblich höher. Auch wenn es anscheinend schneller geht, 10-Finger-Schreibmaschine zu lernen, als den PC auf wenigstens einigermaßen fehlerfreie Erkennung zu trainieren.
Die mir bekannten und erprobten Methoden mit den genannten Tools sind leider nicht praxistauglich.
Schade.

Jürgen

- Nichts ist schwerer und nichts erfordert mehr Charakter, als sich im offenem Gegensatz zu seiner Zeit zu befinden und laut zu sagen "NEIN!" Kurt Tucholsky
bei Antwort benachrichtigen