Sie sind hier
E-Book

Speech Application SDK mit ASP.NET

Design und Implementierung sprachgestützter Web-Applikationen

AutorAchim Zeeck
VerlagSpringer-Verlag
Erscheinungsjahr2006
Seitenanzahl361 Seiten
ISBN9783540280866
FormatPDF
KopierschutzDRM
GerätePC/MAC/eReader/Tablet
Preis46,99 EUR

Das Speech Application SDK ermöglicht den Aufbau von sprachgestützten Web-Applikationen innerhalb des .NET-Frameworks.

Im vorliegenden Buch wird die Implementierung entsprechender Programme anhand fundierter und praxisnaher Code-Beispiele dargestellt. Als Werkzeuge werden das .NET Framework 1.1 und das aktuelle SASDK 1.0 zum Einsatz kommen, wobei die einzelnen Komponenten des Visual Studio 2003 ebenso beschrieben werden wie auch SML (Semantic Markup Language) und SALT (Speech Application Language Tags) sowie JScript/JScript.NET und C#. Hierbei soll das Verständnis dieser Technologien für den Aufbau und Einsatz von sprachgestützten, Web-basierten Applikationen im Vordergrund stehen.

Ferner werden Tipps und Tricks aufgezeigt, die bei der Implementierung unter ASP.NET zu beachten sind. Der Leser sollte nach der Lektüre des Buches in der Lage sein, selbständig sprachgesteuerte Web-Applikationen entwickeln zu können.



Studium der Betriebswirtschaft an der FH Mainz, Fachbereich Wirtschaftsinformatik,
Abteilung Wirtschaftswissenschaften. Abschluß: Diplom-Betriebswirt (FH)

Seit 1983 im IT-Umfeld tätig Sun Certified Java Programmer

Mehrjährige Tätigkeiten in deutschen und amerikanischen Unternehmen als Softwareentwickler, Projektleiter und Trainer, u.a. in den Bereichen Multimedia, Finanzsoftware, Content Management Programmierfokus: Java, C++, C#

Derzeit freiberuflicher Technologieberater, Trainer und Softwareentwickler mit dem Schwerpunkt .NET Fokussierung auf die Bereiche Mobility und Speech Sprecher auf Konferenzen

Veröffentlichung von Artikeln in einschlägigen Fachzeitschriften Co-Initiator und Co-Betreiber der .NET Usergroup Hamburg (INETA member)

Kaufen Sie hier:

Horizontale Tabs

Leseprobe

12 Voice-only Applikationen (S. 285-286)

Voice-only Applikationen sind die „klassische" Umsetzung, wenn es um ausschließlich sprachgestützte Anwendungen geht. Während multimodale Anwendungen derzeit noch nicht so sehr verbreitet sind (aber ein sehr großes Potential bergen), werden Ihnen sicher viele aktuelle Beispiele einfallen, in denen Sie sich schon einmal mithilfe Ihrer Stimme oder per Telefontastatur mit einem Sprachcomputer „unterhalten" haben (oder unterhalten mussten) – entweder bei Buchungen und Reservierungen (Flug/Zug), bei Banktransaktionen oder Serviceanfragen von IT-Dienstleistern. Für den Nutzer dieser Dienste ist es wichtig, komfortabel, sicher und vor allem schnell zum gewünschten Ergebnis zu kommen, da diese Systeme meistens nur unter kostenpflichtigen Servicerufnummern betrieben werden.

12.1 Betrachtung unterschiedlicher Systemtypen
Bei der Entwicklung sprachgestützter Webapplikationen lässt sich keine Aussage über ein pauschales Konzept treffen, sozusagen eine Blaupause, die immer und überall einsetzbar ist. Dazu gibt es zu viele unterschiedliche Einflussfaktoren und entsprechend zahlreiche Varianten für eine Umsetzung. Ein Parameter muss jedoch als Grundlage für die zu entwickelnde Anwendung feststehen: Der Systemtyp, dessen Festlegung maßgeblich Einfluss auf die weitere Gestaltung hat. Nachfolgend werden die wesentlichen Systemtypen des Oberbegriffs „Voice-only Applikation" betrachtet.

Dual tone multi frequency (DTMF)

Anwender, die in Kontakt mit einem DTMF-Interface treten, haben in der Regel nur über das Tastentelefon (bzw. dessen Töne) die Möglichkeit, innerhalb der Anwendung zu navigieren. Geführt werden Sie durch Sprachausgaben mit einer natürlich oder – immer seltener – synthetisch klingenden Stimme.

Interactive voice response (IVR)

Diese Systeme werden meistens mit DTMF-Anwendungen gleichgesetzt, auch sie reagieren auf Tastentöne und erlauben manchmal zusätzlich die Eingabe von Sprachbefehlen. Ein IVR ist normalerweise die Vorstufe zu einem Callcenter, um einerseits vor der Weiterleitung an einen Agenten (Sachbearbeiter) gezielte Informationen zu kanalisieren und andererseits die Mitarbeiter sowie die Vermittlung zu entlasten.

Natural language (NL)

Natürlichsprachliche Dialogsysteme (Konversationssysteme) sind die bislang am weitesten entwickelte Form der Mensch-Maschine-Kommunikation auf sprachlicher Basis. Der größte Vorteil ist der – wie der Name bereits ausdrückt – natürliche Austausch von Informationen, genauer gesagt, die Art und Weise, wie Mensch und Maschine miteinander umgehen. Durch entsprechend umfangreiche Grammatikbibliotheken sind die NLSysteme (oder auch NDS) in der Lage, aus längeren Sätzen die relevanten Kerninformationen herauszufiltern und zu verarbeiten. Im Gegenzug wird der Anwender nicht mit stakkatoartigen Befehlen oder Ansagen konfrontiert, sondern ebenfalls mit umgangssprachlichen Sätzen. Die Aufzeichnungen sind oft sehr hochwertig und von professionellen Sprechern vorbereitet, was diese Systeme zusätzlich aufwertet.

Multimodal open microphone

Die Zukunft wird sicherlich in der Nutzung multimodaler Anwendungen unter Einsatz völlig freier, umgangssprachlicher Sätze bestehen, und zwar zu jeder Zeit an jedem Ort mit jedem sprach- und webtauglichen (mobilen) Gerät. Bislang scheitet die Umsetzung sowohl an den Bandbreiten als auch an den zur Verfügung stehenden Geräten, außerdem sind viele technische Voraussetzungen noch unklar, unter anderem Sicherheitsaspekte (security options), Personalisierung, Transaktionsverwaltung (transaction handling) oder auch Sitzungsmanagement (session management). Doch durch die rapide Entwicklung in diesen Segmenten – zum Beispiel im Bereich Voice over IP (VoIP) oder drahtlosen Netzen (WLANs) – und der zunehmenden Miniaturisierung wird es diese Systeme wohl in absehbarerer Zukunft zu erschwinglichen Preisen und in tragbaren Kleidungsstücken eingenäht geben, vielleicht die Killerapplikation der nächsten Jahre?

Inhaltsverzeichnis
Widmung6
Vorwort8
Inhaltsverzeichnis10
1 Spracherkennung und Sprachsteuerung18
1.1 Entwicklung der Spracherkennungssysteme19
1.2 Desktopbasierte Sprachsteuerung20
1.3 Webbasierte Sprachsteuerung21
1.4 Erweiterungen von Webseiten durch SALT21
1.5 Vergleichende Betrachtung von SALT und VoiceXML23
Teil 1 Das Speech Application SDK ( SASDK)26
2 Entwicklungshistorie28
2.1 Von COM zu .NET28
2.2 Die Entwicklung des SASDK30
2.3 Microsoft Speech Server (SES, TAS und TIM)35
3 Überblick über die Einsatzmöglichkeiten38
3.1 Multimodale Applikationen38
3.2 Voice-only Applikationen40
3.3 DTMF-Applikationen45
4 Installation und Anpassung48
4.1 Hardware- und Softwarevoraussetzungen48
4.2 Installation von EIF und SASDK50
5 Speech Controls im Visual Studio .NET60
5.1 Basic Speech Controls60
5.2 Dialog Speech Controls73
5.3 Application Speech Controls95
5.4 Call Management Controls121
6 Wizards, Editors und andere Tools136
6.1 Erstellen des Applikationsgerüsts136
6.2 Integrierte Tools139
6.3 Externe Tools158
Teil 2 Programmieren mit dem SASDK172
7 Sprachverarbeitung und Debugging174
7.1 Speech Application Language Tags (SALT)174
7.2 Laufzeitobjekte182
7.3 Scriptfunktionen190
7.4 Debugging195
7.5 Benutzereingaben197
8 Überprüfen von Eingaben214
8.1 Integrierte Validierung214
8.2 Vergleichende Validierung221
8.3 Benutzerdefinierte Validierung222
9 Arbeiten mit Grammatiken226
9.1 Das XML Grammar Format226
9.2 Grammatikelemente und Zuordnungen227
9.3 Aufbau einer SML-Grammatikstruktur235
9.4 Testen und Zuordnen von Grammatiken241
9.5 SML-Struktur und XPath244
9.6 Die Speech Grammar Libraries246
10 Prompts und die Prompt-Datenbank248
10.1 Synthetische Prompts249
10.2 Natürlichsprachliche Prompts251
10.3 Arbeiten mit Prompt-Funktionen274
10.4 Prompt-Optionen in Speech Controls279
10.5 Verwendung spezieller Prompt Controls283
Teil 3 Designkriterien und Best Practices292
11 Multimodale Applikationen294
11.1 Unterschiede zu Telefonieapplikationen294
11.2 Typische Umsetzungsvarianten295
11.3 Zusätzliche Anwendungsoptionen295
11.4 Anforderungs- und Umsetzungskriterien296
12 Voice-only Applikationen300
12.1 Betrachtung unterschiedlicher Systemtypen300
12.2 Der Projektlebenszyklus301
12.3 Dialogorganisation und Dialogfluss306
13 Tuning, Tipps und Tricks316
13.1 TASim und die Speech Debugging Console316
13.2 Optimieren der Qualität natürlichsprachlicher Prompts316
13.3 Kompilieren von Grammatikdateien317
13.4 Weitere Einsatzmöglichkeiten bei Grammatiken319
13.5 Verbessern der Erkennungsrate321
13.6 Normalisierung von Daten325
13.7 Globale Applikationseinstellungen328
Anhang A Speech Controls Einstellungen und Parameter332
14 Timeouts334
14.1 InitialTimeout335
14.2 BabbleTimeout335
14.3 EndSilence336
14.4 MaxTimeout336
14.5 FirstInitialTimeout337
14.6 ShortInitialTimeout337
14.7 Timer338
15 Events340
15.1 Client-side events340
15.2 Server-side events351
16 Thresholds356
16.1 ConfirmThreshold356
16.2 ConfirmRejectThreshold357
16.3 RejectThreshold357
16.4 AcceptRejectThreshold358
16.5 DenyRejectThreshold358
16.6 AcceptCommandThreshold359
Anhang B Webverweise360
Anhang C Index364

Weitere E-Books zum Thema: Programmiersprachen - Softwareentwicklung

Kombination aus Produkt und Dienstleistung

E-Book Kombination aus Produkt und Dienstleistung
Potentiale für Unternehmen aus der Unterhaltungselektronikbranche Format: PDF

Inhaltsangabe:Einleitung: Für Unternehmen des produzierenden Gewerbes wird es immer schwieriger nachhaltige Wettbewerbsvorteile allein über Produkte zu erzielen. Wettbewerbsvorteile ergeben sich aus…

Apps effektiv managen und vermarkten

E-Book Apps effektiv managen und vermarkten
Die eigene App erfolgreich veröffentlichen: Von der Konzeption bis zur Vermarktung Format: PDF

Lernen Sie Ihre App effektiv, strukturiert und begeisternd weltweit zu vermarkten. In diesem praxisorientierten Buch erhalten Sie einen prägnanten Überblick von der Idee und Konzeption einer App,…

Management von IT-Projekten

E-Book Management von IT-Projekten
Von der Planung zur Realisierung Format: PDF

Projektmanagement (PM) wird immer noch zu selten und zu inkonsequent eingesetzt. Viele problematische Projekte sprechen eine eindeutige Sprache. Kenntnisse des PM und seine Anwendungsmöglichkeiten…

Python 3 - Intensivkurs

E-Book Python 3 - Intensivkurs
Projekte erfolgreich realisieren Format: PDF

Python ist eine vollwertige Programmiersprache, mit der sich auch größere Anwendungen entwickeln lassen. In den letzten Jahren hat sie an Beliebtheit gewonnen, und mit Python 3 steht eine stark…

Fundiert entscheiden

E-Book Fundiert entscheiden
Ein kleines Handbuch für alle Lebenslagen Format: PDF

Orientierungshilfe in postfaktischen Zeiten Dieses Buch ist ein Rettungsanker in der Flut der Informationen, die ununterbrochen auf uns einströmen. Tag für Tag müssen Sie sich Meinungen bilden, sei…

Management von IT-Projekten

E-Book Management von IT-Projekten
Von der Planung zur Realisierung Format: PDF

Projektmanagement (PM) wird immer noch zu selten und zu inkonsequent eingesetzt. Viele problematische Projekte sprechen eine eindeutige Sprache. Kenntnisse des PM und seine Anwendungsmöglichkeiten…

Management von IT-Projekten

E-Book Management von IT-Projekten
Von der Planung zur Realisierung Format: PDF

Auch wenn Verfahren des Projektmanagements noch immer nicht konsequent eingesetzt werden - gerade für IT-Manager und IT-Entwickler sind Kenntnisse des Projektmanagements und seiner…

Big Data Analysen

E-Book Big Data Analysen
Für den schnellen Einstieg Format: ePUB

Big Data ist ein aktuelles Trendthema, doch was versteckt sich dahinter? Big Data beschreibt Daten, die gross oder schnelllebig sind. Big Data bedeutet aber auch, sich mit vielfältigen Datenquellen…

Big Data Analysen

E-Book Big Data Analysen
Für den schnellen Einstieg - SoftwaretechnikISSN  Format: PDF

Big Data ist ein aktuelles Trendthema, doch was versteckt sich dahinter? Big Data beschreibt Daten, die gross oder schnelllebig sind. Big Data bedeutet aber auch, sich mit vielfältigen Datenquellen…

Weitere Zeitschriften

BMW Magazin

BMW Magazin

Unter dem Motto „DRIVEN" steht das BMW Magazin für Antrieb, Leidenschaft und Energie − und die Haltung, im Leben niemals stehen zu bleiben.Das Kundenmagazin der BMW AG inszeniert die neuesten ...

Computerwoche

Computerwoche

Die COMPUTERWOCHE berichtet schnell und detailliert über alle Belange der Informations- und Kommunikationstechnik in Unternehmen – über Trends, neue Technologien, Produkte und Märkte. IT-Manager ...

dental:spiegel

dental:spiegel

dental:spiegel - Das Magazin für das erfolgreiche Praxisteam. Der dental:spiegel gehört zu den Top 5 der reichweitenstärksten Fachzeitschriften für Zahnärzte in Deutschland (laut LA-DENT 2011 ...

Euro am Sonntag

Euro am Sonntag

Deutschlands aktuelleste Finanz-Wochenzeitung Jede Woche neu bietet €uro am Sonntag Antworten auf die wichtigsten Fragen zu den Themen Geldanlage und Vermögensaufbau. Auch komplexe Sachverhalte ...

F- 40

F- 40

Die Flugzeuge der Bundeswehr, Die F-40 Reihe behandelt das eingesetzte Fluggerät der Bundeswehr seit dem Aufbau von Luftwaffe, Heer und Marine. Jede Ausgabe befasst sich mit der genaue Entwicklungs- ...