Probieren Sie die Speech-APIs aus

Forum

Titel

Beitrag

Microsoft arbeitet mit Hochdruck daran, eine natürliche Kommunikation mit Computersystemen zu ermöglichen. Dazu hat Microsoft jetzt aktuell 22 APIs bereitgestellt, die Entwicklern die Möglichkeit bieten, Anwendungen das Sehen, Hören, Sprechen, Verstehen und Interpretieren menschlicher Bedürfnisse beizubringen. Technisch gesehen handelt es sich bei den APIs um REST-Services.

Microsoft teilt die APIs in folgende Gruppen ein: 
[list] 
Sehen (Vision), 
Hören (Speech), 
Sprache (Language), 
Wissen (Knowledge)
Suche (Search)
[list]

Wer die verschiedenen Speech-APIs auszuprobieren will, empfehle ich folgende Seiten:

[list] 
Spracherkennung [link]https://www.microsoft.com/cognitive-services/en-us/speech-api[link]
Text in Sprache [link]https://www.microsoft.com/cognitive-services/en-us/speech-api[link]
Custom Recognition Intelligent Service (CRIS)[link]https://www.microsoft.com/cognitive-services/en-us/custom-recognition-intelligent-service-cris[link]
Sprechererkennung [link]https://www.microsoft.com/cognitive-services/en-us/speaker-recognition-api[link]
[list]

Wer nicht nur ausprobieren will, sondern tiefer einstiegen will, empfehle ich folgende Seite
[link]https://blogs.windows.com/buildingapps/2016/06/02/using-speech-in-your-uwp-apps-look-whos-talking/[link]

Viel Spaß dabei.

Ich freue mich auf Euer Feedback.

Schlagworte

Bilder und Dateien (*.jpeg, *.jpg, *.png, *.gif, *.pdf)

Diesen Community Beitrag weiterempfehlen