⑴ 語音雲的訊飛語音開放介紹
近年來國內外IT巨頭紛紛投入巨資加大對智能語音技術市場的爭奪,科大訊飛作為亞太地區最大的語音上市公司,擁有全球領先的中文智能語音技術,多年來一直致力於研發將語音技術應用到千家萬戶,MSP(iFLY Mobile Speech Platform)便在此背景下誕生。通過MSP,移動互聯網的終端用戶可以隨時隨地的使用語音服務。語音技術帶來品質生活,始終是MSP團隊所堅持不懈的理念。
主要功能
iFLY Mobile Speech Platform(以下簡稱MSP)是一個應用於移動互聯網的語音服務平台,其主要目標是:
1)實現可面向移動2G/3G網路及互聯網提供語音服務的伺服器,在現有科大訊飛電信級語音服務平台ISP基礎上為移動終端應用程序提供多路並發的語音合成、語音識別、語音聽寫功能,通過架設在互聯網的語音應用伺服器,用戶可以隨時隨地獲得高質量的語音服務;
2)實現基於移動終端以及桌面平台的語音應用客戶端,提供統一的語音應用開發介面,通過該介面用戶可以方便、快速地開發語音應用;同時,MSP也將開放一些基於移動以及桌面平台的語音應用,用於展示MSP語音服務平台的功能和使用方法,讓用戶直接體驗到最新的語音技術;
MSP最終提供了架構於互聯網的語音雲服務和一套移動互聯網語音解決方案、應用示例,把語音服務的應用范圍拓寬到移動互聯網領域,為語音服務產品走向移動互聯網市場開辟全新的應用模式。
MSP平台整合了科大訊飛研究院、中國科技大學訊飛語音實驗室以及清華大學訊飛語音實驗室在語音識別、語音合成等技術上多年的技術成果,語音核心技術上達到了國際領先水平。
MSP系統採用分布式架構,繼承了科大訊飛成熟的電信級語音平台高穩定的特點,可以滿足電信級應用的高可靠性、高可用性要求。針對傳統語音應用集成開發困難,業務設計繁瑣的問題,MSP產品大大簡化了集成開發和業務開發的復雜度,為系統集成人員和業務開發人員提供了便捷、高效的開發環境。
MSP作為一個向互聯網和移動互聯網開放的語音引擎,提供了功能完善、簡單易用的集成開發介面,以便開發人員能夠將其與應用程序進行集成,實現具有完整語音能力的應用。MSP提供的主要開發介面從提供功能考慮可以分為語音識別(包含語音聽寫)、語音合成開發
介面和語音檢測開發介面:
1)語音識別開發介面語音識別介面(QISR)是應用開發者使用識別引擎和語音聽寫引擎進行語音應用開發所必需使用的介面,該介面接受用戶輸入的語音,把語音識別結果返回給應用程序。
2)語音合成開發介面語音合成介面(QTTS)可以讓應用開發者在應用程序中集成訊飛語音合成引擎的功能,該介面接受應用程序傳入的文本內容,返回符合應用要求格式的音頻數據。
3)語音檢測開發介面語音檢測(VAD)是語音識別一個重要的輸入環節,用於判斷用戶語音何時開始、何時結束,該介面集成在MSC客戶端內部,通過QISR介面的參數來返回語音狀態。
移動互聯網應用程序需要使用在成千上萬各式各樣的用戶終端之上,用戶終端類型從非智能終端到智能終端、從手機到智能玩具、從PC到互聯網電視,應用操作系統環境形形色色、品類眾多。為了滿足各類客戶端操作系統環境上都能夠使用訊飛語音雲提供的語音功能,MSC為多種終端環境提供了語音開發介面,主要包含Android、iOS、Windows Phone、Windows、Linux、Java、Flash等。
基於訊飛語音雲,第三方開發者可以通過集成SDK,輕松實現產品的語音能力,基於訊飛語音雲誕生了一批有代表性的產品。
訊飛輸入法
全球首創「蜂巢」輸入模型,獨家支持拼音、手寫、語音「雲+端」立體輸入引擎。訊飛輸入法,創造極致輸入體驗!
靈犀語音助手
由科大訊飛和中國移動共同打造的貼心生活小秘書,基於科大訊飛語音雲、語義雲,能夠完美支持普通話及部分方言,更能深入理解用戶的對話,智能的提供相應的服務。靈犀語音助手集打電話、發簡訊、設置提醒、音樂查找與播放、打開應用、餐飲美食、火車航班、查詢天氣、查詢股票、查詢酒店、查詢話費流量等眾多生活領域。
訊飛語音+
面向終端用戶與開發者提供不同的功能。
終端用戶提供的微信輸入助手,通過語音在微信中直接快速輸入文字,讓你成為輸入達人不再是夢!
面向開發者提供語音合成、語音識別、語音喚醒等能力,輕松集成,就能讓你的應用實現能聽會說。