生態(tài)合作

C A S E S H O W

警務(wù)信息采集設(shè)備及系統(tǒng) NLP自然語言處理 NLU自然語言理解正道智能語音識別

NLU自然語言理解

自然語言理解（Natural Language Understanding，NLU）以語言學(xué)為基礎(chǔ)，融合邏輯學(xué)、心理學(xué)和計算機科學(xué)等學(xué)科，試圖解決以下問題：語言究竟是怎樣組織起來傳輸信息的？人又是怎樣從一連串的語言符號中獲取信息的？換種表達(dá)就是，通過語法、語義、語用的分析，獲取自然語言的語義表示。

自然語言理解技術(shù)沉淀

技術(shù)難點的解決過程就是一個技術(shù)沉淀的過程。通過在自然語言理解方向上持續(xù)研究和開發(fā)，我們積累了如下的技術(shù)沉淀：

千萬級的高質(zhì)量知識庫

知識庫的核心節(jié)點是各種詞，而這些詞條散布在互聯(lián)網(wǎng)上的各個地方。通過自己抓取和第三方合作的方式，我們拿到了大量的“毛數(shù)據(jù)”，這些數(shù)據(jù)中含有大量的噪音。為了過濾清洗這些數(shù)據(jù)，我們構(gòu)建了一套集成了多種過濾方法的過濾流程來對這些數(shù)據(jù)進(jìn)行處理。截止目前，我們積累了數(shù)千萬的高質(zhì)量的各種類型的詞條。

支持常見的數(shù)十個領(lǐng)域的理解

通過自然語言處理、機器學(xué)習(xí)、深度神經(jīng)網(wǎng)絡(luò)等算法和大數(shù)據(jù)的使用，目前我們理解的領(lǐng)域有60個左右，其中一些重要的領(lǐng)域如：餐廳、天氣、酒店、休閑娛樂、地圖、快遞、音樂等；

一套可擴展的算法框架

領(lǐng)域的優(yōu)化和擴展是常態(tài)，如果某個領(lǐng)域的優(yōu)化或者新增，會對其他已有的領(lǐng)域的效果造成影響，那這將是一種災(zāi)難。我們建立了各領(lǐng)域獨立的、可擴展的算法框架，各個領(lǐng)域在知識庫、數(shù)據(jù)、模型、算法等方面，都是各自獨立的。

數(shù)據(jù)驅(qū)動的閉環(huán)流程

我們構(gòu)建了如下的閉環(huán)數(shù)據(jù)流程，使得數(shù)據(jù)能夠閉環(huán)流動，隨著用戶的使用，我們不斷收集日志對系統(tǒng)進(jìn)行更新，從而不斷維持和提升系統(tǒng)的效果。