用戶詞典接口擴展 用戶可以動態(tài)增加、刪除用戶詞典中的詞,調(diào)節(jié)分詞的效果。提高了用戶詞典使用的靈活性。 分詞粒度可調(diào) 可以控制分詞結(jié)果的粒度。共享版本提供兩種分詞粒度,標(biāo)準(zhǔn)粒度和粗粒度,滿足不同用戶的需求。 詞性標(biāo)注功能加強 多種標(biāo)注級的選擇,系統(tǒng)可供選擇的標(biāo)注級有:計算所一級標(biāo)注級,計算所二級標(biāo)注集,北大一級標(biāo)注集,北大二級標(biāo)注集。 關(guān)鍵詞提取 自動抽取出能很好地代表文檔主題的若干個詞或短語。關(guān)鍵詞抽取技術(shù)廣泛應(yīng)用于信息檢索、文本分類/聚類、信息過濾、文檔摘要等各種智能文本信息處理領(lǐng)域,具有很好的應(yīng)用價值。 指紋提取 根據(jù)文章的內(nèi)容,結(jié)構(gòu),詞語間的關(guān)系,分析出能夠表示該文章的語義指紋,使用數(shù)字序列表示。