亚洲处破女a片60分钟_国产精品亚洲国产在 _99e热久久免费精品首页_天堂tv在线高清在线观看_国产亚洲精品美女久久

專(zhuān)業(yè)下載站,下載軟件就到188下載站

188軟件園

您的位置: 188軟件園>編程軟件>編程控件  > 

LJParser文本搜索與挖掘開(kāi)發(fā)平臺(tái)

  • 軟件大?。?span itemprop="fileSize">17.67MB
  • 更新日期:17-02-01
  • 軟件語(yǔ)言:簡(jiǎn)體中文
  • 軟件類(lèi)別:編程控件
  • 軟件授權(quán):共享軟件
  • 適用平臺(tái):Winxp/vista/win7/2000/2003
  • 安全檢測(cè): 360安全衛(wèi)士 360殺毒 電腦管家
軟件介紹 人氣軟件 網(wǎng)友評(píng)論 下載地址

為您推薦: 小智桌面 網(wǎng)易云音樂(lè) 福昕PDF閱讀器 格式工廠 稿定設(shè)計(jì)

LJParser文本搜索與挖掘開(kāi)發(fā)平臺(tái) 一、簡(jiǎn)介 LJParser文本搜索與挖掘開(kāi)發(fā)平臺(tái)包括:全文精準(zhǔn)搜索,新詞發(fā)現(xiàn),漢語(yǔ)分詞標(biāo)注,詞語(yǔ)統(tǒng)計(jì)與術(shù)語(yǔ)翻譯,自動(dòng)聚類(lèi)與熱點(diǎn)發(fā)現(xiàn),分類(lèi)過(guò)濾,自動(dòng)摘要,關(guān)鍵詞提取,文檔去重,正文提取等十余項(xiàng)功能。針對(duì)互聯(lián)網(wǎng)內(nèi)容處理的需要,融合了自然語(yǔ)言理解、網(wǎng)絡(luò)搜索和文本挖掘的技術(shù),提供了用于技術(shù)二次開(kāi)發(fā)的基礎(chǔ)工具集。開(kāi)發(fā)平臺(tái)由多個(gè)中間件組成,各個(gè)中間件API可以無(wú)縫地融合到客戶(hù)的各類(lèi)復(fù)雜應(yīng)用系統(tǒng)之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系統(tǒng)平臺(tái),可以供Java,C,C#等各類(lèi)開(kāi)發(fā)語(yǔ)言使用。 LJParser是一套專(zhuān)門(mén)針對(duì)原始文本集進(jìn)行處理和加工的軟件,提供了中間件處理效果的可視化展示,也可以作為小規(guī)模數(shù)據(jù)的處理加工工具。用戶(hù)可以使用該軟件對(duì)自己的數(shù)據(jù)進(jìn)行處理。   二、功能    LJParser文本搜索與挖掘開(kāi)發(fā)平臺(tái)的十大功能: 1. 全文精準(zhǔn)檢索 支持文本、數(shù)字、日期、字符串等各種數(shù)據(jù)類(lèi)型,多字段的高效搜索,支持AND/OR/NOT以及NEAR鄰近等查詢(xún)語(yǔ)法,支持維語(yǔ)、藏語(yǔ)、蒙語(yǔ)、阿拉伯、韓語(yǔ)等多種少數(shù)民族語(yǔ)言的檢索??梢詿o(wú)縫地與現(xiàn)有文本處理系統(tǒng)與數(shù)據(jù)庫(kù)系統(tǒng)融合。 2. 新詞發(fā)現(xiàn): 從文件集合中挖掘出內(nèi)涵的新詞語(yǔ)列表,可以用于用戶(hù)專(zhuān)業(yè)詞典的編撰;還可以進(jìn)一步編輯標(biāo)注,導(dǎo)入分詞詞典中,從而提高分詞系統(tǒng)的準(zhǔn)確度,并適應(yīng)新的語(yǔ)言變化。 3. 分詞標(biāo)注: 對(duì)原始語(yǔ)料進(jìn)行分詞、自動(dòng)識(shí)別人名地名機(jī)構(gòu)名等未登錄詞、新詞標(biāo)注以及詞性標(biāo)注。并可在分析過(guò)程中,導(dǎo)入用戶(hù)定義的詞典。 4. 統(tǒng)計(jì)分析與術(shù)語(yǔ)翻譯 針對(duì)切分標(biāo)注結(jié)果,系統(tǒng)可以自動(dòng)地進(jìn)行一元詞頻統(tǒng)計(jì)、二元詞語(yǔ)轉(zhuǎn)移概率統(tǒng)計(jì)(統(tǒng)計(jì)兩個(gè)詞左右連接的頻次即概率)。針對(duì)常用的術(shù)語(yǔ),會(huì)自動(dòng)給出相應(yīng)的英文解釋。 5. 文本聚類(lèi)及熱點(diǎn)分析 能夠從大規(guī)模數(shù)據(jù)中自動(dòng)分析出熱點(diǎn)事件,并提供事件話(huà)題的關(guān)鍵特征描述。同時(shí)適用于長(zhǎng)文本和短信、微博等短文本的熱點(diǎn)分析。 6. 分類(lèi)過(guò)濾 針對(duì)事先指定的規(guī)則和示例樣本,系統(tǒng)自動(dòng)從海量文檔中篩選出符合需求的樣本。 7. 自動(dòng)摘要 能夠?qū)纹蚨嗥恼?,自?dòng)提煉出內(nèi)容的精華,方便用戶(hù)快速瀏覽文本內(nèi)容。 8. 關(guān)鍵詞提取 能夠?qū)纹恼禄蛭恼录希崛〕鋈舾蓚€(gè)代表文章中心思想的詞匯或短語(yǔ),可用于精化閱讀、語(yǔ)義查詢(xún)和快速匹配等。 9. 文檔去重 能夠快速準(zhǔn)確地判斷文件集合或數(shù)據(jù)庫(kù)中是否存在相同或相似內(nèi)容的記錄,同時(shí)找出所有的重復(fù)記錄。 10. HTML正文提取 自動(dòng)剔除導(dǎo)航性質(zhì)的網(wǎng)頁(yè),剔除網(wǎng)頁(yè)中的HTML標(biāo)簽和導(dǎo)航、廣告等干擾性文字,返回有價(jià)值的正文內(nèi)容。適用于大規(guī)模互聯(lián)網(wǎng)信息的預(yù)處理和分析。   三、文件說(shuō)明   1. LJParser.exe 可執(zhí)行文件,本版本為試用版本,大規(guī)模語(yǔ)料處理需要購(gòu)買(mǎi)正式版 2. 演示語(yǔ)料 演示用語(yǔ)料,用戶(hù)可替換,必須為文本文件,演示只支持GBK;正式版本可以支持UTF-8編碼; 3. 各種dll為各組件的調(diào)用接口,本演示程序全部基于已有的調(diào)用接口實(shí)現(xiàn); 4. 文檔說(shuō)明,參見(jiàn)當(dāng)前目錄下的 5. 白皮書(shū)下載:http://www.lingjoin.com/download/LJParser%20Manual.doc 6. 軟件下載:http://www.lingjoin.com/download/LJParser.rar

相關(guān)文章

網(wǎng)友評(píng)論

您的評(píng)論需要經(jīng)過(guò)審核才能顯示 網(wǎng)名

0條評(píng)論>網(wǎng)友評(píng)論





LJParser文本搜索與挖掘開(kāi)發(fā)平臺(tái)

LJParser文本搜索與挖掘開(kāi)發(fā)平臺(tái)