本軟件是一個免費、義務(wù)服務(wù)的綠色軟件,設(shè)計的目的是減輕研究者的勞動量。
軟件06年投入使用,07年獲得國家版權(quán),是一個完全免費使用的綠色軟件。經(jīng)過近五年的反復(fù)修改,目前已經(jīng)發(fā)展到3.9.5版本,軟件從3.9.4版本后,為方便研究者,取消了原來的注冊模塊。軟件全面支unicode,3.7版本增強了規(guī)模處理真實文本的能力,可以對目錄下文件夾及子文件夾內(nèi)所有txt文本進(jìn)行窮盡式的讀取,可以對上億的語料進(jìn)行處理,并且進(jìn)行了一系列的優(yōu)化與修改??梢杂媚壳笆褂帽拒浖闹饕巳簽楦咝=處煛⒃谧x博士和碩士生。
軟件曾經(jīng)獲得廣西民族大學(xué)研究生科研創(chuàng)新、廣西民族大學(xué)文學(xué)院研究生一級創(chuàng)新項目經(jīng)費資助。
軟件的主要功能:
1、檢索含有某個關(guān)鍵詞語的句子,同時可按關(guān)鍵詞語左右1-6位排序。
2、成批檢索含有多個關(guān)鍵詞語的句子。
3、智能檢索含有關(guān)聯(lián)詞語的句子,如:不但…而且之類。
4、智能識別多種形式的重疊形式,并且把含有重疊形式的句子檢索出來。
5、正則表達(dá)式檢索,替換。
6、對漢語或者類似于漢語的語料進(jìn)行字頻統(tǒng)計,對英語或者類似于英語的語料進(jìn)行詞頻統(tǒng)計,本軟件已經(jīng)用漢語、藏文等等進(jìn)行測試,均獲得成功。
7、對標(biāo)注詞性的語料(北大標(biāo)準(zhǔn),二級標(biāo)準(zhǔn))可以進(jìn)行詞頻統(tǒng)計,可以檢索多種形式的搭配,比如:動詞+名詞。
8、對英語或都類似于英語的語料進(jìn)行檢索。本軟件已經(jīng)用越南語和泰語進(jìn)行測試,都能正常檢索。
9、對多語平行語料檢索,可以檢索一對一、一對多的平行語料。
10、此外還有其它的一些功能,比如編輯文本,分割文本等等。