中國科學院計算技術(shù)研究所研制的漢語詞法分析系統(tǒng)ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分詞;詞性標注;命名實體識別;新詞識別;同時支持用戶詞典。我們先后精心打造五年,內(nèi)核升級6次,目前已經(jīng)升級到了ICTCLAS3.0。ICTCLAS3.0分詞速度單機996KB/s,分詞精度98.45%,API不超過200KB,各種詞典數(shù)據(jù)壓縮后不到3M,是當前世界上最好的漢語詞法分析器。