ttp://localhost:8080/solr31/update/csv?stream.file=/home/haruyama/work/solr/evaluation_for_tokenizers/data/jawiki.tsv&encapsulator=%ff&separator=%09&commit=true
id [tab] title [tab] text
CPU | Intel(R) Core(TM) i7 CPU 860 @ 2.80GHz |
メモリ | 8GB |
SSD | INTEL SSDSA2M080 |
StandardTokenizer | CJKTokenizer | NGramTokenizer(bi-gram) | |
時間(QTime,mm:ss) | 8:58 | 13:45 | 9:05 |
サイズ(Gbyte) | 6.59 | 7.37 | 6.75 |
NGramTokenizer(tri-gram) | NGramTokenizer(2&3-gram) | |
時間(QTime,mm:ss) | 13:47 | 20:27 |
サイズ(Gbyte) | 7.46 | 9.58 |
JapaneseTokenizer(ipadic,1.0.0) | Japanesetokenizer(naist-chasen,1.0.0) | KuromojiTokenizer | |
時間(QTime,h:mm:ss) | 36:53 | 51:45 | 1:21:48 |
サイズ(Gbyte) | 6.75 | 7.12 | 6.70 |
JapaneseTokenizer&EdgeNGramFilter(ipadic,1~15-gram) | Japanesetokenizer&NGramFilger(ipadic, bi-gram) | |
時間(QTime,mm:ss) | 45:46 | 41:53 |
サイズ(Gbyte) | 8.69 | 6.73 |