Lucene/Solr のStandardTokenizer

測定結果

Solr 3.1.0

回数時間(QTime,ms)インデックスサイズ(byte)
15393237086500622
25378267086508814
35919717086500622

Solr 1.4.1

回数時間(QTime,ms)インデックスサイズ(byte)
15381437281093446
25326827281093446
35425987281093446

設定

schema.xml
    <fieldType name="text_ja" class="solr.TextField" positionIncrementGap="100">
      <analyzer>
        <tokenizer class="solr.StandardTokenizerFactory"/>
      </analyzer>
    </fieldType>

Tokenizeサンプル

「証明の終わりで用いるQEDって何の略ですか?」「quod erat demonstrandumです。」のTokenize

Solr 3.1



Solr 1.4.1


メンバーのみ編集できます