How to use
reset
method
in
org.apache.lucene.analysis.standard.StandardTokenizer

Best Java code snippets using org.apache.lucene.analysis.standard.StandardTokenizer.reset (Showing top 9 results out of 315)

public void reset(Reader reader) throws IOException {
  input = reader;
  reset();
}

public void reset(Reader reader) throws IOException {
  input = reader;
  reset();
}

 @Override
 public void reset(Reader reader) throws IOException {
  super.reset(new HTMLStripReader(reader));
 }
};

  /**
   *
   * @param input
   * @return a list of lower-case tokens which strips accents & punctuation
   * @throws IOException
   */
  public static List<String> getTokensFromAnalyzer(String input) {
    StandardTokenizer tokenStream = new StandardTokenizer(new StringReader(input));
    TokenStream result = new StandardFilter(tokenStream);
    result = new LowerCaseFilter(result);
    result = new ASCIIFoldingFilter(result);
    CharTermAttribute charTermAttribute = result.addAttribute(CharTermAttribute.class);
    List<String> termList = new ArrayList<String>();
    try {
      tokenStream.reset();
      while (result.incrementToken()) {
        String term = charTermAttribute.toString();
        termList.add(term);
      }
      result.close();
    } catch (IOException e) {
      LOGGER.debug(e.getMessage(), e);
    }
    return termList;
  }
}

@Override
public final TokenStream reusableTokenStream(String fieldName, Reader reader) throws IOException
{
  SavedStreams streams = (SavedStreams) getPreviousTokenStream();
  if (streams == null)
  {
    streams = new SavedStreams();
    setPreviousTokenStream(streams);
    streams.tokenStream = tokenize(reader);
    streams.filteredTokenStream = tokenFiltersChain(streams.tokenStream);
  }
  else
  {
    streams.tokenStream.reset(reader);
  }
  return streams.filteredTokenStream;
}

tokenizer.close();
tokenizer.setReader(stringReader);
tokenizer.reset();
while ( tokenizer.incrementToken() ) {
  final CharTermAttribute charTermAttribute

try {
  tokenizer.setReader(stringReader);
  tokenizer.reset();
  while ( tokenizer.incrementToken() ) {
    final CharTermAttribute charTermAttribute

public TokenStream reusableTokenStream(String fieldName, Reader reader) throws IOException {
 SavedStreams streams = (SavedStreams) getPreviousTokenStream();
 if (streams == null) {
  streams = new SavedStreams();
  setPreviousTokenStream(streams);
  streams.tokenStream = new StandardTokenizer(reader);
  streams.filteredTokenStream = new StandardFilter(streams.tokenStream);
  streams.filteredTokenStream = new LowerCaseFilter(streams.filteredTokenStream);
  streams.filteredTokenStream = new StopFilter(streams.filteredTokenStream, stopSet);
 } else {
  streams.tokenStream.reset(reader);
 }
 streams.tokenStream.setMaxTokenLength(maxTokenLength);
 
 streams.tokenStream.setReplaceInvalidAcronym(replaceInvalidAcronym);
 return streams.filteredTokenStream;
}

public TokenStream reusableTokenStream(String fieldName, Reader reader) throws IOException {
 SavedStreams streams = (SavedStreams) getPreviousTokenStream();
 if (streams == null) {
  streams = new SavedStreams();
  setPreviousTokenStream(streams);
  streams.tokenStream = new StandardTokenizer(reader);
  streams.filteredTokenStream = new StandardFilter(streams.tokenStream);
  streams.filteredTokenStream = new LowerCaseFilter(streams.filteredTokenStream);
  streams.filteredTokenStream = new StopFilter(streams.filteredTokenStream, stopSet);
 } else {
  streams.tokenStream.reset(reader);
 }
 streams.tokenStream.setMaxTokenLength(maxTokenLength);
 
 streams.tokenStream.setReplaceInvalidAcronym(replaceInvalidAcronym);
 return streams.filteredTokenStream;
}

Popular methods of StandardTokenizer

<init>
setMaxTokenLength
Set the max allowed token length. No tokens longer than this are emitted.
clearAttributes
correctOffset
init
setReader
close
getAttribute
incrementToken
setReplaceInvalidAcronym
generateParseException
jj_consume_token

Popular in Java

Updating database using SQL prepared statement
addToBackStack (FragmentTransaction)
scheduleAtFixedRate (Timer)
notifyDataSetChanged (ArrayAdapter)
ByteBuffer (java.nio)
A buffer for bytes. A byte buffer can be created in either one of the following ways: * #allocate
SimpleDateFormat (java.text)
Formats and parses dates in a locale-sensitive manner. Formatting turns a Date into a String, and pa
Semaphore (java.util.concurrent)
A counting semaphore. Conceptually, a semaphore maintains a set of permits. Each #acquire blocks if
Pattern (java.util.regex)
Patterns are compiled regular expressions. In many cases, convenience methods such as String#matches
XPath (javax.xml.xpath)
XPath provides access to the XPath evaluation environment and expressions. Evaluation of XPath Expr
Font (java.awt)
The Font class represents fonts, which are used to render text in a visible way. A font provides the
Top Vim plugins

How to use resetmethodin org.apache.lucene.analysis.standard.StandardTokenizer

Best Java code snippets using org.apache.lucene.analysis.standard.StandardTokenizer.reset (Showing top 9 results out of 315)

How to use
reset
method
in
org.apache.lucene.analysis.standard.StandardTokenizer