org.apache.lucene.analysis.Analyzer.reusableTokenStream java code examples

  tokReader = new StringReader(field.stringValue());
tokens = analyzer.reusableTokenStream(field.name(), tokReader);

@Override
public final TokenStream reusableTokenStream(String fieldName, Reader reader) throws IOException
{
  return super.reusableTokenStream(fieldName, reader);
}

  @Override
  public final TokenStream reusableTokenStream(String fieldName, Reader reader) throws IOException
  {
    return super.reusableTokenStream(fieldName, reader);
  }
}

@Override
public final TokenStream reusableTokenStream(String fieldName, Reader reader) throws IOException
{
  return super.reusableTokenStream(fieldName, reader);
}

public TokenStream reusableTokenStream(String fieldName, Reader reader) throws IOException {
 Analyzer analyzer = (Analyzer) analyzerMap.get(fieldName);
 if (analyzer == null)
  analyzer = defaultAnalyzer;
 return analyzer.reusableTokenStream(fieldName, reader);
}

public TokenStream reusableTokenStream(String fieldName, Reader reader) throws IOException {
 Analyzer analyzer = (Analyzer) analyzerMap.get(fieldName);
 if (analyzer == null)
  analyzer = defaultAnalyzer;
 return analyzer.reusableTokenStream(fieldName, reader);
}

  @Override
  public final TokenStream reusableTokenStream(String fieldName, Reader reader)
      throws IOException {
    if (indexingConfig != null) {
      Analyzer propertyAnalyzer = indexingConfig.getPropertyAnalyzer(fieldName);
      if (propertyAnalyzer != null) {
        return propertyAnalyzer.reusableTokenStream(fieldName, reader);
      }
    }
    return defaultAnalyzer.reusableTokenStream(fieldName, reader);
  }
}

  @Override
  public final TokenStream reusableTokenStream(String fieldName, Reader reader)
      throws IOException {
    if (indexingConfig != null) {
      Analyzer propertyAnalyzer = indexingConfig.getPropertyAnalyzer(fieldName);
      if (propertyAnalyzer != null) {
        return propertyAnalyzer.reusableTokenStream(fieldName, reader);
      }
    }
    return defaultAnalyzer.reusableTokenStream(fieldName, reader);
  }
}

  @Override
  public final TokenStream reusableTokenStream(final String fieldName, final Reader reader) throws IOException
  {
    if (isPhraseQuerySupportField(fieldName))
    {
      return PHRASE_QUERY_SUPPORT_TEXT_FIELD_ANALYZER.reusableTokenStream(fieldName, reader);
    }
    else
    {
      return TEXT_FIELD_INDEXING_ANALYZER.reusableTokenStream(fieldName, reader);
    }
  }
}

public TokenStream reusableTokenStream(String fieldName, Reader reader) throws IOException {
  TokenStream retVal = analyzer.reusableTokenStream(fieldName, reader);
  return wrapTokenStreamIfNeeded(fieldName, retVal);
}

@Override
public TokenStream reusableTokenStream(String fieldName, Reader reader) throws IOException {
 return getAnalyzer(fieldName).reusableTokenStream(fieldName,reader);
}

private Collection<Token> getTokens(String q, Analyzer analyzer) throws IOException {
 Collection<Token> result = new ArrayList<Token>();
 Token token = null;
 TokenStream ts = analyzer.reusableTokenStream("", new StringReader(q));
 ts.reset();
 while ((token = ts.next()) != null){
  result.add(token);
 }
 return result;
}

@Override
public TokenStream reusableTokenStream( String field, Reader reader )
  throws IOException
{
  if ( !isTextField( field ) )
  {
    return new CharTokenizer( reader )
    {
      @Override
      protected boolean isTokenChar( char c )
      {
        return Character.isLetterOrDigit( c );
      }
      @Override
      protected char normalize( char c )
      {
        return Character.toLowerCase( c );
      }
    };
  }
  else
  {
    return DEFAULT_ANALYZER.reusableTokenStream( field, reader );
  }
}

@Override
public TokenStream tokenStream(String fieldName, Reader reader) {
 TokenStream result;
 try {
  result = delegate.reusableTokenStream(fieldName, reader);
 } catch (IOException e) {
  result = delegate.tokenStream(fieldName, reader);
 }
 Set<String> stopWords = stopWordsPerField.get(fieldName);
 if (stopWords != null) {
  result = new StopFilter(matchVersion, result, stopWords);
 }
 return result;
}

/**
 * Converts the original query string to a collection of Lucene Tokens.
 * @param original the original query string
 * @return a Collection of Lucene Tokens
 */
public Collection<Token> convert(String original) {
 if (original == null) { // this can happen with q.alt = and no query
  return Collections.emptyList();
 }
 Collection<Token> result = new ArrayList<Token>();
 //TODO: Extract the words using a simple regex, but not query stuff, and then analyze them to produce the token stream
 Matcher matcher = QUERY_REGEX.matcher(original);
 TokenStream stream;
 while (matcher.find()) {
  String word = matcher.group(0);
  if (word.equals("AND") == false && word.equals("OR") == false) {
   try {
    stream = analyzer.reusableTokenStream("", new StringReader(word));
    Token token;
    while ((token = stream.next()) != null) {
     token.setStartOffset(matcher.start());
     token.setEndOffset(matcher.end());
     result.add(token);
    }
   } catch (IOException e) {
   }
  }
 }
 return result;
}

 private TokenStream createAnalyzerTStream(IndexSchema schema, String fieldName, String docText) throws IOException {

  TokenStream tstream;
  TokenStream ts = schema.getAnalyzer().reusableTokenStream(fieldName, new StringReader(docText));
  ts.reset();
  tstream = new TokenOrderingFilter(ts, 10);
  return tstream;
 }
}

String getAnalyzedQuery( String query ) throws IOException
{
 if( analyzer == null ) {
  return query;
 }
 StringBuilder norm = new StringBuilder();
 TokenStream tokens = analyzer.reusableTokenStream( "", new StringReader( query ) );
 tokens.reset();
 
 Token token = tokens.next();
 while( token != null ) {
  norm.append( new String(token.termBuffer(), 0, token.termLength()) );
  token = tokens.next();
 }
 return norm.toString();
}

TokenStream ts = analyzer.reusableTokenStream("", new StringReader(text));
CharTermAttribute termAtt = ts.addAttribute(CharTermAttribute.class);
PositionIncrementAttribute posIncAtt = ts.addAttribute(PositionIncrementAttribute.class);

 @Override
 public TokenStream reusableTokenStream(String fieldName, Reader reader) throws IOException {
  SavedStreams streams = (SavedStreams) getPreviousTokenStream();
  if (streams == null) {
   streams = new SavedStreams();
   streams.wrapped = defaultAnalyzer.reusableTokenStream(fieldName, reader);
   streams.shingle = new ShingleFilter(streams.wrapped);
   setPreviousTokenStream(streams);
  } else {
   TokenStream result = defaultAnalyzer.reusableTokenStream(fieldName, reader);
   if (result != streams.wrapped) {
    /* the wrapped analyzer did not, create a new shingle around the new one */
    streams.wrapped = result;
    streams.shingle = new ShingleFilter(streams.wrapped);
   }
  }
  streams.shingle.setMaxShingleSize(maxShingleSize);
  streams.shingle.setMinShingleSize(minShingleSize);
  streams.shingle.setTokenSeparator(tokenSeparator);
  streams.shingle.setOutputUnigrams(outputUnigrams);
  streams.shingle.setOutputUnigramsIfNoShingles(outputUnigramsIfNoShingles);
  return streams.shingle;
 }
}

@Override
public TokenStream tokenStream(String fieldName, Reader reader) {
 TokenStream wrapped;
 try {
  wrapped = defaultAnalyzer.reusableTokenStream(fieldName, reader);
 } catch (IOException e) {
  wrapped = defaultAnalyzer.tokenStream(fieldName, reader);
 }
 ShingleFilter filter = new ShingleFilter(wrapped, minShingleSize, maxShingleSize);
 filter.setMinShingleSize(minShingleSize);
 filter.setMaxShingleSize(maxShingleSize);
 filter.setTokenSeparator(tokenSeparator);
 filter.setOutputUnigrams(outputUnigrams);
 filter.setOutputUnigramsIfNoShingles(outputUnigramsIfNoShingles);
 return filter;
}

Javadoc

Creates a TokenStream that is allowed to be re-used from the previous time that the same thread called this method. Callers that do not need to use more than one TokenStream at the same time from this analyzer should use this method for better performance.

Popular methods of Analyzer

tokenStream
Returns a TokenStream suitable for fieldName, tokenizing the contents of text. This method uses #cr
close
Frees persistent resources used by this Analyzer
getPositionIncrementGap
Invoked before indexing a IndexableField instance if terms have already been added to that field. Th
getOffsetGap
Just like #getPositionIncrementGap, except for Token offsets instead. By default this returns 1. Thi
getReuseStrategy
Returns the used ReuseStrategy.
normalize
Wrap the given TokenStream in order to apply normalization filters. The default implementation retur
createComponents
Creates a new TokenStreamComponents instance for this analyzer.
initReader
Override this if you want to add a CharFilter chain. The default implementation returns reader uncha
setVersion
Set the version of Lucene this analyzer should mimic the behavior for for analysis.
attributeFactory
Return the AttributeFactory to be used for #tokenStream and #normalize(String,String) on the given F
initReaderForNormalization
Wrap the given Reader with CharFilters that make sense for normalization. This is typically a subset
getClass

Popular in Java

Finding current android device location
getOriginalFilename (MultipartFile)
Return the original filename in the client's filesystem.This may contain path information depending
runOnUiThread (Activity)
getSupportFragmentManager (FragmentActivity)
Thread (java.lang)
A thread is a thread of execution in a program. The Java Virtual Machine allows an application to ha
URLConnection (java.net)
A connection to a URL for reading or writing. For HTTP connections, see HttpURLConnection for docume
UnknownHostException (java.net)
Thrown when a hostname can not be resolved.
Map (java.util)
A Map is a data structure consisting of a set of keys and values in which each key is mapped to a si
LoggerFactory (org.slf4j)
The LoggerFactory is a utility class producing Loggers for various logging APIs, most notably for lo
Annotation (javassist.bytecode.annotation)
The annotation structure.An instance of this class is returned bygetAnnotations() in AnnotationsAttr
From CI to AI: The AI layer in your organization

How to use reusableTokenStreammethodin org.apache.lucene.analysis.Analyzer

Best Java code snippets using org.apache.lucene.analysis.Analyzer.reusableTokenStream (Showing top 20 results out of 315)

How to use
reusableTokenStream
method
in
org.apache.lucene.analysis.Analyzer