org.apache.lucene.analysis.snowball.SnowballFilter.<init> java code examples

@Override
public TokenFilter filter(TokenStream stream) {
  return new SnowballFilter(stream, stemmerName);
}

 @Override
 public TokenFilter create(TokenStream input) {
  SnowballProgram program;
  try {
   program = stemClass.newInstance();
  } catch (Exception e) {
   throw new RuntimeException("Error instantiating stemmer for language " + language + "from class " + stemClass, e);
  }

  if (protectedWords != null)
   input = new SetKeywordMarkerFilter(input, protectedWords);
  return new SnowballFilter(input, program);
 }
}

/**
 * Creates
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * used to tokenize all the text in the provided {@link Reader}.
 * 
 * @return {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from a {@link StandardTokenizer} filtered with
 *         {@link LowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided, and {@link SnowballFilter}
 */
 @Override
 protected TokenStreamComponents createComponents(String fieldName) {
  final Tokenizer source = new StandardTokenizer();
  TokenStream result = new LowerCaseFilter(source);
  result = new StopFilter(result, stopwords);
  if (!stemExclusionSet.isEmpty()) 
   result = new SetKeywordMarkerFilter(result, stemExclusionSet);
  result = new SnowballFilter(result, new org.tartarus.snowball.ext.RussianStemmer());
  return new TokenStreamComponents(source, result);
 }

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link LowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new LowerCaseFilter(source);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new NorwegianStemmer());
 return new TokenStreamComponents(source, result);
}

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link LowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new LowerCaseFilter(source);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new RomanianStemmer());
 return new TokenStreamComponents(source, result);
}

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link LowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new LowerCaseFilter(source);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new HungarianStemmer());
 return new TokenStreamComponents(source, result);
}

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link LowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new LowerCaseFilter(source);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new ArmenianStemmer());
 return new TokenStreamComponents(source, result);
}

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link LowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new LowerCaseFilter(source);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new LithuanianStemmer());
 return new TokenStreamComponents(source, result);
}

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link LowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new LowerCaseFilter(source);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new DanishStemmer());
 return new TokenStreamComponents(source, result);
}

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link LowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new LowerCaseFilter(source);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new FinnishStemmer());
 return new TokenStreamComponents(source, result);
}

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link LowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new LowerCaseFilter(source);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new SwedishStemmer());
 return new TokenStreamComponents(source, result);
}

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link LowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new LowerCaseFilter(source);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new BasqueStemmer());
 return new TokenStreamComponents(source, result);
}

/**
 * Returns a (possibly reused) {@link TokenStream} which tokenizes all the 
 * text in the provided {@link Reader}.
 *
 * @return A {@link TokenStream} built from a {@link StandardTokenizer}
 *   filtered with {@link LowerCaseFilter},
 *   {@link StopFilter}, {@link SetKeywordMarkerFilter} if a stem exclusion set is provided,
 *   {@link StemmerOverrideFilter}, and {@link SnowballFilter}
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new LowerCaseFilter(source);
 result = new StopFilter(result, stoptable);
 if (!excltable.isEmpty())
  result = new SetKeywordMarkerFilter(result, excltable);
 if (stemdict != null)
  result = new StemmerOverrideFilter(result, stemdict);
 result = new SnowballFilter(result, new org.tartarus.snowball.ext.DutchStemmer());
 return new TokenStreamComponents(source, result);
}

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link ElisionFilter}, {@link LowerCaseFilter},
 *         {@link StopFilter}, {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new ElisionFilter(source, DEFAULT_ARTICLES);
 result = new LowerCaseFilter(result);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new CatalanStemmer());
 return new TokenStreamComponents(source, result);
}

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link TurkishLowerCaseFilter},
 *         {@link StopFilter}, {@link SetKeywordMarkerFilter} if a stem
 *         exclusion set is provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new ApostropheFilter(source);
 result = new TurkishLowerCaseFilter(result);
 result = new StopFilter(result, stopwords);
 if (!stemExclusionSet.isEmpty()) {
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 }
 result = new SnowballFilter(result, new TurkishStemmer());
 return new TokenStreamComponents(source, result);
}

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link IrishLowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new StopFilter(source, HYPHENATIONS);
 result = new ElisionFilter(result, DEFAULT_ARTICLES);
 result = new IrishLowerCaseFilter(result);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new IrishStemmer());
 return new TokenStreamComponents(source, result);
}

  @Override
  public TokenStream apply(final TokenStream input)
  {
    return new SnowballFilter(input, new SwedishStemmer());
  }
};

  @Override
  public TokenStream apply(final TokenStream input)
  {
    return new SnowballFilter(input, new DutchStemmer());
  }
};

  @Override
  public TokenStream apply(final TokenStream input)
  {
    return new SnowballFilter(input, new RomanianStemmer());
  }
};

  @Override
  public TokenStream apply(final TokenStream input)
  {
    return new SnowballFilter(input, new PortugueseStemmer());
  }
};

Javadoc

Construct the named stemming filter. Available stemmers are listed in org.tartarus.snowball.ext. The name of a stemmer is the part of the class name before "Stemmer", e.g., the stemmer in org.tartarus.snowball.ext.EnglishStemmer is named "English".

Popular methods of SnowballFilter

Popular in Java

Reactive rest calls using spring rest template
startActivity (Activity)
getSupportFragmentManager (FragmentActivity)
getExternalFilesDir (Context)
FileWriter (java.io)
A specialized Writer that writes to a file in the file system. All write requests made by calling me
URL (java.net)
A Uniform Resource Locator that identifies the location of an Internet resource as specified by RFC
Dictionary (java.util)
Note: Do not use this class since it is obsolete. Please use the Map interface for new implementatio
Stack (java.util)
Stack is a Last-In/First-Out(LIFO) data structure which represents a stack of objects. It enables u
BoxLayout (javax.swing)
JPanel (javax.swing)
Best plugins for Eclipse

How to use org.apache.lucene.analysis.snowball.SnowballFilterconstructor

Best Java code snippets using org.apache.lucene.analysis.snowball.SnowballFilter.<init> (Showing top 20 results out of 315)

How to use
org.apache.lucene.analysis.snowball.SnowballFilter
constructor