How to use
org.tartarus.snowball.ext.CatalanStemmer
constructor

Best Java code snippets using org.tartarus.snowball.ext.CatalanStemmer.<init> (Showing top 6 results out of 315)

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link ElisionFilter}, {@link LowerCaseFilter},
 *         {@link StopFilter}, {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new ElisionFilter(source, DEFAULT_ARTICLES);
 result = new LowerCaseFilter(result);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new CatalanStemmer());
 return new TokenStreamComponents(source, result);
}

  @Override
  public TokenStream apply(final TokenStream input)
  {
    return new SnowballFilter(input, new CatalanStemmer());
  }
};

  @Override
  public TokenStream getTokenStream(Tokenizer tokenizer, CharArraySet stemExclusionSet) {
    TokenStream stream = new StandardFilter(matchVersion, tokenizer);
    if (caseInsensitive)
      stream = new LowerCaseFilter(matchVersion, stream);
    if (useStopWords) {
      stream = new ElisionFilter(stream, DEFAULT_ARTICLES);
      stream = new StopFilter(matchVersion, stream, DanishAnalyzer.getDefaultStopSet());
    }
    if (useStem) {
      if (!stemExclusionSet.isEmpty())
        stream = new SetKeywordMarkerFilter(stream, stemExclusionSet);
      stream = new SnowballFilter(stream, new CatalanStemmer());
    }
    return stream;
  }
}

 /**
  * Creates a
  * {@link org.apache.lucene.analysis.ReusableAnalyzerBase.TokenStreamComponents}
  * which tokenizes all the text in the provided {@link Reader}.
  * 
  * @return A
  *         {@link org.apache.lucene.analysis.ReusableAnalyzerBase.TokenStreamComponents}
  *         built from an {@link StandardTokenizer} filtered with
  *         {@link StandardFilter}, {@link LowerCaseFilter}, {@link StopFilter}
  *         , {@link KeywordMarkerFilter} if a stem exclusion set is
  *         provided and {@link SnowballFilter}.
  */
 @Override
 protected TokenStreamComponents createComponents(String fieldName,
   Reader reader) {
  final Tokenizer source = new StandardTokenizer(matchVersion, reader);
  TokenStream result = new StandardFilter(matchVersion, source);
  if (matchVersion.onOrAfter(Version.LUCENE_36)) {
   result = new ElisionFilter(matchVersion, result, DEFAULT_ARTICLES);
  }
  result = new LowerCaseFilter(matchVersion, result);
  result = new StopFilter(matchVersion, result, stopwords);
  if(!stemExclusionSet.isEmpty())
   result = new KeywordMarkerFilter(result, stemExclusionSet);
  result = new SnowballFilter(result, new CatalanStemmer());
  return new TokenStreamComponents(source, result);
 }
}

  return new BulgarianStemFilter(tokenStream);
} else if ("catalan".equalsIgnoreCase(language)) {
  return new SnowballFilter(tokenStream, new CatalanStemmer());
} else if ("czech".equalsIgnoreCase(language)) {
  return new CzechStemFilter(tokenStream);

  return new BulgarianStemFilter(tokenStream);
} else if ("catalan".equalsIgnoreCase(language)) {
  return new SnowballFilter(tokenStream, new CatalanStemmer());
} else if ("czech".equalsIgnoreCase(language)) {
  return new CzechStemFilter(tokenStream);

Popular methods of CatalanStemmer

Popular in Java

Parsing JSON documents to java classes using gson
getExternalFilesDir (Context)
compareTo (BigDecimal)
getResourceAsStream (ClassLoader)
ResultSet (java.sql)
An interface for an object which represents a database table entry, returned as the result of the qu
BitSet (java.util)
The BitSet class implements abit array [http://en.wikipedia.org/wiki/Bit_array]. Each element is eit
TimeZone (java.util)
TimeZone represents a time zone offset, and also figures out daylight savings. Typically, you get a
ConcurrentHashMap (java.util.concurrent)
A plug-in replacement for JDK1.5 java.util.concurrent.ConcurrentHashMap. This version is based on or
HttpServletRequest (javax.servlet.http)
Extends the javax.servlet.ServletRequest interface to provide request information for HTTP servlets.
Font (java.awt)
The Font class represents fonts, which are used to render text in a visible way. A font provides the
Top plugins for WebStorm

How to use org.tartarus.snowball.ext.CatalanStemmerconstructor

Best Java code snippets using org.tartarus.snowball.ext.CatalanStemmer.<init> (Showing top 6 results out of 315)

How to use
org.tartarus.snowball.ext.CatalanStemmer
constructor