How to use
org.apache.lucene.analysis.ga.IrishLowerCaseFilter
constructor

Best Java code snippets using org.apache.lucene.analysis.ga.IrishLowerCaseFilter.<init> (Showing top 10 results out of 315)

@Override
public TokenStream create(TokenStream input) {
 return new IrishLowerCaseFilter(input);
}

 @Override
 protected TokenStream normalize(String fieldName, TokenStream in) {
  TokenStream result = new ElisionFilter(in, DEFAULT_ARTICLES);
  result = new IrishLowerCaseFilter(result);
  return result;
 }
}

@Override
public TokenStream create(TokenStream input) {
 return new IrishLowerCaseFilter(input);
}

/**
 * Creates a
 * {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 * which tokenizes all the text in the provided {@link Reader}.
 * 
 * @return A
 *         {@link org.apache.lucene.analysis.Analyzer.TokenStreamComponents}
 *         built from an {@link StandardTokenizer} filtered with
 *         {@link IrishLowerCaseFilter}, {@link StopFilter}
 *         , {@link SetKeywordMarkerFilter} if a stem exclusion set is
 *         provided and {@link SnowballFilter}.
 */
@Override
protected TokenStreamComponents createComponents(String fieldName) {
 final Tokenizer source = new StandardTokenizer();
 TokenStream result = new StopFilter(source, HYPHENATIONS);
 result = new ElisionFilter(result, DEFAULT_ARTICLES);
 result = new IrishLowerCaseFilter(result);
 result = new StopFilter(result, stopwords);
 if(!stemExclusionSet.isEmpty())
  result = new SetKeywordMarkerFilter(result, stemExclusionSet);
 result = new SnowballFilter(result, new IrishStemmer());
 return new TokenStreamComponents(source, result);
}

@Override
public TokenStream create(TokenStream tokenStream) {
  if (lang == null) {
    return new LowerCaseFilter(tokenStream);
  } else if (lang.equalsIgnoreCase("greek")) {
    return new GreekLowerCaseFilter(tokenStream);
  } else if (lang.equalsIgnoreCase("irish")) {
    return new IrishLowerCaseFilter(tokenStream);
  } else if (lang.equalsIgnoreCase("turkish")) {
    return new TurkishLowerCaseFilter(tokenStream);
  } else {
    throw new IllegalArgumentException("language [" + lang + "] not support for lower case");
  }
}

@Override
public TokenStream create(TokenStream tokenStream) {
  if (lang == null) {
    return new LowerCaseFilter(tokenStream);
  } else if (lang.equalsIgnoreCase("greek")) {
    return new GreekLowerCaseFilter(tokenStream);
  } else if (lang.equalsIgnoreCase("irish")) {
    return new IrishLowerCaseFilter(tokenStream);
  } else if (lang.equalsIgnoreCase("turkish")) {
    return new TurkishLowerCaseFilter(tokenStream);
  } else {
    throw new IllegalArgumentException("language [" + lang + "] not support for lower case");
  }
}

static public TokenStream irish(TokenStream result) {
  result = new StopFilter(result, IRISH_HYPHENATIONS);
  result = new ElisionFilter(result, IRISH_DEFAULT_ARTICLES);
  result = new IrishLowerCaseFilter(result);
  result = new SnowballFilter(result, new IrishStemmer());
  return result;
}

@Override
public TokenStream getTokenStream(Tokenizer tokenizer, CharArraySet stemExclusionSet) {
  TokenStream stream = new StandardFilter(matchVersion, tokenizer);
  if (caseInsensitive)
    stream = new IrishLowerCaseFilter(stream);
  if (useStopWords)
    stream = new StopFilter(matchVersion, stream, IrishAnalyzer.getDefaultStopSet());
  if (useStem) {
    if (!stemExclusionSet.isEmpty())
      stream = new SetKeywordMarkerFilter(stream, stemExclusionSet);
    stream = new SnowballFilter(stream, new IrishStemmer());
  }
  return stream;
}

 /**
  * Creates a
  * {@link org.apache.lucene.analysis.ReusableAnalyzerBase.TokenStreamComponents}
  * which tokenizes all the text in the provided {@link Reader}.
  * 
  * @return A
  *         {@link org.apache.lucene.analysis.ReusableAnalyzerBase.TokenStreamComponents}
  *         built from an {@link StandardTokenizer} filtered with
  *         {@link StandardFilter}, {@link IrishLowerCaseFilter}, {@link StopFilter}
  *         , {@link KeywordMarkerFilter} if a stem exclusion set is
  *         provided and {@link SnowballFilter}.
  */
 @Override
 protected TokenStreamComponents createComponents(String fieldName,
   Reader reader) {
  final Tokenizer source = new StandardTokenizer(matchVersion, reader);
  TokenStream result = new StandardFilter(matchVersion, source);
  StopFilter s = new StopFilter(matchVersion, result, HYPHENATIONS);
  s.setEnablePositionIncrements(false);
  result = s;
  result = new ElisionFilter(matchVersion, result, DEFAULT_ARTICLES);
  result = new IrishLowerCaseFilter(result);
  result = new StopFilter(matchVersion, result, stopwords);
  if(!stemExclusionSet.isEmpty())
   result = new KeywordMarkerFilter(result, stemExclusionSet);
  result = new SnowballFilter(result, new IrishStemmer());
  return new TokenStreamComponents(source, result);
 }
}

result = new StopFilter(result, HYPHENATIONS);
result = new ElisionFilter(result, DEFAULT_ARTICLES);
result = new IrishLowerCaseFilter(result);
result = new StopFilter(result, stopwords);
if(!stemExclusionSet.isEmpty())

Javadoc

Create an IrishLowerCaseFilter that normalises Irish token text.

Popular methods of IrishLowerCaseFilter

isUpperVowel

Popular in Java

Creating JSON documents from java classes using gson
getResourceAsStream (ClassLoader)
putExtra (Intent)
findViewById (Activity)
FileNotFoundException (java.io)
Thrown when a file specified by a program cannot be found.
SQLException (java.sql)
An exception that indicates a failed JDBC operation. It provides the following information about pro
ArrayList (java.util)
ArrayList is an implementation of List, backed by an array. All optional operations including adding
Font (java.awt)
The Font class represents fonts, which are used to render text in a visible way. A font provides the
Kernel (java.awt.image)
JCheckBox (javax.swing)
Top plugins for WebStorm

How to use org.apache.lucene.analysis.ga.IrishLowerCaseFilterconstructor

Best Java code snippets using org.apache.lucene.analysis.ga.IrishLowerCaseFilter.<init> (Showing top 10 results out of 315)

How to use
org.apache.lucene.analysis.ga.IrishLowerCaseFilter
constructor