org.apache.commons.lang3.text.StrMatcher java code examples

@Test
public void testStringMatcher_String() {
  final StrMatcher matcher = StrMatcher.stringMatcher("bc");
  assertEquals(0, matcher.isMatch(BUFFER2, 0));
  assertEquals(2, matcher.isMatch(BUFFER2, 1));
  assertEquals(0, matcher.isMatch(BUFFER2, 2));
  assertEquals(0, matcher.isMatch(BUFFER2, 3));
  assertEquals(0, matcher.isMatch(BUFFER2, 4));
  assertEquals(0, matcher.isMatch(BUFFER2, 5));
  assertSame(StrMatcher.noneMatcher(), StrMatcher.stringMatcher(""));
  assertSame(StrMatcher.noneMatcher(), StrMatcher.stringMatcher(null));
}

/**
 * Sets the quote character to use.
 * <p>
 * The quote character is used to wrap data between the tokens.
 * This enables delimiters to be entered as data.
 *
 * @param quote  the quote character to use
 * @return this, to enable chaining
 */
public StrTokenizer setQuoteChar(final char quote) {
  return setQuoteMatcher(StrMatcher.charMatcher(quote));
}

/**
 * Consume whitespace from the current parse position.
 *
 * @param pattern String to read
 * @param pos current position
 */
private void seekNonWs(final String pattern, final ParsePosition pos) {
  int len = 0;
  final char[] buffer = pattern.toCharArray();
  do {
    len = StrMatcher.splitMatcher().isMatch(buffer, pos.getIndex());
    pos.setIndex(pos.getIndex() + len);
  } while (len > 0 && pos.getIndex() < pattern.length());
}

@Test
public void testCharSetMatcher_String() {
  final StrMatcher matcher = StrMatcher.charSetMatcher("ace");
  assertEquals(1, matcher.isMatch(BUFFER2, 0));
  assertEquals(0, matcher.isMatch(BUFFER2, 1));
  assertEquals(1, matcher.isMatch(BUFFER2, 2));
  assertEquals(0, matcher.isMatch(BUFFER2, 3));
  assertEquals(1, matcher.isMatch(BUFFER2, 4));
  assertEquals(0, matcher.isMatch(BUFFER2, 5));
  assertSame(StrMatcher.noneMatcher(), StrMatcher.charSetMatcher(""));
  assertSame(StrMatcher.noneMatcher(), StrMatcher.charSetMatcher((String) null));
  assertTrue(StrMatcher.charSetMatcher("a") instanceof StrMatcher.CharMatcher);
}

@Test
public void testIndexOf_StrMatcher() {
  final StrBuilder sb = new StrBuilder();
  assertEquals(-1, sb.indexOf((StrMatcher) null));
  assertEquals(-1, sb.indexOf(StrMatcher.charMatcher('a')));
  sb.append("ab bd");
  assertEquals(0, sb.indexOf(StrMatcher.charMatcher('a')));
  assertEquals(1, sb.indexOf(StrMatcher.charMatcher('b')));
  assertEquals(2, sb.indexOf(StrMatcher.spaceMatcher()));
  assertEquals(4, sb.indexOf(StrMatcher.charMatcher('d')));
  assertEquals(-1, sb.indexOf(StrMatcher.noneMatcher()));
  assertEquals(-1, sb.indexOf((StrMatcher) null));
  sb.append(" A1 junction");
  assertEquals(6, sb.indexOf(A_NUMBER_MATCHER));
}

/**
 * Sets the field delimiter string.
 *
 * @param delim  the delimiter string to use
 * @return this, to enable chaining
 */
public StrTokenizer setDelimiterString(final String delim) {
  return setDelimiterMatcher(StrMatcher.stringMatcher(delim));
}

@Test
public void testReplaceFirst_StrMatcher_String() {
  StrBuilder sb = new StrBuilder("abcbccba");
  sb.replaceFirst((StrMatcher) null, null);
  assertEquals("abcbccba", sb.toString());
  sb.replaceFirst((StrMatcher) null, "anything");
  assertEquals("abcbccba", sb.toString());
  sb.replaceFirst(StrMatcher.noneMatcher(), null);
  assertEquals("abcbccba", sb.toString());
  sb.replaceFirst(StrMatcher.noneMatcher(), "anything");
  assertEquals("abcbccba", sb.toString());
  sb.replaceFirst(StrMatcher.charMatcher('x'), "y");
  assertEquals("abcbccba", sb.toString());
  sb.replaceFirst(StrMatcher.charMatcher('a'), "d");
  assertEquals("dbcbccba", sb.toString());
  sb.replaceFirst(StrMatcher.charMatcher('d'), null);
  assertEquals("bcbccba", sb.toString());
  sb.replaceFirst(StrMatcher.stringMatcher("cb"), "-");
  assertEquals("b-ccba", sb.toString());
  sb = new StrBuilder("abcba");
  sb.replaceFirst(StrMatcher.charMatcher('b'), "xbx");
  assertEquals("axbxcba", sb.toString());
  sb = new StrBuilder("bb");
  sb.replaceFirst(StrMatcher.charMatcher('b'), "xbx");
  assertEquals("xbxb", sb.toString());
  sb = new StrBuilder("A1-A2A3-A4");
  sb.replaceFirst(A_NUMBER_MATCHER, "***");
  assertEquals("***-A2A3-A4", sb.toString());
}

/**
 * Returns the number of matching characters, zero for no match.
 * <p>
 * This method is called to check for a match.
 * The parameter <code>pos</code> represents the current position to be
 * checked in the string <code>buffer</code> (a character array which must
 * not be changed).
 * The API guarantees that <code>pos</code> is a valid index for <code>buffer</code>.
 * <p>
 * The matching code may check one character or many.
 * It may check characters preceding <code>pos</code> as well as those after.
 * <p>
 * It must return zero for no match, or a positive number if a match was found.
 * The number indicates the number of characters that matched.
 *
 * @param buffer  the text content to match against, do not change
 * @param pos  the starting position for the match, valid for buffer
 * @return the number of matching characters, zero for no match
 * @since 2.4
 */
public int isMatch(final char[] buffer, final int pos) {
  return isMatch(buffer, pos, 0, buffer.length);
}

/**
 * Sets the field delimiter matcher.
 * <p>
 * The delimiter is used to separate one token from another.
 *
 * @param delim  the delimiter matcher to use
 * @return this, to enable chaining
 */
public StrTokenizer setDelimiterMatcher(final StrMatcher delim) {
  if (delim == null) {
    this.delimMatcher = StrMatcher.noneMatcher();
  } else {
    this.delimMatcher = delim;
  }
  return this;
}

@Test
public void testNoneMatcher() {
  final StrMatcher matcher = StrMatcher.noneMatcher();
  assertSame(matcher, StrMatcher.noneMatcher());
  assertEquals(0, matcher.isMatch(BUFFER1, 0));
  assertEquals(0, matcher.isMatch(BUFFER1, 1));
  assertEquals(0, matcher.isMatch(BUFFER1, 2));
  assertEquals(0, matcher.isMatch(BUFFER1, 3));
  assertEquals(0, matcher.isMatch(BUFFER1, 4));
  assertEquals(0, matcher.isMatch(BUFFER1, 5));
  assertEquals(0, matcher.isMatch(BUFFER1, 6));
  assertEquals(0, matcher.isMatch(BUFFER1, 7));
  assertEquals(0, matcher.isMatch(BUFFER1, 8));
  assertEquals(0, matcher.isMatch(BUFFER1, 9));
  assertEquals(0, matcher.isMatch(BUFFER1, 10));
  assertEquals(0, matcher.isMatch(BUFFER1, 11));
  assertEquals(0, matcher.isMatch(BUFFER1, 12));
}

@Test
public void testContains_StrMatcher() {
  StrBuilder sb = new StrBuilder("abcdefghijklmnopqrstuvwxyz");
  assertTrue(sb.contains(StrMatcher.charMatcher('a')));
  assertTrue(sb.contains(StrMatcher.stringMatcher("pq")));
  assertTrue(sb.contains(StrMatcher.charMatcher('z')));
  assertFalse(sb.contains(StrMatcher.stringMatcher("zy")));
  assertFalse(sb.contains((StrMatcher) null));
  sb = new StrBuilder();
  assertFalse(sb.contains(A_NUMBER_MATCHER));
  sb.append("B A1 C");
  assertTrue(sb.contains(A_NUMBER_MATCHER));
}

@Test
public void testMatcherIndices() {
  // remember that the API contract is tight for the isMatch() method
  // all the onus is on the caller, so invalid inputs are not
  // the concern of StrMatcher, and are not bugs
  final StrMatcher matcher = StrMatcher.stringMatcher("bc");
  assertEquals(2, matcher.isMatch(BUFFER2, 1, 1, BUFFER2.length));
  assertEquals(2, matcher.isMatch(BUFFER2, 1, 0, 3));
  assertEquals(0, matcher.isMatch(BUFFER2, 1, 0, 2));
}

@Test
public void testCharMatcher_char() {
  final StrMatcher matcher = StrMatcher.charMatcher('c');
  assertEquals(0, matcher.isMatch(BUFFER2, 0));
  assertEquals(0, matcher.isMatch(BUFFER2, 1));
  assertEquals(1, matcher.isMatch(BUFFER2, 2));
  assertEquals(0, matcher.isMatch(BUFFER2, 3));
  assertEquals(0, matcher.isMatch(BUFFER2, 4));
  assertEquals(0, matcher.isMatch(BUFFER2, 5));
}

@Test
public void test8() {
  final String input = "a   b c \"d e\" f ";
  final StrTokenizer tok = new StrTokenizer(input);
  tok.setDelimiterMatcher(StrMatcher.spaceMatcher());
  tok.setQuoteMatcher(StrMatcher.doubleQuoteMatcher());
  tok.setIgnoredMatcher(StrMatcher.noneMatcher());
  tok.setIgnoreEmptyTokens(true);
  final String tokens[] = tok.getTokenArray();
  final String expected[] = new String[]{"a", "b", "c", "d e", "f",};
  assertEquals(ArrayUtils.toString(tokens), expected.length, tokens.length);
  for (int i = 0; i < expected.length; i++) {
    assertEquals("token[" + i + "] was '" + tokens[i] + "' but was expected to be '" + expected[i] + "'",
        expected[i], tokens[i]);
  }
}

@Test
public void testBasicIgnoreTrimmed4() {
  final String input = "IGNOREaIGNORE: IGNORE 'bIGNOREc'IGNORE'd' IGNORE : IGNORE ";
  final StrTokenizer tok = new StrTokenizer(input, ':', '\'');
  tok.setIgnoredMatcher(StrMatcher.stringMatcher("IGNORE"));
  tok.setTrimmerMatcher(StrMatcher.trimMatcher());
  tok.setIgnoreEmptyTokens(false);
  tok.setEmptyTokenAsNull(true);
  assertEquals("a", tok.next());
  assertEquals("bIGNOREcd", tok.next());
  assertNull(tok.next());
  assertFalse(tok.hasNext());
}

@Test
public void testCommaMatcher() {
  final StrMatcher matcher = StrMatcher.commaMatcher();
  assertSame(matcher, StrMatcher.commaMatcher());
  assertEquals(0, matcher.isMatch(BUFFER1, 0));
  assertEquals(1, matcher.isMatch(BUFFER1, 1));
  assertEquals(0, matcher.isMatch(BUFFER1, 2));
}

@Test
public void testQuoteMatcher() {
  final StrMatcher matcher = StrMatcher.quoteMatcher();
  assertSame(matcher, StrMatcher.quoteMatcher());
  assertEquals(0, matcher.isMatch(BUFFER1, 10));
  assertEquals(1, matcher.isMatch(BUFFER1, 11));
  assertEquals(1, matcher.isMatch(BUFFER1, 12));
}

@Test
public void testSingleQuoteMatcher() {
  final StrMatcher matcher = StrMatcher.singleQuoteMatcher();
  assertSame(matcher, StrMatcher.singleQuoteMatcher());
  assertEquals(0, matcher.isMatch(BUFFER1, 10));
  assertEquals(1, matcher.isMatch(BUFFER1, 11));
  assertEquals(0, matcher.isMatch(BUFFER1, 12));
}

@Test
public void testSpaceMatcher() {
  final StrMatcher matcher = StrMatcher.spaceMatcher();
  assertSame(matcher, StrMatcher.spaceMatcher());
  assertEquals(0, matcher.isMatch(BUFFER1, 4));
  assertEquals(1, matcher.isMatch(BUFFER1, 5));
  assertEquals(0, matcher.isMatch(BUFFER1, 6));
}

@Test
public void testTrimMatcher() {
  final StrMatcher matcher = StrMatcher.trimMatcher();
  assertSame(matcher, StrMatcher.trimMatcher());
  assertEquals(0, matcher.isMatch(BUFFER1, 2));
  assertEquals(1, matcher.isMatch(BUFFER1, 3));
  assertEquals(0, matcher.isMatch(BUFFER1, 4));
  assertEquals(1, matcher.isMatch(BUFFER1, 5));
  assertEquals(0, matcher.isMatch(BUFFER1, 6));
  assertEquals(1, matcher.isMatch(BUFFER1, 7));
  assertEquals(1, matcher.isMatch(BUFFER1, 8));
  assertEquals(1, matcher.isMatch(BUFFER1, 9));
  assertEquals(1, matcher.isMatch(BUFFER1, 10));
}

Javadoc

A matcher class that can be queried to determine if a character array portion matches.

This class comes complete with various factory methods. If these do not suffice, you can subclass and implement your own matcher.

Most used methods

noneMatcher
Matches no characters.
charMatcher
Constructor that creates a matcher from a character.
isMatch
splitMatcher
Matches the same characters as StringTokenizer, namely space, tab, newline and formfeed.
stringMatcher
Constructor that creates a matcher from a string.
charSetMatcher
Constructor that creates a matcher from a set of characters.
commaMatcher
Returns a matcher which matches the comma character.
quoteMatcher
Returns a matcher which matches the single or double quote character.
singleQuoteMatcher
Returns a matcher which matches the single quote character.
spaceMatcher
Returns a matcher which matches the space character.
trimMatcher
Matches the String trim() whitespace characters.
doubleQuoteMatcher
Returns a matcher which matches the double quote character.

Popular in Java

Making http post requests using okhttp
setRequestProperty (URLConnection)
getExternalFilesDir (Context)
onCreateOptionsMenu (Activity)
Permission (java.security)
Legacy security code; do not use.
Executors (java.util.concurrent)
Factory and utility methods for Executor, ExecutorService, ScheduledExecutorService, ThreadFactory,
Point (java.awt)
A point representing a location in (x,y) coordinate space, specified in integer precision.
Rectangle (java.awt)
A Rectangle specifies an area in a coordinate space that is enclosed by the Rectangle object's top-
BufferedImage (java.awt.image)
The BufferedImage subclass describes an java.awt.Image with an accessible buffer of image data. All
JFileChooser (javax.swing)
Top plugins for WebStorm

How to useStrMatcher in org.apache.commons.lang3.text

Best Java code snippets using org.apache.commons.lang3.text.StrMatcher (Showing top 20 results out of 315)

How to use
StrMatcher
in
org.apache.commons.lang3.text