org.apache.hadoop.hive.ql.exec.spark.SparkRecordHandler java code examples

 @Override
 protected void closeRecordProcessor() {
  recordHandler.close();
 }
}

@Override
protected boolean processingDone() {
 return recordHandler.getDone();
}

@Override
protected void processNextRecord(Tuple2<BytesWritable, BytesWritable> inputRecord)
  throws IOException {
 recordHandler.processRow(inputRecord._1(), inputRecord._2());
}

@SuppressWarnings("unchecked")
@Override
public Iterator<Tuple2<HiveKey, BytesWritable>>
call(Iterator<Tuple2<BytesWritable, BytesWritable>> it) throws Exception {
 initJobConf();
 SparkRecordHandler mapRecordHandler;
 // need different record handler for MergeFileWork
 if (MergeFileMapper.class.getName().equals(jobConf.get(Utilities.MAPRED_MAPPER_CLASS))) {
  mapRecordHandler = new SparkMergeFileRecordHandler();
 } else {
  mapRecordHandler = new SparkMapRecordHandler();
 }
 HiveMapFunctionResultList result = new HiveMapFunctionResultList(it, mapRecordHandler);
 mapRecordHandler.init(jobConf, result, sparkReporter);
 return result;
}

/**
 * Logger processed row number and used memory info.
 */
protected void logMemoryInfo() {
 rowNumber++;
 if (rowNumber == nextLogThreshold) {
  long usedMemory = memoryMXBean.getHeapMemoryUsage().getUsed();
  LOG.info("processing " + rowNumber
   + " rows: used memory = " + usedMemory);
  nextLogThreshold = getNextLogThreshold(rowNumber);
 }
}

public void close() {
 memoryAndRowLogExecutor.shutdown();
 memoryAndRowLogFuture.cancel(false);
 try {
  if (!memoryAndRowLogExecutor.awaitTermination(5, TimeUnit.SECONDS)) {
   memoryAndRowLogExecutor.shutdownNow();
  }
 } catch (InterruptedException e) {
  memoryAndRowLogExecutor.shutdownNow();
  Thread.currentThread().interrupt();
 }
 if (LOG.isInfoEnabled()) {
  logMemoryInfo();
 }
}

@SuppressWarnings("unchecked")
@Override
public Iterator<Tuple2<HiveKey, BytesWritable>>
call(Iterator<Tuple2<BytesWritable, BytesWritable>> it) throws Exception {
 initJobConf();
 SparkRecordHandler mapRecordHandler;
 // need different record handler for MergeFileWork
 if (MergeFileMapper.class.getName().equals(jobConf.get(Utilities.MAPRED_MAPPER_CLASS))) {
  mapRecordHandler = new SparkMergeFileRecordHandler();
 } else {
  mapRecordHandler = new SparkMapRecordHandler();
 }
 HiveMapFunctionResultList result = new HiveMapFunctionResultList(it, mapRecordHandler);
 mapRecordHandler.init(jobConf, result, sparkReporter);
 return result;
}

/**
 * Log processed row number and used memory info.
 */
protected void logMemoryInfo() {
 rowNumber++;
 if (rowNumber == nextLogThreshold) {
  long usedMemory = memoryMXBean.getHeapMemoryUsage().getUsed();
  LOG.info("processing " + rowNumber
   + " rows: used memory = " + usedMemory);
  nextLogThreshold = getNextLogThreshold(rowNumber);
 }
}

@SuppressWarnings("unchecked")
@Override
public <K, V> void init(JobConf job, OutputCollector<K, V> output, Reporter reporter) throws Exception {
 super.init(job, output, reporter);

 @Override
 protected void closeRecordProcessor() {
  recordHandler.close();
 }
}

@Override
protected void processNextRecord(Tuple2<BytesWritable, BytesWritable> inputRecord)
  throws IOException {
 recordHandler.processRow(inputRecord._1(), inputRecord._2());
}

@Override
protected boolean processingDone() {
 return recordHandler.getDone();
}

@SuppressWarnings("unchecked")
@Override
public <K, V> void init(JobConf job, OutputCollector<K, V> output, Reporter reporter) throws Exception {
 super.init(job, output, reporter);

@Override
public void close() {
 super.close();
 LOG.info("Closing Merge Operator " + mergeOp.getName());
 try {
  mergeOp.closeOp(abort);
 } catch (HiveException e) {
  throw new RuntimeException(e);
 }
}

@Override
protected void processNextRecord(Tuple2<BytesWritable, BytesWritable> inputRecord)
  throws IOException {
 recordHandler.processRow(inputRecord._1(), inputRecord._2());
}

@Override
protected boolean processingDone() {
 return recordHandler.getDone();
}

public void init(JobConf job, OutputCollector output, Reporter reporter) throws Exception {
 perfLogger.PerfLogBegin(CLASS_NAME, PerfLogger.SPARK_INIT_OPERATORS);
 super.init(job, output, reporter);

@Override
public void close() {
 super.close();

public void init(JobConf job, OutputCollector output, Reporter reporter) throws Exception {
 perfLogger.PerfLogBegin(CLASS_NAME, PerfLogger.SPARK_INIT_OPERATORS);
 super.init(job, output, reporter);

@Override
public void close() {
 super.close();

Most used methods

close
getDone
init
processRow
Process row with key and value collection.
getNextLogThreshold
logMemoryInfo
Log processed row number and used memory info.

Popular in Java

Reading from database using SQL prepared statement
getApplicationContext (Context)
startActivity (Activity)
addToBackStack (FragmentTransaction)
FileReader (java.io)
A specialized Reader that reads from a file in the file system. All read requests made by calling me
DecimalFormat (java.text)
A concrete subclass of NumberFormat that formats decimal numbers. It has a variety of features desig
BlockingQueue (java.util.concurrent)
A java.util.Queue that additionally supports operations that wait for the queue to become non-empty
Servlet (javax.servlet)
Defines methods that all servlets must implement. A servlet is a small Java program that runs within
Logger (org.slf4j)
The org.slf4j.Logger interface is the main user entry point of SLF4J API. It is expected that loggin
SAXParseException (org.xml.sax)
Encapsulate an XML parse error or warning.> This module, both source code and documentation, is in t
Top 12 Jupyter Notebook extensions

How to useSparkRecordHandler in org.apache.hadoop.hive.ql.exec.spark

Best Java code snippets using org.apache.hadoop.hive.ql.exec.spark.SparkRecordHandler (Showing top 20 results out of 315)

How to use
SparkRecordHandler
in
org.apache.hadoop.hive.ql.exec.spark