org.apache.spark.ml.classification.LogisticRegressionModel.numClasses java code examples

int numClasses = lrModel.numClasses();
int dataWithBiasSize = weights.size() / (numClasses - 1);
boolean withBias = (vector.size() + 1) == dataWithBiasSize;

@Override
public LogisticRegressionModelInfo getModelInfo(final LogisticRegressionModel sparkLRModel) {
  final LogisticRegressionModelInfo logisticRegressionModelInfo = new LogisticRegressionModelInfo();
  logisticRegressionModelInfo.setWeights(sparkLRModel.coefficients().toArray());
  logisticRegressionModelInfo.setIntercept(sparkLRModel.intercept());
  logisticRegressionModelInfo.setNumClasses(sparkLRModel.numClasses());
  logisticRegressionModelInfo.setNumFeatures(sparkLRModel.numFeatures());
  logisticRegressionModelInfo.setThreshold(sparkLRModel.getThreshold());
  Set<String> inputKeys = new LinkedHashSet<String>();
  inputKeys.add(sparkLRModel.getFeaturesCol());
  logisticRegressionModelInfo.setInputKeys(inputKeys);
  Set<String> outputKeys = new LinkedHashSet<String>();
  outputKeys.add(sparkLRModel.getPredictionCol());
  outputKeys.add(sparkLRModel.getProbabilityCol());
  logisticRegressionModelInfo.setOutputKeys(outputKeys);
  return logisticRegressionModelInfo;
}

@Override
public LogisticRegressionModelInfo getModelInfo(final LogisticRegressionModel sparkLRModel, DataFrame df) {
  final LogisticRegressionModelInfo logisticRegressionModelInfo = new LogisticRegressionModelInfo();
  logisticRegressionModelInfo.setWeights(sparkLRModel.coefficients().toArray());
  logisticRegressionModelInfo.setIntercept(sparkLRModel.intercept());
  logisticRegressionModelInfo.setNumClasses(sparkLRModel.numClasses());
  logisticRegressionModelInfo.setNumFeatures(sparkLRModel.numFeatures());
  logisticRegressionModelInfo.setThreshold(sparkLRModel.getThreshold());
  logisticRegressionModelInfo.setProbabilityKey(sparkLRModel.getProbabilityCol());
  Set<String> inputKeys = new LinkedHashSet<String>();
  inputKeys.add(sparkLRModel.getFeaturesCol());
  logisticRegressionModelInfo.setInputKeys(inputKeys);
  Set<String> outputKeys = new LinkedHashSet<String>();
  outputKeys.add(sparkLRModel.getPredictionCol());
  outputKeys.add(sparkLRModel.getProbabilityCol());
  logisticRegressionModelInfo.setOutputKeys(outputKeys);
  return logisticRegressionModelInfo;
}

@SuppressWarnings("unchecked")
@Test
public void logisticRegressionPredictorClassifierMethods() {
 LogisticRegression lr = new LogisticRegression();
 LogisticRegressionModel model = lr.fit(dataset);
 Assert.assertEquals(2, model.numClasses());
 model.transform(dataset).createOrReplaceTempView("transformed");
 Dataset<Row> trans1 = spark.sql("SELECT rawPrediction, probability FROM transformed");
 for (Row row : trans1.collectAsList()) {
  Vector raw = (Vector) row.get(0);
  Vector prob = (Vector) row.get(1);
  Assert.assertEquals(raw.size(), 2);
  Assert.assertEquals(prob.size(), 2);
  double probFromRaw1 = 1.0 / (1.0 + Math.exp(-raw.apply(1)));
  Assert.assertEquals(0, Math.abs(prob.apply(1) - probFromRaw1), eps);
  Assert.assertEquals(0, Math.abs(prob.apply(0) - (1.0 - probFromRaw1)), eps);
 }
 Dataset<Row> trans2 = spark.sql("SELECT prediction, probability FROM transformed");
 for (Row row : trans2.collectAsList()) {
  double pred = row.getDouble(0);
  Vector prob = (Vector) row.get(1);
  double probOfPred = prob.apply((int) pred);
  for (int i = 0; i < prob.size(); ++i) {
   Assert.assertTrue(probOfPred >= prob.apply(i));
  }
 }
}

@SuppressWarnings("unchecked")
@Test
public void logisticRegressionPredictorClassifierMethods() {
 LogisticRegression lr = new LogisticRegression();
 LogisticRegressionModel model = lr.fit(dataset);
 Assert.assertEquals(2, model.numClasses());
 model.transform(dataset).createOrReplaceTempView("transformed");
 Dataset<Row> trans1 = spark.sql("SELECT rawPrediction, probability FROM transformed");
 for (Row row : trans1.collectAsList()) {
  Vector raw = (Vector) row.get(0);
  Vector prob = (Vector) row.get(1);
  Assert.assertEquals(raw.size(), 2);
  Assert.assertEquals(prob.size(), 2);
  double probFromRaw1 = 1.0 / (1.0 + Math.exp(-raw.apply(1)));
  Assert.assertEquals(0, Math.abs(prob.apply(1) - probFromRaw1), eps);
  Assert.assertEquals(0, Math.abs(prob.apply(0) - (1.0 - probFromRaw1)), eps);
 }
 Dataset<Row> trans2 = spark.sql("SELECT prediction, probability FROM transformed");
 for (Row row : trans2.collectAsList()) {
  double pred = row.getDouble(0);
  Vector prob = (Vector) row.get(1);
  double probOfPred = prob.apply((int) pred);
  for (int i = 0; i < prob.size(); ++i) {
   Assert.assertTrue(probOfPred >= prob.apply(i));
  }
 }
}

@SuppressWarnings("unchecked")
@Test
public void logisticRegressionPredictorClassifierMethods() {
 LogisticRegression lr = new LogisticRegression();
 LogisticRegressionModel model = lr.fit(dataset);
 Assert.assertEquals(2, model.numClasses());
 model.transform(dataset).createOrReplaceTempView("transformed");
 Dataset<Row> trans1 = spark.sql("SELECT rawPrediction, probability FROM transformed");
 for (Row row : trans1.collectAsList()) {
  Vector raw = (Vector) row.get(0);
  Vector prob = (Vector) row.get(1);
  Assert.assertEquals(raw.size(), 2);
  Assert.assertEquals(prob.size(), 2);
  double probFromRaw1 = 1.0 / (1.0 + Math.exp(-raw.apply(1)));
  Assert.assertEquals(0, Math.abs(prob.apply(1) - probFromRaw1), eps);
  Assert.assertEquals(0, Math.abs(prob.apply(0) - (1.0 - probFromRaw1)), eps);
 }
 Dataset<Row> trans2 = spark.sql("SELECT prediction, probability FROM transformed");
 for (Row row : trans2.collectAsList()) {
  double pred = row.getDouble(0);
  Vector prob = (Vector) row.get(1);
  double probOfPred = prob.apply((int) pred);
  for (int i = 0; i < prob.size(); ++i) {
   Assert.assertTrue(probOfPred >= prob.apply(i));
  }
 }
}

How to use numClassesmethodin org.apache.spark.ml.classification.LogisticRegressionModel

Best Java code snippets using org.apache.spark.ml.classification.LogisticRegressionModel.numClasses (Showing top 6 results out of 315)

How to use
numClasses
method
in
org.apache.spark.ml.classification.LogisticRegressionModel