11 lat temu · 4c51bc5b9c
--- a/hadoop-common-project/hadoop-common/CHANGES.txt
+++ b/hadoop-common-project/hadoop-common/CHANGES.txt
@@ -290,9 +290,6 @@ Trunk (Unreleased)
 
				 
			
 
				     HADOOP-10044 Improve the javadoc of rpc code (sanjay Radia)
			
 
				 
			
 
				-    HADOOP-10125. no need to process RPC request if the client connection
			
 
				-    has been dropped (Ming Ma via brandonli)
			
 
				-
			
 
				   OPTIMIZATIONS
			
 
				 
			
 
				     HADOOP-7761. Improve the performance of raw comparisons. (todd)
			
@@ -526,6 +523,11 @@ Release 2.4.0 - UNRELEASED
 
				     HADOOP-10236. Fix typo in o.a.h.ipc.Client#checkResponse. (Akira Ajisaka
			
 
				     via suresh)
			
 
				 
			
 
				+    HADOOP-10146. Workaround JDK7 Process fd close bug (daryn)
			
 
				+
			
 
				+    HADOOP-10125. no need to process RPC request if the client connection
			
 
				+    has been dropped (Ming Ma via brandonli)
			
 
				+
			
 
				 Release 2.3.0 - UNRELEASED
			
 
				 
			
 
				   INCOMPATIBLE CHANGES
			
--- a/hadoop-common-project/hadoop-common/src/main/java/org/apache/hadoop/util/Shell.java
+++ b/hadoop-common-project/hadoop-common/src/main/java/org/apache/hadoop/util/Shell.java
@@ -21,6 +21,7 @@ import java.io.BufferedReader;
 
				 import java.io.File;
			
 
				 import java.io.IOException;
			
 
				 import java.io.InputStreamReader;
			
 
				+import java.io.InputStream;
			
 
				 import java.util.Arrays;
			
 
				 import java.util.Map;
			
 
				 import java.util.Timer;
			
@@ -511,7 +512,17 @@ abstract public class Shell {
 
				       }
			
 
				       // close the input stream
			
 
				       try {
			
 
				-        inReader.close();
			
 
				+        // JDK 7 tries to automatically drain the input streams for us
			
 
				+        // when the process exits, but since close is not synchronized,
			
 
				+        // it creates a race if we close the stream first and the same
			
 
				+        // fd is recycled.  the stream draining thread will attempt to
			
 
				+        // drain that fd!!  it may block, OOM, or cause bizarre behavior
			
 
				+        // see: https://bugs.openjdk.java.net/browse/JDK-8024521
			
 
				+        //      issue is fixed in build 7u60
			
 
				+        InputStream stdout = process.getInputStream();
			
 
				+        synchronized (stdout) {
			
 
				+          inReader.close();
			
 
				+        }
			
 
				       } catch (IOException ioe) {
			
 
				         LOG.warn("Error while closing the input stream", ioe);
			
 
				       }
			
@@ -524,7 +535,10 @@ abstract public class Shell {
 
				         LOG.warn("Interrupted while joining errThread");
			
 
				       }
			
 
				       try {
			
 
				-        errReader.close();
			
 
				+        InputStream stderr = process.getErrorStream();
			
 
				+        synchronized (stderr) {
			
 
				+          errReader.close();
			
 
				+        }
			
 
				       } catch (IOException ioe) {
			
 
				         LOG.warn("Error while closing the error stream", ioe);
			
 
				       }
			
--- a/hadoop-hdfs-project/hadoop-hdfs/CHANGES.txt
+++ b/hadoop-hdfs-project/hadoop-hdfs/CHANGES.txt
@@ -522,6 +522,9 @@ Release 2.4.0 - UNRELEASED
 
				     as a collection of storages (see breakdown of tasks below for features and
			
 
				     contributors).
			
 
				 
			
 
				+    HDFS-5784. reserve space in edit log header and fsimage header for feature
			
 
				+    flag section (cmccabe)
			
 
				+
			
 
				   IMPROVEMENTS
			
 
				 
			
 
				     HDFS-5267. Remove volatile from LightWeightHashSet. (Junping Du via llu)
			
--- a/hadoop-hdfs-project/hadoop-hdfs/src/main/java/org/apache/hadoop/hdfs/protocol/LayoutFlags.java
+++ b/hadoop-hdfs-project/hadoop-hdfs/src/main/java/org/apache/hadoop/hdfs/protocol/LayoutFlags.java
@@ -0,0 +1,64 @@
 
				+/**
			
 
				+ * Licensed to the Apache Software Foundation (ASF) under one
			
 
				+ * or more contributor license agreements.  See the NOTICE file
			
 
				+ * distributed with this work for additional information
			
 
				+ * regarding copyright ownership.  The ASF licenses this file
			
 
				+ * to you under the Apache License, Version 2.0 (the
			
 
				+ * "License"); you may not use this file except in compliance
			
 
				+ * with the License.  You may obtain a copy of the License at
			
 
				+ *
			
 
				+ *     http://www.apache.org/licenses/LICENSE-2.0
			
 
				+ *
			
 
				+ * Unless required by applicable law or agreed to in writing, software
			
 
				+ * distributed under the License is distributed on an "AS IS" BASIS,
			
 
				+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
			
 
				+ * See the License for the specific language governing permissions and
			
 
				+ * limitations under the License.
			
 
				+ */
			
 
				+package org.apache.hadoop.hdfs.protocol;
			
 
				+
			
 
				+import java.io.DataInputStream;
			
 
				+import java.io.DataOutputStream;
			
 
				+import java.io.IOException;
			
 
				+
			
 
				+import org.apache.hadoop.classification.InterfaceAudience;
			
 
				+
			
 
				+import com.google.common.base.Joiner;
			
 
				+import com.google.common.base.Preconditions;
			
 
				+import com.google.common.collect.ImmutableSet;
			
 
				+import com.google.common.collect.Sets;
			
 
				+
			
 
				+/**
			
 
				+ * LayoutFlags represent features which the FSImage and edit logs can either
			
 
				+ * support or not, independently of layout version.
			
 
				+ * 
			
 
				+ * Note: all flags starting with 'test' are reserved for unit test purposes.
			
 
				+ */
			
 
				+@InterfaceAudience.Private
			
 
				+public class LayoutFlags {
			
 
				+  /**
			
 
				+   * Load a LayoutFlags object from a stream.
			
 
				+   *
			
 
				+   * @param in            The stream to read from.
			
 
				+   * @throws IOException
			
 
				+   */
			
 
				+  public static LayoutFlags read(DataInputStream in)
			
 
				+      throws IOException {
			
 
				+    int length = in.readInt();
			
 
				+    if (length < 0) {
			
 
				+      throw new IOException("The length of the feature flag section " +
			
 
				+          "was negative at " + length + " bytes.");
			
 
				+    } else if (length > 0) {
			
 
				+      throw new IOException("Found feature flags which we can't handle. " +
			
 
				+          "Please upgrade your software.");
			
 
				+    }
			
 
				+    return new LayoutFlags();
			
 
				+  }
			
 
				+
			
 
				+  private LayoutFlags() {
			
 
				+  }
			
 
				+
			
 
				+  public static void write(DataOutputStream out) throws IOException {
			
 
				+    out.writeInt(0);
			
 
				+  }
			
 
				+}
			
--- a/hadoop-hdfs-project/hadoop-hdfs/src/main/java/org/apache/hadoop/hdfs/protocol/LayoutVersion.java
+++ b/hadoop-hdfs-project/hadoop-hdfs/src/main/java/org/apache/hadoop/hdfs/protocol/LayoutVersion.java
@@ -111,7 +111,8 @@ public class LayoutVersion {
 
				         + "the new block instead of the entire block list"),
			
 
				     CACHING(-49, "Support for cache pools and path-based caching"),
			
 
				     ADD_DATANODE_AND_STORAGE_UUIDS(-50, "Replace StorageID with DatanodeUuid."
			
 
				-        + " Use distinct StorageUuid per storage directory.");
			
 
				+        + " Use distinct StorageUuid per storage directory."),
			
 
				+    ADD_LAYOUT_FLAGS(-51, "Add support for layout flags.");
			
 
				 
			
 
				     final int lv;
			
 
				     final int ancestorLV;
			
--- a/hadoop-hdfs-project/hadoop-hdfs/src/main/java/org/apache/hadoop/hdfs/server/namenode/EditLogFileInputStream.java
+++ b/hadoop-hdfs-project/hadoop-hdfs/src/main/java/org/apache/hadoop/hdfs/server/namenode/EditLogFileInputStream.java
@@ -34,6 +34,9 @@ import org.apache.commons.logging.LogFactory;
 
				 import org.apache.hadoop.classification.InterfaceAudience;
			
 
				 import org.apache.hadoop.hdfs.DFSConfigKeys;
			
 
				 import org.apache.hadoop.hdfs.protocol.HdfsConstants;
			
 
				+import org.apache.hadoop.hdfs.protocol.LayoutFlags;
			
 
				+import org.apache.hadoop.hdfs.protocol.LayoutVersion;
			
 
				+import org.apache.hadoop.hdfs.protocol.LayoutVersion.Feature;
			
 
				 import org.apache.hadoop.hdfs.server.common.Storage;
			
 
				 import org.apache.hadoop.hdfs.server.namenode.TransferFsImage.HttpGetFailedException;
			
 
				 import org.apache.hadoop.hdfs.web.URLConnectionFactory;
			
@@ -146,6 +149,14 @@ public class EditLogFileInputStream extends EditLogInputStream {
 
				       } catch (EOFException eofe) {
			
 
				         throw new LogHeaderCorruptException("No header found in log");
			
 
				       }
			
 
				+      if (LayoutVersion.supports(Feature.ADD_LAYOUT_FLAGS, logVersion)) {
			
 
				+        try {
			
 
				+          LayoutFlags.read(dataIn);
			
 
				+        } catch (EOFException eofe) {
			
 
				+          throw new LogHeaderCorruptException("EOF while reading layout " +
			
 
				+              "flags from log");
			
 
				+        }
			
 
				+      }
			
 
				       reader = new FSEditLogOp.Reader(dataIn, tracker, logVersion);
			
 
				       reader.setMaxOpSize(maxOpSize);
			
 
				       state = State.OPEN;
			
--- a/hadoop-hdfs-project/hadoop-hdfs/src/main/java/org/apache/hadoop/hdfs/server/namenode/EditLogFileOutputStream.java
+++ b/hadoop-hdfs-project/hadoop-hdfs/src/main/java/org/apache/hadoop/hdfs/server/namenode/EditLogFileOutputStream.java
@@ -32,6 +32,7 @@ import org.apache.hadoop.classification.InterfaceAudience;
 
				 import org.apache.hadoop.conf.Configuration;
			
 
				 import org.apache.hadoop.hdfs.DFSConfigKeys;
			
 
				 import org.apache.hadoop.hdfs.protocol.HdfsConstants;
			
 
				+import org.apache.hadoop.hdfs.protocol.LayoutFlags;
			
 
				 import org.apache.hadoop.io.IOUtils;
			
 
				 
			
 
				 import com.google.common.annotations.VisibleForTesting;
			
@@ -132,6 +133,7 @@ public class EditLogFileOutputStream extends EditLogOutputStream {
 
				   @VisibleForTesting
			
 
				   public static void writeHeader(DataOutputStream out) throws IOException {
			
 
				     out.writeInt(HdfsConstants.LAYOUT_VERSION);
			
 
				+    LayoutFlags.write(out);
			
 
				   }
			
 
				 
			
 
				   @Override
			
--- a/hadoop-hdfs-project/hadoop-hdfs/src/main/java/org/apache/hadoop/hdfs/server/namenode/FSImageFormat.java
+++ b/hadoop-hdfs-project/hadoop-hdfs/src/main/java/org/apache/hadoop/hdfs/server/namenode/FSImageFormat.java
@@ -48,6 +48,7 @@ import org.apache.hadoop.fs.permission.PermissionStatus;
 
				 import org.apache.hadoop.hdfs.protocol.HdfsConstants;
			
 
				 import org.apache.hadoop.hdfs.protocol.LayoutVersion;
			
 
				 import org.apache.hadoop.hdfs.protocol.LayoutVersion.Feature;
			
 
				+import org.apache.hadoop.hdfs.protocol.LayoutFlags;
			
 
				 import org.apache.hadoop.hdfs.server.blockmanagement.BlockInfo;
			
 
				 import org.apache.hadoop.hdfs.server.blockmanagement.BlockInfoUnderConstruction;
			
 
				 import org.apache.hadoop.hdfs.server.blockmanagement.BlockManager;
			
@@ -261,6 +262,9 @@ public class FSImageFormat {
 
				         }
			
 
				         boolean supportSnapshot = LayoutVersion.supports(Feature.SNAPSHOT,
			
 
				             imgVersion);
			
 
				+        if (LayoutVersion.supports(Feature.ADD_LAYOUT_FLAGS, imgVersion)) {
			
 
				+          LayoutFlags.read(in);
			
 
				+        }
			
 
				 
			
 
				         // read namespaceID: first appeared in version -2
			
 
				         in.readInt();
			
@@ -990,6 +994,7 @@ public class FSImageFormat {
 
				       DataOutputStream out = new DataOutputStream(fos);
			
 
				       try {
			
 
				         out.writeInt(HdfsConstants.LAYOUT_VERSION);
			
 
				+        LayoutFlags.write(out);
			
 
				         // We use the non-locked version of getNamespaceInfo here since
			
 
				         // the coordinating thread of saveNamespace already has read-locked
			
 
				         // the namespace for us. If we attempt to take another readlock
			
--- a/hadoop-hdfs-project/hadoop-hdfs/src/main/java/org/apache/hadoop/hdfs/tools/offlineImageViewer/ImageLoaderCurrent.java
+++ b/hadoop-hdfs-project/hadoop-hdfs/src/main/java/org/apache/hadoop/hdfs/tools/offlineImageViewer/ImageLoaderCurrent.java
@@ -28,6 +28,7 @@ import java.util.Map;
 
				 import org.apache.hadoop.conf.Configuration;
			
 
				 import org.apache.hadoop.fs.permission.FsPermission;
			
 
				 import org.apache.hadoop.hdfs.protocol.DatanodeInfo.AdminStates;
			
 
				+import org.apache.hadoop.hdfs.protocol.LayoutFlags;
			
 
				 import org.apache.hadoop.hdfs.protocol.LayoutVersion;
			
 
				 import org.apache.hadoop.hdfs.protocol.LayoutVersion.Feature;
			
 
				 import org.apache.hadoop.hdfs.security.token.delegation.DelegationTokenIdentifier;
			
@@ -126,7 +127,7 @@ class ImageLoaderCurrent implements ImageLoader {
 
				                                       new SimpleDateFormat("yyyy-MM-dd HH:mm");
			
 
				   private static int[] versions = { -16, -17, -18, -19, -20, -21, -22, -23,
			
 
				       -24, -25, -26, -27, -28, -30, -31, -32, -33, -34, -35, -36, -37, -38, -39,
			
 
				-      -40, -41, -42, -43, -44, -45, -46, -47, -48, -49, -50 };
			
 
				+      -40, -41, -42, -43, -44, -45, -46, -47, -48, -49, -50, -51 };
			
 
				   private int imageVersion = 0;
			
 
				   
			
 
				   private final Map<Long, Boolean> subtreeMap = new HashMap<Long, Boolean>();
			
@@ -157,6 +158,9 @@ class ImageLoaderCurrent implements ImageLoader {
 
				       imageVersion = in.readInt();
			
 
				       if( !canLoadVersion(imageVersion))
			
 
				         throw new IOException("Cannot process fslayout version " + imageVersion);
			
 
				+      if (LayoutVersion.supports(Feature.ADD_LAYOUT_FLAGS, imageVersion)) {
			
 
				+        LayoutFlags.read(in);
			
 
				+      }
			
 
				 
			
 
				       v.visit(ImageElement.IMAGE_VERSION, imageVersion);
			
 
				       v.visit(ImageElement.NAMESPACE_ID, in.readInt());
			
--- a/hadoop-hdfs-project/hadoop-hdfs/src/test/java/org/apache/hadoop/hdfs/qjournal/server/TestJournalNode.java
+++ b/hadoop-hdfs-project/hadoop-hdfs/src/test/java/org/apache/hadoop/hdfs/qjournal/server/TestJournalNode.java
@@ -191,6 +191,7 @@ public class TestJournalNode {
 
				         "/getJournal?segmentTxId=1&jid=" + journalId));
			
 
				     byte[] expected = Bytes.concat(
			
 
				             Ints.toByteArray(HdfsConstants.LAYOUT_VERSION),
			
 
				+            (new byte[] { 0, 0, 0, 0 }), // layout flags section
			
 
				             EDITS_DATA);
			
 
				 
			
 
				     assertArrayEquals(expected, retrievedViaHttp);
			
--- a/hadoop-hdfs-project/hadoop-hdfs/src/test/java/org/apache/hadoop/hdfs/server/namenode/TestFSEditLogLoader.java
+++ b/hadoop-hdfs-project/hadoop-hdfs/src/test/java/org/apache/hadoop/hdfs/server/namenode/TestFSEditLogLoader.java
@@ -377,8 +377,9 @@ public class TestFSEditLogLoader {
 
				     File testDir = new File(TEST_DIR, "testValidateEmptyEditLog");
			
 
				     SortedMap<Long, Long> offsetToTxId = Maps.newTreeMap();
			
 
				     File logFile = prepareUnfinalizedTestEditLog(testDir, 0, offsetToTxId);
			
 
				-    // Truncate the file so that there is nothing except the header
			
 
				-    truncateFile(logFile, 4);
			
 
				+    // Truncate the file so that there is nothing except the header and
			
 
				+    // layout flags section.
			
 
				+    truncateFile(logFile, 8);
			
 
				     EditLogValidation validation =
			
 
				         EditLogFileInputStream.validateEditLog(logFile);
			
 
				     assertTrue(!validation.hasCorruptHeader());
			
--- a/hadoop-hdfs-project/hadoop-hdfs/src/test/resources/editsStored
+++ b/hadoop-hdfs-project/hadoop-hdfs/src/test/resources/editsStored
--- a/hadoop-hdfs-project/hadoop-hdfs/src/test/resources/editsStored.xml
+++ b/hadoop-hdfs-project/hadoop-hdfs/src/test/resources/editsStored.xml
@@ -1,6 +1,6 @@
 
				 <?xml version="1.0" encoding="UTF-8"?>
			
 
				 <EDITS>
			
 
				-  <EDITS_VERSION>-50</EDITS_VERSION>
			
 
				+  <EDITS_VERSION>-51</EDITS_VERSION>
			
 
				   <RECORD>
			
 
				     <OPCODE>OP_START_LOG_SEGMENT</OPCODE>
			
 
				     <DATA>
			
--- a/hadoop-mapreduce-project/CHANGES.txt
+++ b/hadoop-mapreduce-project/CHANGES.txt
@@ -198,6 +198,9 @@ Release 2.4.0 - UNRELEASED
 
				 
			
 
				     MAPREDUCE-3310. Custom grouping comparator cannot be set for Combiners (tucu)
			
 
				 
			
 
				+    MAPREDUCE-5672. Provide optional RollingFileAppender for container log4j
			
 
				+    (syslog) (Gera Shegalov via jlowe)
			
 
				+
			
 
				   OPTIMIZATIONS
			
 
				 
			
 
				     MAPREDUCE-5484. YarnChild unnecessarily loads job conf twice (Sandy Ryza)
			
--- a/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-app/src/main/java/org/apache/hadoop/mapred/MapReduceChildJVM.java
+++ b/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-app/src/main/java/org/apache/hadoop/mapred/MapReduceChildJVM.java
@@ -149,8 +149,10 @@ public class MapReduceChildJVM {
 
				   private static void setupLog4jProperties(Task task,
			
 
				       Vector<String> vargs,
			
 
				       long logSize) {
			
 
				-    String logLevel = getChildLogLevel(task.conf, task.isMapTask()); 
			
 
				-    MRApps.addLog4jSystemProperties(logLevel, logSize, vargs);
			
 
				+    String logLevel = getChildLogLevel(task.conf, task.isMapTask());
			
 
				+    int numBackups = task.conf.getInt(MRJobConfig.TASK_LOG_BACKUPS,
			
 
				+        MRJobConfig.DEFAULT_TASK_LOG_BACKUPS);
			
 
				+    MRApps.addLog4jSystemProperties(logLevel, logSize, numBackups, vargs);
			
 
				   }
			
 
				 
			
 
				   public static List<String> getVMCommand(
			
--- a/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-common/src/main/java/org/apache/hadoop/mapreduce/v2/util/MRApps.java
+++ b/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-common/src/main/java/org/apache/hadoop/mapreduce/v2/util/MRApps.java
@@ -61,6 +61,7 @@ import org.apache.hadoop.yarn.exceptions.YarnRuntimeException;
 
				 import org.apache.hadoop.yarn.util.ApplicationClassLoader;
			
 
				 import org.apache.hadoop.yarn.util.Apps;
			
 
				 import org.apache.hadoop.yarn.util.ConverterUtils;
			
 
				+import org.apache.log4j.RollingFileAppender;
			
 
				 
			
 
				 /**
			
 
				  * Helper class for MR applications
			
@@ -476,16 +477,24 @@ public class MRApps extends Apps {
 
				    * Add the JVM system properties necessary to configure {@link ContainerLogAppender}.
			
 
				    * @param logLevel the desired log level (eg INFO/WARN/DEBUG)
			
 
				    * @param logSize See {@link ContainerLogAppender#setTotalLogFileSize(long)}
			
 
				+   * @param numBackups See {@link RollingFileAppender#setMaxBackupIndex(int)}
			
 
				    * @param vargs the argument list to append to
			
 
				    */
			
 
				   public static void addLog4jSystemProperties(
			
 
				-      String logLevel, long logSize, List<String> vargs) {
			
 
				+      String logLevel, long logSize, int numBackups, List<String> vargs) {
			
 
				     vargs.add("-Dlog4j.configuration=container-log4j.properties");
			
 
				     vargs.add("-D" + YarnConfiguration.YARN_APP_CONTAINER_LOG_DIR + "=" +
			
 
				         ApplicationConstants.LOG_DIR_EXPANSION_VAR);
			
 
				     vargs.add(
			
 
				         "-D" + YarnConfiguration.YARN_APP_CONTAINER_LOG_SIZE + "=" + logSize);
			
 
				-    vargs.add("-Dhadoop.root.logger=" + logLevel + ",CLA"); 
			
 
				+    if (logSize > 0L && numBackups > 0) {
			
 
				+      // log should be rolled
			
 
				+      vargs.add("-D" + YarnConfiguration.YARN_APP_CONTAINER_LOG_BACKUPS + "="
			
 
				+          + numBackups);
			
 
				+      vargs.add("-Dhadoop.root.logger=" + logLevel + ",CRLA");
			
 
				+    } else {
			
 
				+      vargs.add("-Dhadoop.root.logger=" + logLevel + ",CLA");
			
 
				+    }
			
 
				   }
			
 
				 
			
 
				   /**
			
--- a/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-core/src/main/java/org/apache/hadoop/mapreduce/MRJobConfig.java
+++ b/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-core/src/main/java/org/apache/hadoop/mapreduce/MRJobConfig.java
@@ -412,6 +412,10 @@ public interface MRJobConfig {
 
				     MR_AM_PREFIX+"log.level";
			
 
				   public static final String DEFAULT_MR_AM_LOG_LEVEL = "INFO";
			
 
				 
			
 
				+  public static final String MR_AM_LOG_BACKUPS =
			
 
				+      MR_AM_PREFIX + "container.log.backups";
			
 
				+  public static final int DEFAULT_MR_AM_LOG_BACKUPS = 0; // don't roll
			
 
				+
			
 
				   /**The number of splits when reporting progress in MR*/
			
 
				   public static final String MR_AM_NUM_PROGRESS_SPLITS = 
			
 
				     MR_AM_PREFIX+"num-progress-splits";
			
@@ -692,7 +696,11 @@ public interface MRJobConfig {
 
				       + "$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/lib/*";
			
 
				 
			
 
				   public static final String WORKFLOW_ID = "mapreduce.workflow.id";
			
 
				-  
			
 
				+
			
 
				+  public static final String TASK_LOG_BACKUPS =
			
 
				+      MR_PREFIX + "task.container.log.backups";
			
 
				+  public static final int DEFAULT_TASK_LOG_BACKUPS = 0; // don't roll
			
 
				+
			
 
				   public static final String WORKFLOW_NAME = "mapreduce.workflow.name";
			
 
				   
			
 
				   public static final String WORKFLOW_NODE_NAME =
			
--- a/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-core/src/main/resources/mapred-default.xml
+++ b/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-core/src/main/resources/mapred-default.xml
@@ -510,6 +510,31 @@
 
				   </description>
			
 
				 </property>
			
 
				 
			
 
				+<property>
			
 
				+  <name>yarn.app.mapreduce.task.container.log.backups</name>
			
 
				+  <value>0</value>
			
 
				+  <description>Number of backup files for task logs when using
			
 
				+    ContainerRollingLogAppender (CRLA). See
			
 
				+    org.apache.log4j.RollingFileAppender.maxBackupIndex. By default,
			
 
				+    ContainerLogAppender (CLA) is used, and container logs are not rolled. CRLA
			
 
				+    is enabled for tasks when both mapreduce.task.userlog.limit.kb and
			
 
				+    yarn.app.mapreduce.task.container.log.backups are greater than zero.
			
 
				+  </description>
			
 
				+</property>
			
 
				+
			
 
				+<property>
			
 
				+  <name>yarn.app.mapreduce.am.container.log.backups</name>
			
 
				+  <value>0</value>
			
 
				+  <description>Number of backup files for the ApplicationMaster logs when using
			
 
				+    ContainerRollingLogAppender (CRLA). See
			
 
				+    org.apache.log4j.RollingFileAppender.maxBackupIndex. By default,
			
 
				+    ContainerLogAppender (CLA) is used, and container logs are not rolled. CRLA
			
 
				+    is enabled for the ApplicationMaster when both
			
 
				+    mapreduce.task.userlog.limit.kb and
			
 
				+    yarn.app.mapreduce.am.container.log.backups are greater than zero.
			
 
				+  </description>
			
 
				+</property>
			
 
				+
			
 
				 <property>
			
 
				   <name>mapreduce.job.maxtaskfailures.per.tracker</name>
			
 
				   <value>3</value>
			
--- a/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-jobclient/src/main/java/org/apache/hadoop/mapred/YARNRunner.java
+++ b/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-jobclient/src/main/java/org/apache/hadoop/mapred/YARNRunner.java
@@ -392,7 +392,9 @@ public class YARNRunner implements ClientProtocol {
 
				     long logSize = TaskLog.getTaskLogLength(new JobConf(conf));
			
 
				     String logLevel = jobConf.get(
			
 
				         MRJobConfig.MR_AM_LOG_LEVEL, MRJobConfig.DEFAULT_MR_AM_LOG_LEVEL);
			
 
				-    MRApps.addLog4jSystemProperties(logLevel, logSize, vargs);
			
 
				+    int numBackups = jobConf.getInt(MRJobConfig.MR_AM_LOG_BACKUPS,
			
 
				+        MRJobConfig.DEFAULT_MR_AM_LOG_BACKUPS);
			
 
				+    MRApps.addLog4jSystemProperties(logLevel, logSize, numBackups, vargs);
			
 
				 
			
 
				     // Check for Java Lib Path usage in MAP and REDUCE configs
			
 
				     warnForJavaLibPath(conf.get(MRJobConfig.MAP_JAVA_OPTS,""), "map", 
			
--- a/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-jobclient/src/test/java/org/apache/hadoop/mapreduce/v2/TestMRJobs.java
+++ b/hadoop-mapreduce-project/hadoop-mapreduce-client/hadoop-mapreduce-client-jobclient/src/test/java/org/apache/hadoop/mapreduce/v2/TestMRJobs.java
@@ -23,10 +23,12 @@ import java.io.File;
 
				 import java.io.FileInputStream;
			
 
				 import java.io.FileNotFoundException;
			
 
				 import java.io.FileOutputStream;
			
 
				+import java.io.InputStreamReader;
			
 
				 import java.io.IOException;
			
 
				 import java.io.StringReader;
			
 
				 import java.net.URI;
			
 
				 import java.security.PrivilegedExceptionAction;
			
 
				+import java.util.EnumSet;
			
 
				 import java.util.HashMap;
			
 
				 import java.util.Map;
			
 
				 import java.util.jar.JarOutputStream;
			
@@ -53,6 +55,8 @@ import org.apache.hadoop.io.IOUtils;
 
				 import org.apache.hadoop.io.LongWritable;
			
 
				 import org.apache.hadoop.io.NullWritable;
			
 
				 import org.apache.hadoop.io.Text;
			
 
				+import org.apache.hadoop.mapred.JobConf;
			
 
				+import org.apache.hadoop.mapred.TaskLog;
			
 
				 import org.apache.hadoop.mapreduce.Counters;
			
 
				 import org.apache.hadoop.mapreduce.Job;
			
 
				 import org.apache.hadoop.mapreduce.JobCounter;
			
@@ -65,17 +69,22 @@ import org.apache.hadoop.mapreduce.TaskCompletionEvent;
 
				 import org.apache.hadoop.mapreduce.TaskID;
			
 
				 import org.apache.hadoop.mapreduce.TaskReport;
			
 
				 import org.apache.hadoop.mapreduce.TaskType;
			
 
				+import org.apache.hadoop.mapreduce.TypeConverter;
			
 
				 import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
			
 
				 import org.apache.hadoop.mapreduce.lib.output.FileOutputCommitter;
			
 
				 import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
			
 
				 import org.apache.hadoop.mapreduce.lib.output.NullOutputFormat;
			
 
				 import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
			
 
				+import org.apache.hadoop.mapreduce.v2.api.records.JobId;
			
 
				 import org.apache.hadoop.security.UserGroupInformation;
			
 
				 import org.apache.hadoop.security.token.Token;
			
 
				 import org.apache.hadoop.security.token.TokenIdentifier;
			
 
				 import org.apache.hadoop.util.JarFinder;
			
 
				 import org.apache.hadoop.util.Shell;
			
 
				+import org.apache.hadoop.yarn.api.records.ApplicationId;
			
 
				 import org.apache.hadoop.yarn.conf.YarnConfiguration;
			
 
				+import org.apache.hadoop.yarn.server.resourcemanager.rmapp.RMAppState;
			
 
				+import org.apache.log4j.Level;
			
 
				 import org.junit.AfterClass;
			
 
				 import org.junit.Assert;
			
 
				 import org.junit.BeforeClass;
			
@@ -84,6 +93,9 @@ import org.junit.Test;
 
				 public class TestMRJobs {
			
 
				 
			
 
				   private static final Log LOG = LogFactory.getLog(TestMRJobs.class);
			
 
				+  private static final EnumSet<RMAppState> TERMINAL_RM_APP_STATES =
			
 
				+      EnumSet.of(RMAppState.FINISHED, RMAppState.FAILED, RMAppState.KILLED);
			
 
				+  private static final int NUM_NODE_MGRS = 3;
			
 
				 
			
 
				   protected static MiniMRYarnCluster mrCluster;
			
 
				   protected static MiniDFSCluster dfsCluster;
			
@@ -122,7 +134,8 @@ public class TestMRJobs {
 
				     }
			
 
				 
			
 
				     if (mrCluster == null) {
			
 
				-      mrCluster = new MiniMRYarnCluster(TestMRJobs.class.getName(), 3);
			
 
				+      mrCluster = new MiniMRYarnCluster(TestMRJobs.class.getName(),
			
 
				+          NUM_NODE_MGRS);
			
 
				       Configuration conf = new Configuration();
			
 
				       conf.set("fs.defaultFS", remoteFs.getUri().toString());   // use HDFS
			
 
				       conf.set(MRJobConfig.MR_AM_STAGING_DIR, "/apps_staging_dir");
			
@@ -416,6 +429,115 @@ public class TestMRJobs {
 
				     // TODO later:  add explicit "isUber()" checks of some sort
			
 
				   }
			
 
				 
			
 
				+  @Test(timeout = 120000)
			
 
				+  public void testContainerRollingLog() throws IOException,
			
 
				+      InterruptedException, ClassNotFoundException {
			
 
				+    if (!(new File(MiniMRYarnCluster.APPJAR)).exists()) {
			
 
				+      LOG.info("MRAppJar " + MiniMRYarnCluster.APPJAR
			
 
				+          + " not found. Not running test.");
			
 
				+      return;
			
 
				+    }
			
 
				+
			
 
				+    final SleepJob sleepJob = new SleepJob();
			
 
				+    final JobConf sleepConf = new JobConf(mrCluster.getConfig());
			
 
				+    sleepConf.set(MRJobConfig.MAP_LOG_LEVEL, Level.ALL.toString());
			
 
				+    sleepConf.set(MRJobConfig.MR_AM_LOG_LEVEL, Level.ALL.toString());
			
 
				+    sleepConf.setLong(MRJobConfig.TASK_USERLOG_LIMIT, 1);
			
 
				+    sleepConf.setInt(MRJobConfig.TASK_LOG_BACKUPS, 3);
			
 
				+    sleepConf.setInt(MRJobConfig.MR_AM_LOG_BACKUPS, 7);
			
 
				+    sleepJob.setConf(sleepConf);
			
 
				+
			
 
				+    final Job job = sleepJob.createJob(1, 0, 1L, 100, 0L, 0);
			
 
				+    job.setJarByClass(SleepJob.class);
			
 
				+    job.addFileToClassPath(APP_JAR); // The AppMaster jar itself.
			
 
				+    job.waitForCompletion(true);
			
 
				+    final JobId jobId = TypeConverter.toYarn(job.getJobID());
			
 
				+    final ApplicationId appID = jobId.getAppId();
			
 
				+    int pollElapsed = 0;
			
 
				+    while (true) {
			
 
				+      Thread.sleep(1000);
			
 
				+      pollElapsed += 1000;
			
 
				+      if (TERMINAL_RM_APP_STATES.contains(
			
 
				+        mrCluster.getResourceManager().getRMContext().getRMApps().get(appID)
			
 
				+            .getState())) {
			
 
				+        break;
			
 
				+      }
			
 
				+      if (pollElapsed >= 60000) {
			
 
				+        LOG.warn("application did not reach terminal state within 60 seconds");
			
 
				+        break;
			
 
				+      }
			
 
				+    }
			
 
				+    Assert.assertEquals(RMAppState.FINISHED, mrCluster.getResourceManager()
			
 
				+        .getRMContext().getRMApps().get(appID).getState());
			
 
				+
			
 
				+    // Job finished, verify logs
			
 
				+    //
			
 
				+
			
 
				+    final String appIdStr = appID.toString();
			
 
				+    final String appIdSuffix = appIdStr.substring("application_".length(),
			
 
				+        appIdStr.length());
			
 
				+    final String containerGlob = "container_" + appIdSuffix + "_*_*";
			
 
				+    final String syslogGlob = appIdStr
			
 
				+        + Path.SEPARATOR + containerGlob
			
 
				+        + Path.SEPARATOR + TaskLog.LogName.SYSLOG;
			
 
				+    int numAppMasters = 0;
			
 
				+    int numMapTasks = 0;
			
 
				+
			
 
				+    for (int i = 0; i < NUM_NODE_MGRS; i++) {
			
 
				+      final Configuration nmConf = mrCluster.getNodeManager(i).getConfig();
			
 
				+      for (String logDir :
			
 
				+               nmConf.getTrimmedStrings(YarnConfiguration.NM_LOG_DIRS)) {
			
 
				+        final Path absSyslogGlob =
			
 
				+            new Path(logDir + Path.SEPARATOR + syslogGlob);
			
 
				+        LOG.info("Checking for glob: " + absSyslogGlob);
			
 
				+        final FileStatus[] syslogs = localFs.globStatus(absSyslogGlob);
			
 
				+        for (FileStatus slog : syslogs) {
			
 
				+          // check all syslogs for the container
			
 
				+          //
			
 
				+          final FileStatus[] sysSiblings = localFs.globStatus(new Path(
			
 
				+              slog.getPath().getParent(), TaskLog.LogName.SYSLOG + "*"));
			
 
				+          boolean foundAppMaster = false;
			
 
				+          floop:
			
 
				+          for (FileStatus f : sysSiblings) {
			
 
				+            final BufferedReader reader = new BufferedReader(
			
 
				+                new InputStreamReader(localFs.open(f.getPath())));
			
 
				+            String line;
			
 
				+            try {
			
 
				+              while ((line = reader.readLine()) != null) {
			
 
				+                if (line.contains(MRJobConfig.APPLICATION_MASTER_CLASS)) {
			
 
				+                  foundAppMaster = true;
			
 
				+                  break floop;
			
 
				+                }
			
 
				+              }
			
 
				+            } finally {
			
 
				+              reader.close();
			
 
				+            }
			
 
				+          }
			
 
				+
			
 
				+          if (foundAppMaster) {
			
 
				+            numAppMasters++;
			
 
				+          } else {
			
 
				+            numMapTasks++;
			
 
				+          }
			
 
				+
			
 
				+          Assert.assertSame("Number of sylog* files",
			
 
				+              foundAppMaster
			
 
				+                ? sleepConf.getInt(MRJobConfig.MR_AM_LOG_BACKUPS, 0) + 1
			
 
				+                : sleepConf.getInt(MRJobConfig.TASK_LOG_BACKUPS, 0) + 1,
			
 
				+              sysSiblings.length);
			
 
				+        }
			
 
				+      }
			
 
				+    }
			
 
				+    // Make sure we checked non-empty set
			
 
				+    //
			
 
				+    Assert.assertEquals("No AppMaster log found!", 1, numAppMasters);
			
 
				+    if (sleepConf.getBoolean(MRJobConfig.JOB_UBERTASK_ENABLE, false)) {
			
 
				+      Assert.assertEquals("MapTask log with uber found!", 0, numMapTasks);
			
 
				+    } else {
			
 
				+      Assert.assertEquals("No MapTask log found!", 1, numMapTasks);
			
 
				+    }
			
 
				+  }
			
 
				+
			
 
				   public static class DistributedCacheChecker extends
			
 
				       Mapper<LongWritable, Text, NullWritable, NullWritable> {
			
 
				 
			
--- a/hadoop-yarn-project/CHANGES.txt
+++ b/hadoop-yarn-project/CHANGES.txt
@@ -433,6 +433,12 @@ Release 2.4.0 - UNRELEASED
 
				     YARN-1351. Invalid string format in Fair Scheduler log warn message
			
 
				     (Konstantin Weitz via Sandy Ryza)
			
 
				 
			
 
				+    YARN-1608. LinuxContainerExecutor has a few DEBUG messages at INFO level
			
 
				+    (kasha)
			
 
				+
			
 
				+    YARN-1606. Fix the default value of yarn.resourcemanager.zk-timeout-ms 
			
 
				+    in yarn-default.xml (kasha)
			
 
				+
			
 
				 Release 2.3.0 - UNRELEASED
			
 
				 
			
 
				   INCOMPATIBLE CHANGES
			
--- a/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-api/src/main/java/org/apache/hadoop/yarn/conf/YarnConfiguration.java
+++ b/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-api/src/main/java/org/apache/hadoop/yarn/conf/YarnConfiguration.java
@@ -939,6 +939,9 @@ public class YarnConfiguration extends Configuration {
 
				   public static final String YARN_APP_CONTAINER_LOG_SIZE =
			
 
				       YARN_PREFIX + "app.container.log.filesize";
			
 
				 
			
 
				+  public static final String YARN_APP_CONTAINER_LOG_BACKUPS =
			
 
				+      YARN_PREFIX + "app.container.log.backups";
			
 
				+
			
 
				   ////////////////////////////////
			
 
				   // AHS Configs
			
 
				   ////////////////////////////////
			
--- a/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-common/src/main/java/org/apache/hadoop/yarn/ContainerRollingLogAppender.java
+++ b/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-common/src/main/java/org/apache/hadoop/yarn/ContainerRollingLogAppender.java
@@ -0,0 +1,65 @@
 
				+/**
			
 
				+ * Licensed to the Apache Software Foundation (ASF) under one
			
 
				+ * or more contributor license agreements.  See the NOTICE file
			
 
				+ * distributed with this work for additional information
			
 
				+ * regarding copyright ownership.  The ASF licenses this file
			
 
				+ * to you under the Apache License, Version 2.0 (the
			
 
				+ * "License"); you may not use this file except in compliance
			
 
				+ * with the License.  You may obtain a copy of the License at
			
 
				+ *
			
 
				+ *     http://www.apache.org/licenses/LICENSE-2.0
			
 
				+ *
			
 
				+ * Unless required by applicable law or agreed to in writing, software
			
 
				+ * distributed under the License is distributed on an "AS IS" BASIS,
			
 
				+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
			
 
				+ * See the License for the specific language governing permissions and
			
 
				+ * limitations under the License.
			
 
				+ */
			
 
				+
			
 
				+package org.apache.hadoop.yarn;
			
 
				+
			
 
				+import org.apache.hadoop.classification.InterfaceAudience.Public;
			
 
				+import org.apache.hadoop.classification.InterfaceStability.Unstable;
			
 
				+import org.apache.log4j.RollingFileAppender;
			
 
				+
			
 
				+import java.io.File;
			
 
				+import java.io.Flushable;
			
 
				+
			
 
				+/**
			
 
				+ * A simple log4j-appender for container's logs.
			
 
				+ *
			
 
				+ */
			
 
				+@Public
			
 
				+@Unstable
			
 
				+public class ContainerRollingLogAppender extends RollingFileAppender
			
 
				+  implements Flushable {
			
 
				+  private String containerLogDir;
			
 
				+
			
 
				+  @Override
			
 
				+  public void activateOptions() {
			
 
				+    synchronized (this) {
			
 
				+      setFile(new File(this.containerLogDir, "syslog").toString());
			
 
				+      setAppend(true);
			
 
				+      super.activateOptions();
			
 
				+    }
			
 
				+  }
			
 
				+
			
 
				+  @Override
			
 
				+  public void flush() {
			
 
				+    if (qw != null) {
			
 
				+      qw.flush();
			
 
				+    }
			
 
				+  }
			
 
				+
			
 
				+  /**
			
 
				+   * Getter/Setter methods for log4j.
			
 
				+   */
			
 
				+
			
 
				+  public String getContainerLogDir() {
			
 
				+    return this.containerLogDir;
			
 
				+  }
			
 
				+
			
 
				+  public void setContainerLogDir(String containerLogDir) {
			
 
				+    this.containerLogDir = containerLogDir;
			
 
				+  }
			
 
				+}
			
--- a/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-common/src/main/resources/yarn-default.xml
+++ b/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-common/src/main/resources/yarn-default.xml
@@ -335,7 +335,7 @@
 
				     Expirations happens when the cluster does not hear from the client within
			
 
				     the specified session timeout period (i.e. no heartbeat).</description>
			
 
				     <name>yarn.resourcemanager.zk-timeout-ms</name>
			
 
				-    <value>60000</value>
			
 
				+    <value>10000</value>
			
 
				   </property>
			
 
				 
			
 
				   <property>
			
--- a/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-nodemanager/src/main/java/org/apache/hadoop/yarn/server/nodemanager/LinuxContainerExecutor.java
+++ b/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-nodemanager/src/main/java/org/apache/hadoop/yarn/server/nodemanager/LinuxContainerExecutor.java
@@ -217,8 +217,6 @@ public class LinuxContainerExecutor extends ContainerExecutor {
 
				     }
			
 
				     String[] commandArray = command.toArray(new String[command.size()]);
			
 
				     ShellCommandExecutor shExec = new ShellCommandExecutor(commandArray);
			
 
				-    // TODO: DEBUG
			
 
				-    LOG.info("initApplication: " + Arrays.toString(commandArray));
			
 
				     if (LOG.isDebugEnabled()) {
			
 
				       LOG.debug("initApplication: " + Arrays.toString(commandArray));
			
 
				     }
			
@@ -274,8 +272,9 @@ public class LinuxContainerExecutor extends ContainerExecutor {
 
				         String[] commandArray = command.toArray(new String[command.size()]);
			
 
				         shExec = new ShellCommandExecutor(commandArray, null, // NM's cwd
			
 
				             container.getLaunchContext().getEnvironment()); // sanitized env
			
 
				-        // DEBUG
			
 
				-        LOG.info("launchContainer: " + Arrays.toString(commandArray));
			
 
				+        if (LOG.isDebugEnabled()) {
			
 
				+          LOG.debug("launchContainer: " + Arrays.toString(commandArray));
			
 
				+        }
			
 
				         shExec.execute();
			
 
				         if (LOG.isDebugEnabled()) {
			
 
				           logOutput(shExec.getOutput());
			
@@ -374,7 +373,6 @@ public class LinuxContainerExecutor extends ContainerExecutor {
 
				     }
			
 
				     String[] commandArray = command.toArray(new String[command.size()]);
			
 
				     ShellCommandExecutor shExec = new ShellCommandExecutor(commandArray);
			
 
				-    LOG.info(" -- DEBUG -- deleteAsUser: " + Arrays.toString(commandArray));
			
 
				     if (LOG.isDebugEnabled()) {
			
 
				       LOG.debug("deleteAsUser: " + Arrays.toString(commandArray));
			
 
				     }
			
--- a/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-nodemanager/src/main/resources/container-log4j.properties
+++ b/hadoop-yarn-project/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-nodemanager/src/main/resources/container-log4j.properties
@@ -35,6 +35,13 @@ log4j.appender.CLA.totalLogFileSize=${yarn.app.container.log.filesize}
 
				 log4j.appender.CLA.layout=org.apache.log4j.PatternLayout
			
 
				 log4j.appender.CLA.layout.ConversionPattern=%d{ISO8601} %p [%t] %c: %m%n
			
 
				 
			
 
				+log4j.appender.CRLA=org.apache.hadoop.yarn.ContainerRollingLogAppender
			
 
				+log4j.appender.CRLA.containerLogDir=${yarn.app.container.log.dir}
			
 
				+log4j.appender.CRLA.maximumFileSize=${yarn.app.container.log.filesize}
			
 
				+log4j.appender.CRLA.maxBackupIndex=${yarn.app.container.log.backups}
			
 
				+log4j.appender.CRLA.layout=org.apache.log4j.PatternLayout
			
 
				+log4j.appender.CRLA.layout.ConversionPattern=%d{ISO8601} %p [%t] %c: %m%n
			
 
				+
			
 
				 #
			
 
				 # Event Counter Appender
			
 
				 # Sends counts of logging messages at different severity levels to Hadoop Metrics.