It seems to me that the Cloudera Manager Installer,
cloudera-manager-installer.bin, fails due to timeout in a slow network. So, I gave up using cloudera-manager-installer.bin and decided to install Cloudera Manager and CDH4 manually.- JDK
 - Download an RPM of JDK from Oracle's site.
 
- Install the RPM.
 $ rpm -Uvh jdk-7u9-linux-x64.rpm 
 
- Set up alternativesmanually if/usr/bin/javahas not been replaced.
 $ alternatives --install /usr/bin/java java \ /usr/java/default/bin/java 3 $ alternatives --config java
 
 
 
- Download an RPM of JDK from Oracle's site.
- SE Linux
 - Disalbe SE Linux to follow the Cloudera Manager installation instruction.
 $ vi /etc/selinux/config // Set SELINUX=disabled
 
- Reboot the machine to make the new settings effective.
 $ reboot 
 
 
- Disalbe SE Linux to follow the Cloudera Manager installation instruction.
- iptables
 - Disable iptables to follow the Cloudera Manager installation instruction.
 $ service iptables stop 
 
- Disable iptables to follow the Cloudera Manager installation instruction.
- PostgreSQL
 - Install PostgreSQL for Cloudera Manager.
 $ yum install postgresql $ yum install postgresql-server 
 
- Install PostgreSQL for Cloudera Manager.
- Cloudera Manager
 - Install tools needed to copy Cloudera Manager repository.
 $ yum install yum-utils createrepo 
- Prepare information about Cloudera Manager repository. Create a file named cloudera-manager.repounder/etc/yum.repos.d/whose content is shown below.
 $ vi /etc/yum.repos.d/cloudera-manager.repo 
 [cloudera-manager] name=Cloudera Manager baseurl=http://archive.cloudera.com/cm4/redhat/6/x86_64/cm/4/ gpgkey=http://archive.cloudera.com/cm4/redhat/6/x86_64/cm/RPM-GPG-KEY-cloudera gpgcheck=1 
- Copy cloudera-manager repository.
 $ mkdir -p /usr/local/repos $ cd /usr/local/repos $ reposync -r cloudera-manager $ createrepo /usr/local/repos/cloudera-manager 
- Change the place of cloudera-manager repository to the cloned repository on the local file system. Open /etc/yum.repos.d/cloudera-manager.repoand change the value ofbaseurlas follows. Note that the number of slashes afterfile:is 3.
 $ vi /etc/yum.repos.d/cloudera-manager.repo 
 baseurl=file:///usr/local/repos/cloudera-manager/ 
 
- Import the GPG key of Cloudera Manager.
 $ rpm --import \ http://archive.cloudera.com/cm4/redhat/6/x86_64/cm/RPM-GPG-KEY-cloudera
- Install components of Cloudera Manager.
 $ yum install cloudera-manager-daemons $ yum install cloudera-manager-server $ yum install cloudera-manager-server-db 
- Initialize the database of Cloudera Manager.
 $ service cloudera-scm-server-db initdb 
 
 
 
 
 
 
- Install tools needed to copy Cloudera Manager repository.
- CDH
 - Prepare information about CDH repository. Create a file named cloudera-cdh4.repounder/etc/yum.repos.d/whose content is shown below.
 $ vi /etc/yum.repos.d/cloudera-cdh4.repo 
 [cloudera-cdh4] name=Cloudera's Distribution for Hadoop, Version 4 baseurl=http://archive.cloudera.com/cdh4/redhat/6/x86_64/cdh/4/ gpgkey=http://archive.cloudera.com/cdh4/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera gpgcheck=1 
- Copy cloudera-cdh4 repository.
 $ cd /usr/local/repos $ reposync -r cloudera-cdh4 $ createrepo /usr/local/repos/cloudera-cdh4 
- Change the place of cloudera-cdh4 repository to the cloned repository on the local file system. Open /etc/yum.repos.d/cloudera-cdh4.repoand change the value ofbaseurlas follows. Note that the number of slashes afterfile:is 3.
 $ vi /etc/yum.repos.d/cloudera-cdh4.repo 
 baseurl=file:///usr/local/repos/cloudera-cdh4/ 
 
- Import the GPG key of CDH.
 $ rpm --import \ http://archive.cloudera.com/cdh4/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
- Install components of CDH. The example below installs ZooKeeper, HDFS, MapReduce and HBase onto a single machine.
 $ yum install hadoop-0.20-mapreduce-jobtracker $ yum install hadoop-hdfs-namenode $ yum install hadoop-hdfs-secondarynamenode $ yum install hadoop-0.20-mapreduce-tasktracker $ yum install hadoop-hdfs-datanode $ yum install hadoop-client $ yum install zookeeper-server $ yum install hbase 
 
 
 
 
- Prepare information about CDH repository. Create a file named 
- Cloudera Manager Agent
 - Install Cloudera Manager Agent onto machines to be managed by Cloudera Manager.
 $ yum install cloudera-manager-agent 
- Edit the configuration file of Cloudera Manager Agent to set a proper value to server_host.
 $ vi /etc/cloudera-scm-agent/config.ini 
 
 
- Install Cloudera Manager Agent onto machines to be managed by Cloudera Manager.
- Cluster Setup
- Start Cloudera Manager.
 $ service cloudera-scm-server-db start $ service cloudera-scm-server start 
- Start Cloudera Manager Agent.
 $ service cloudera-scm-agent start 
- Access the Web UI of Cloudera Manager by a web browser. If your Cloudera Manager is running on localhost, access the URL below. The default ID and password to login the page are "admin" and "admin".
 http://localhost:7180/ 
- Setup your cluster by Cloudera Manager Web UI. Note that you can skip the steps to install CDH onto cluster machines via Cloudera Manager because you have already done it.
 
 
 
 
- Start Cloudera Manager.
Cloudera Manager と CDH4 を手作業でインストールする
Cloudera Manager のインストーラーである
cloudera-manager-installer.bin は、速度の遅いネットワークではタイムアウトのせいで失敗してしまう (ように見える)。そこで、cloudera-manager-installer.bin を使うことを諦め、手作業で Cloudera Manager と CDH4 をインストールすることにした。- JDK
 - Oracle のサイトから JDK の RPM をダウンロードする。
 
- RPM をインストールする。
 $ rpm -Uvh jdk-7u9-linux-x64.rpm 
 
- /usr/bin/javaが置き換わっていない場合は手作業で- alternativesを設定する。
 - $ alternatives --install /usr/bin/java java \ /usr/java/default/bin/java 3 $ alternatives --config java
 
 
 
- Oracle のサイトから JDK の RPM をダウンロードする。
- SE Linux
 - Cloudera Manager のインストール手順に従い、SE Linux を無効にする。
 $ vi /etc/selinux/config // SELINUX=disabled と設定する。
 
- 新しい設定を有効にするため、マシンを再起動する。
 $ reboot 
 
 
- Cloudera Manager のインストール手順に従い、SE Linux を無効にする。
- iptables
 - Cloudera Manager のインストール手順に従い、iptables を無効にする。
 $ service iptables stop 
 
- Cloudera Manager のインストール手順に従い、iptables を無効にする。
- PostgreSQL
 - Cloudera Manager が使うので、PostgreSQL をインストールする。
 $ yum install postgresql $ yum install postgresql-server 
 
- Cloudera Manager が使うので、PostgreSQL をインストールする。
- Cloudera Manager
 - Cloudera Manager リポジトリをコピーするのに必要なツールをインストールする。
 $ yum install yum-utils createrepo 
- Cloudera Manager リポジトリの情報を用意する。cloudera-manager.repoという名前のファイルを/etc/yum.repos.d/ディレクトリに作成し、下記の内容を書き込む。
 $ vi /etc/yum.repos.d/cloudera-manager.repo 
 [cloudera-manager] name=Cloudera Manager baseurl=http://archive.cloudera.com/cm4/redhat/6/x86_64/cm/4/ gpgkey=http://archive.cloudera.com/cm4/redhat/6/x86_64/cm/RPM-GPG-KEY-cloudera gpgcheck=1 
- cloudera-manager リポジトリをコピーする。
 $ mkdir -p /usr/local/repos $ cd /usr/local/repos $ reposync -r cloudera-manager $ createrepo /usr/local/repos/cloudera-manager 
- cloudera-manager リポジトリの場所を、ローカルファイルシステム上にコピーしたリポジトリへと変更する。/etc/yum.repos.d/cloudera-manager.repoを開き、baseurlの値を次のように変更する。file:の後に続くスラッシュの数は 3 なので注意。
 $ vi /etc/yum.repos.d/cloudera-manager.repo 
 baseurl=file:///usr/local/repos/cloudera-manager/ 
 
- Cloudera Manager の GPG キーをインポートする。
 $ rpm --import \ http://archive.cloudera.com/cm4/redhat/6/x86_64/cm/RPM-GPG-KEY-cloudera
- Cloudera Manager のコンポーネントをインストールする。
 $ yum install cloudera-manager-daemons $ yum install cloudera-manager-server $ yum install cloudera-manager-server-db 
- Cloudera Manager のデータベースを初期化する。
 $ service cloudera-scm-server-db initdb 
 
 
 
 
 
 
- Cloudera Manager リポジトリをコピーするのに必要なツールをインストールする。
- CDH
 - CDH リポジトリの情報を用意する。cloudera-cdh4.repoという名前のファイルを/etc/yum.repos.d/ディレクトリに作成し、下記の内容を書き込む。
 $ vi /etc/yum.repos.d/cloudera-cdh4.repo 
 [cloudera-cdh4] name=Cloudera's Distribution for Hadoop, Version 4 baseurl=http://archive.cloudera.com/cdh4/redhat/6/x86_64/cdh/4/ gpgkey=http://archive.cloudera.com/cdh4/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera gpgcheck=1 
- cloudera-cdh4 リポジトリをコピーする。
 $ cd /usr/local/repos $ reposync -r cloudera-cdh4 $ createrepo /usr/local/repos/cloudera-cdh4 
- cloudera-cdh4 リポジトリの場所を、ローカルファイルシステム上にコピーしたリポジトリへと変更する。/etc/yum.repos.d/cloudera-cdh4.repoを開き、baseurlの値を次のように変更する。file:の後に続くスラッシュの数は 3 なので注意。
 $ vi /etc/yum.repos.d/cloudera-cdh4.repo 
 baseurl=file:///usr/local/repos/cloudera-cdh4/ 
 
- CDH の GPG キーをインポートする。
 $ rpm --import \ http://archive.cloudera.com/cdh4/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
- CDH のコンポーネントをインストールする。下記の例では、一台のマシン上に ZooKeeper, HDFS, MapReduce, HBase をインストールしている。
 $ yum install hadoop-0.20-mapreduce-jobtracker $ yum install hadoop-hdfs-namenode $ yum install hadoop-hdfs-secondarynamenode $ yum install hadoop-0.20-mapreduce-tasktracker $ yum install hadoop-hdfs-datanode $ yum install hadoop-client $ yum install zookeeper-server $ yum install hbase 
 
 
 
 
- CDH リポジトリの情報を用意する。
- Cloudera Manager Agent
 - Cloudera Manager で管理するマシンに Cloudera Manager Agent をインストールする。
 $ yum install cloudera-manager-agent 
- Cloudera Manager Agent の設定ファイルを開き、server_hostに適切な値を設定する。
 $ vi /etc/cloudera-scm-agent/config.ini 
 
 
- Cloudera Manager で管理するマシンに Cloudera Manager Agent をインストールする。
- クラスタ設定
- Cloudera Manager を起動する。
 $ service cloudera-scm-server-db start $ service cloudera-scm-server start 
- Cloudera Manager Agent を起動する。
 $ service cloudera-scm-agent start 
- ウェブブラウザで Cloudera Manager のウェブ UI にアクセスする。Cloudera Manager が localhostで実行中であるなら、次の URL にアクセスする。ページにログインするためのデフォルトの ID とパスワードは admin / admin である。
 http://localhost:7180/ 
- Cloudera Manager ウェブ UI でクラスタをセットアップする。既に CDH をインストール済みなので、Cloudera Manager を使ってクラスタマシン上に CDH をインストールするという手順はスキップできる。
 
 
 
 
- Cloudera Manager を起動する。
 
