Крок 1. Підготуємо вхідний файл
Створимо файл з числами:
echo -e “5\n1\n7\n3\n9\n2\n6\n4\n8” > numbers.txt
Завантажимо його у HDFS:
hdfs dfs -mkdir -p /user/cloudera/sort_input
hdfs dfs -put numbers.txt /user/cloudera/sort_input/
🔹 Крок 2. Запустимо Sort
hadoop jar /usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar sort \
/user/cloudera/sort_input /user/cloudera/sort_output
Якщо папка /user/cloudera/sort_output існує, видаляємо:
hdfs dfs -rm -r /user/cloudera/sort_output
🔹 Крок 3. Подивимось результат
hdfs dfs -ls /user/cloudera/sort_output
hdfs dfs -cat /user/cloudera/sort_output/part-r-00000
Отримаємо відсортований список чисел:
1
2
3
4
5
6
7
8
9
✅ Таким чином ми використали стандартний приклад MapReduce Sort, який автоматично впорядкував дані з вхідного файлу.
