Пошук:

Крок 1. Підготуємо вхідний файл

Створимо файл з числами:

echo -e “5\n1\n7\n3\n9\n2\n6\n4\n8” > numbers.txt

Завантажимо його у HDFS:

hdfs dfs -mkdir -p /user/cloudera/sort_input
hdfs dfs -put numbers.txt /user/cloudera/sort_input/

🔹 Крок 2. Запустимо Sort
hadoop jar /usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar sort \
/user/cloudera/sort_input /user/cloudera/sort_output

Якщо папка /user/cloudera/sort_output існує, видаляємо:

hdfs dfs -rm -r /user/cloudera/sort_output

🔹 Крок 3. Подивимось результат
hdfs dfs -ls /user/cloudera/sort_output
hdfs dfs -cat /user/cloudera/sort_output/part-r-00000

Отримаємо відсортований список чисел:

1
2
3
4
5
6
7
8
9

✅ Таким чином ми використали стандартний приклад MapReduce Sort, який автоматично впорядкував дані з вхідного файлу.