Jam's story
궁금했던것 질문과 답변 본문
1. fs vs dfs 다른 점
hadoop fs <args>
hdfs dfs <args>
물론 다르다고 생각되지 않습니다. 결과는 아주 다르다면 다르죠.. 그러나 차이점은 분명 있습니다. 구차이 나누자면 hadoop fs 명령어는 hdfs, local file system (로컬 파일 시스템), web hdfs 와 같은 서로 다른 파일 시스템 위에 포함되어 사용할 수 있습니다. 그러나 dfs는 오직 분산환경 파일 시스템에서만 사용가능하죠. 하둡에서만 hdfs dfs 명령어를 사용하게 됩니다. 그렇지만 서로 사용법은 매우 유사합니다. 분산파일을 위한 명령어이기에 동일한 <args> 아규먼트를 사용한다면 머 구별되지 않겠죠?
오히려 차이점이 있는 아규먼트는 하둡을 사용하면서 로컬 파일 시스템에서 혹은 웹 hdfs (web hdfs)에서 사용할 명령어만 있다면 그것이 바로 차이점이겠죠?
2. -ls vs -lsr
-ls 명령어 : 하둡 분산 파일 시스템(HDFS)에서만 사용하는 것이죠. 여기서 주의점은 리눅스의 명령어와 하둡 명령어가 매우 유사하다는 점을 보신다면 hadoop -ls 명령어는 하둡에서 사용가능하고, ls 명령어는 리눅스 명령어이라는 점을 분명 나누어야 하겠죠?
-lsr 명령어: lsr (리눅스에서 사용하는 작은 수 부터 나열하는) 명령어와 동일하게 하둡에서도 hadoop -lsr 명령어를 사용할 수 있습니다. 분명 하둡은 리눅스 명령어를 사용하도록 처음부터 계산된 플랫폼입니다. 폴더와 파일을 모두 출력하는 디스플레이 역할을 도와주고 있는 것 역시 하둡과 리눅스 동일한 방법으로 나아갑니다. 그리하여 하둡 강의 시간에 만든 xml 파일을 디스플레이하여 문제가 없는 지 확인 하는 작업을 한 것 뿐이죠.. 그저 -lsr 명령어가 xml 파일이 문제가 있는지 확인하는 명령어는 아닙니다. 혼돈이 있는 듯 하네요.. 이제 이해하셨죠?
3. cat 명령어
cat 명령어는 리눅스 명령어와 같은 기능을 합니다. 파일의 내용을 디스플레이하는 역할이죠... cat 으로 출력물을 확인하여 컨텐츠가 잘 들어 있는지 확인하는 작업에서 그 명령어를 단지 사용하는 것이죠. cat 명령어 자체를 사용하여 컨텐츠가 동일한지 확인한다는 것은 아니죠.. 강의하는 제 자신이 그렇게 판단하는 것이죠..
리눅스 명령어와 동일하게 cat 으로 가지고 파일 내용을 열어본 것입니다.
'2021-2학기 > 하둡' 카테고리의 다른 글
[파이썬] 맵리듀스 초급 wordcount application 작동 ] (0) | 2022.03.23 |
---|---|
WordCount MapReduce Application (0) | 2022.03.23 |
하둡 사용자 명령어 2 (0) | 2022.03.23 |
하둡 사용자 명령어 (0) | 2022.03.23 |
로컬데이터를 하둡시스템으로 이동 (0) | 2022.03.23 |