Indexing은 조회쿼리에 대한 연관문서를 빠르게 찾기위해 사용한다.
Inverted index
각 단어가 존재하는 문서번호를 저장하고 있는 인덱스
Word | Documents |
---|---|
the | Document 1, Document 3, Document 4, Document 5, Document 7 |
cow | Document 2, Document 3, Document 4 |
says | Document 5 |
moo | Document 7 |
검색하고자 하는 단어가 입력되었을때, 해당문서에 단어가 존재하는지 안하는지 만을 알수있다.
The forward index
문서에 존재하는 각 단어들을 저장하고 있는 인덱스
Document | Words |
---|---|
Document 1 | the,cow,says,moo |
Document 2 | the,cat,and,the,hat |
Document 3 | the,dish,ran,away,with,the,spoon |
'Hadoop ecosystem > MapReduce' 카테고리의 다른 글
DataFlow (0) | 2018.04.14 |
---|---|
WordCount (0) | 2018.04.14 |
InputType (0) | 2018.04.14 |
MapReduce 3 (1) | 2018.04.09 |
MapReduce프로그래밍을 위한 HL (0) | 2017.05.04 |