Indexing은 조회쿼리에 대한 연관문서를 빠르게 찾기위해 사용한다.


Inverted index

각 단어가 존재하는 문서번호를  저장하고 있는 인덱스
Inverted Index
WordDocuments
theDocument 1, Document 3, Document 4, Document 5, Document 7
cowDocument 2, Document 3, Document 4
saysDocument 5
mooDocument 7

검색하고자 하는 단어가 입력되었을때, 해당문서에 단어가 존재하는지 안하는지 만을 알수있다.


The forward index

문서에 존재하는 각 단어들을 저장하고 있는 인덱스
Forward Index
DocumentWords
Document 1the,cow,says,moo
Document 2the,cat,and,the,hat
Document 3the,dish,ran,away,with,the,spoon


'Hadoop ecosystem > MapReduce' 카테고리의 다른 글

DataFlow  (0) 2018.04.14
WordCount  (0) 2018.04.14
InputType  (0) 2018.04.14
MapReduce 3  (1) 2018.04.09
MapReduce프로그래밍을 위한 HL  (0) 2017.05.04

+ Recent posts