Sentiment Analysis(감정 분석)
감정 분석 (때로 의견 청취 또는 감정 AI 라고도 함)은 자연 언어 처리, 텍스트 분석 , 전산 언어학 및 생체 인식 을 사용하여 정서적 인 상태와 주관적인 정보를 체계적으로 식별, 추출, 정량화 및 연구합니다. 감정 분석은 리뷰, 설문 조사 응답, 온라인 및 소셜 미디어, 마케팅 에서 고객 서비스 , 임상 의학에 이르는 애플리케이션을 위한 의료 자료와 같은 고객 자료의 음성에 널리 적용됩니다.
일반적으로 정서 분석은 문서, 상호 작용 또는 사건에 대한 일부 주제 또는 전반적인 문맥 극성 또는 정서적 반응과 관련하여 연사, 작가 또는 기타 주제에 대한 태도를 결정하는 것을 목표로합니다. 태도는 판단이나 평가 ( 평가 이론 참조 ), 정서적 인 상태 (즉, 저자 또는 연사의 감정 상태) 또는 의도 된 감정적 의사 소통 일 수 있습니다.
방법 및 기능
정서 분석에 대한 기존의 접근 방식은 지식 기반 기법, 통계 기법 및 하이브리드 접근 방법의 세 가지 주요 범주로 분류 할 수 있습니다.
지식 기반 기술은 행복, 슬픔, 두려움, 지루함과 같은 모호하지 않은 영향 단어의 존재를 바탕으로 영향 카테고리 별로 텍스트를 분류합니다. 일부 지식 기반은 명백한 영향 단어를 나열 할뿐만 아니라 임의의 단어에 특정 감정에 대한 "친화력"을 부여합니다.
통계적 방법은 latent semantic analysis, 지원 벡터 머신, "단어 모음"및 Semantic Orientation - Pointwise 상호 정보와 같은 기계 학습의 요소를 활용합니다. 보다 정교한 방법은 정서 (즉, 정서적 인 상태를 유지하는 사람)와 표적 (즉, 감정을 느낀 주체)을 파악하려고 시도합니다. 문맥에서 의견을 조사하고 오해 된 단어의 문법적 관계가 사용되었습니다. 문법 의존 관계는 텍스트를 깊이 파싱하여 얻을 수 있습니다.
하이브리드는 기계 학습과 온톨로지 및 의미 네트워크와 같은 지식 표현의 요소를 활용하여 예를 들어 관련 정보를 명시 적으로 전달하지 않지만 암시 적으로 나타나는 개념 분석을 통해 미묘한 방식으로 표현되는 의미를 탐지합니다.
평가
정서 분석 시스템의 정확성은 원칙적으로 인간의 판단과 얼마나 잘 일치 하는지를 나타냅니다. 이것은 일반적으로 정밀도와 리콜로 측정됩니다. 그러나 연구에 따르면 인간 평가자는 일반적으로 시간의 79 %를 동의합니다.
따라서 정확도가 인상적이지 않더라도 70% 정확도의 프로그램이 인간과 거의 비슷하게 수행됩니다. 프로그램이 시간의 "맞은" 100% 인 경우에, 인간은 어떤 응답든지에 관하여 다량 의견이 맞지 않기 때문에, 시간의 대략 20%에 아직도 그것을 동의하지 않을 것입니다. 보다 정교한 조치가 적용될 수 있지만 정서 분석 시스템의 평가는 여전히 복잡한 문제입니다. 이진 판단보다는 규모를 반환하는 정서 분석 작업의 경우 상관 관계는 예측 값이 목표 값에 얼마나 가깝게 있는지를 고려하기 때문에 정밀도보다 더 나은 척도입니다.
참고 : https://en.wikipedia.org/wiki/Sentiment_analysis
'머신러닝' 카테고리의 다른 글
P value (0) | 2018.08.06 |
---|---|
N-gram (0) | 2017.05.04 |
의사결정트리 (1) (0) | 2017.05.01 |
데이터 마이닝 개요 (0) | 2017.04.30 |