본문 바로가기

Data Science/NLP3

Week 1-3 NLG subtask _ Multi-Document Summarization, Text Generation Natural Language Generation(NLG) 주어진 정보를 기반으로 정보 축약, 보강, 재구성하는 분야입니다. 1. Multi-Document Summarization 관련 정보를 캡처하고 중복 정보를 필터링하여 짧은 텍스트 조각으로 문서 세트를 나타내는 프로세스입니다. 다중 문서 요약에 대한 두 가지 두드러진 접근 방식은 추출 및 추상 요약입니다. 추출 요약 시스템은 문서에서 두드러진 스니펫, 문장 또는 구절을 추출하는 것을 목표로 하는 반면, 추상 요약 시스템은 문서 내용을 간결하게 의역하는 것을 목표로 합니다. [평가지표] 고 수준의 NLP task 지표로 쓰이는 이유는 ROUGE score가 대체로 인간의 판단과 양의 상관관계를 보이기 때문입니다. ROUGE-N ROUGE-1 : u.. 2022. 5. 11.
Week 1-2 NLU subtask _ Text Classification, Topic Models Natural Language Understanding(NLU) 텍스트 분류, 자연어 추론 및 이야기 이해와 같은 다양한 작업을 포함하는 자연어 처리의 중요한 분야입니다. 자연어 이해로 지원되는 응용 프로그램은 질문 답변에서 자동 추론에 이르기까지 다양합니다. 1.Text Classification 문장이나 문서를 적절한 범주로 지정하는 작업입니다. 범주는 선택한 데이터 세트에 따라 다르며 주제 범위가 다양할 수 있습니다. 분류 문제에는 감정 분류, 뉴스 분류, 인용 의도 분류 등이 있습니다. 📌 DATA SET AG News (AG’s News Corpus) AG는 1백만 개 이상의 뉴스 기사 모음입니다. ComeToMyHead는 1년 이상의 활동 기간 동안 2000개 이상의 뉴스 소스에서 뉴스 기사를.. 2022. 5. 11.
Week 1-1 NLP subtask _ Sentiment Analysis, Language Modelling 수강목적 🔽 더보기 1. NLP 프로젝트의 필요성 + pytorch 사용방법 알고 싶음... 2. 논문 읽기 & 구현 방법 알고 싶음 혼자 하니까 확실히 능률이 떨어지는 느낌이라 신청했다. 더욱이 관심있던 NLP를 집중적으로 다룬다니. 논문 읽는 힘이 길러지길! 1. Sentiment Analysis Sentiment Analysis(감성분석)은 텍스트에 들어있는 정서적 상태를 식별, 추출하여 분석하는 연구를 말합니다. 텍스트에서 뉘앙스로 느껴지는 모호한 감성은 감성 분석을 어렵게 하는 원인 중 하나입니다. 이를 이용하여 리뷰 및 설문조사 응답, 온라인 소셜 미디어 등 마케팅과 고객 서비스 등에 이용하여 적용할 수 있습니다. 예를 들어 기업과 관련된 홍보물의 댓글을 판단하여 기업은 홍보 제품에 대한 여론.. 2022. 5. 9.